The third MAFAT Challenge: WiFi Sensing (תחרות)

מוזמנים להשתתף בתחרות של יחידת המו״פ במפא"ת (MAFAT Challenge) – תחרות למידת מכונה שעוסקת ב- WiFi Sensing, חישה על בסיס אותות WiFi!
הפוסט פורסם לראשונה בקהילה שלנו על ידי ערן דהן ומובא כאן במסגרת שיתוף פעולה שלנו עם מפא"ת. כל מי שמעוניין, מוזמן להירשם ולהתחרות (הקישור להרשמה בסוף הפוסט).
פרטים על התחרות
זו התחרות השלישית בסדרה של תחרויות שמפא"ת עורכת בסיועה של חברת ווביקס – במטרה ליצור חיבורים לא טריוויאליים בין האתגרים הטכנולוגיים-מבצעיים שמעניינים את מפא"ת לבין קהילת הדאטה-סיינס והחוקרים בארץ ובעולם. התחרויות הקודמות עסקו בניתוח של צילומי אוויר ובקלסיפיקציה של מידע מכ"מי.
התחרות פתוחה לכולם. מי שירשם לתחרות יקבל גישה לדאטה-סט ייחודי שאספנו ותייגנו – דאטה-סט שכולל סדרות זמן של RSSI – עוצמת האות המתקבלת על ידי המקלט ברשת WiFi שנוצרת בין מכשירי קצה שממוקמים במיקומים שונים בתוך ומחוץ לחדר לבין נתב שנמצא בתוך החדר – במצבים שונים של נוכחות אנשים בחדר.
האתגר בתחרות הוא להצליח לחזות, על בסיס ה- RSSI בלבד, האם וכמה אנשים יש בחדר בו נמצא הנתב.
התחרות מורכבת משני טראקים שונים – טראק תפיסות (קלסיפיקציה בינארית, האם יש או אין אנשים בחדר) וטראק ספירה (בעיית רגרסיה דיסקרטית, כמה אנשים יש בחדר). מותר להירשם לאחד מהטראקים או לשניהם.
משך התחרות – 3 חודשים.
סך הפרסים הכולל – 50 אלף דולר (15 לזוכה במקום הראשון ו- 10 לזוכה במקום השני, בכל אחד מהטראקים).
התחרות היא תחרות קוד (Code Submission) ומנוהלת, כמו התחרויות הקודמות, בפלטפורמת CodaLab.
למה זה חשוב?
זה חשוב כי היכולת לזהות, אוטומטית, האם יש או אין אנשים בחדר, ולהבין כמה אנשים יש בחדר, בדיוק גבוה, על בסיס חישת WiFi בלבד – היא יכולת משמעותית, לא פולשנית, שעושה שימוש בתשתית שכבר מותקנת הלכה למעשה בכל מקום (תשתית רשת אלחוטית), ויש לה פוטנציאל שימושים רב ומגוון. תחשבו, למשל, על כוחות חילוץ והצלה שמגיעים לאיזור אסון, ונדרשים בזמן קצר למפות נוכחות אנשים בחללים שונים על מנת לנהל, לתעדף ולתאם את מאמצי החילוץ וההצלה. או, לחילופין, על הפוטנציאל שבהתאמת תהליכים צורכי אנרגיה (כגון תאורה ומיזוג אוויר) בבניין חכם, מאוכלס בצפיפות, בהתאם לתפיסות בפועל של החללים השונים בבניין – מבלי לרשת את הבניין באמצעים אחרים שמפרים יותר את הפרטיות כגון מצלמות במסדרונות או בחדרים.
האם זה אפשרי?
בתיאוריה כן. רשתות WiFi פועלות בדרך-כלל בתדרים אופייניים של 2.4GHz – 5GHz – גלים בתדרים כאלו בפירוש מושפעים מנוכחותם ומתנועתם של אנשים בתווך – בשל החזרה (Reflection), בליעה (Absorption) או תופעות כגון Multipath. אם התווך שבין המשדר למקלט עמוס וצפוף באנשים – נצפה שעוצמת האות המתקבלת (RSSI) תהיה פחותה ביחס לערך שלה כאשר התווך ריק.
למה זו בעיה קשה?
זו בעיה קשה ממספר סיבות. העיקרית שבהן היא שיש עוד הרבה גורמים שונים, שאינם קשורים לנוכחות האנשים בחדר, שמשפיעים על ה- RSSI – למשל מאפיינים פנימיים של הנתב ושל מכשיר הקצה, הריהוט המפוזר בחדר, החומר ממנו עשויים הקירות ועוד.
בנוסף, סדרות הזמן של ערכי ה- RSSI בכל ערוץ הן סדרות דלילות – הרזולוציה הטמפורלית שלהן נמוכה יחסית (קריאת RSSI חדשה יכולה להתקבל פעם במספר שניות או אפילו פעם בעשרות שניות, כתלות במאפיינים שונים כגון התעבורה ומדיניות ניצול האנרגיה של מכשיר הקצה).
ולסיכום, המתאר שבו הדאטה נאסף הוא מתאר אמיתי ומגוון, לא סטרילי. מכשירי הקצה מגוונים (לפטופים, סמארטפונים, טאבלטים וכו'), החדרים עצמם שונים זה מזה, פעילות האנשים בחדר היא מגוונת וכוללת תנועה (אנשים הולכים) אבל גם משכים ארוכים של ישיבה יחסית סטטית.
מה תהיה הגישה המנצחת?
אנחנו לא יודעים. אפשר לחלק את הדאטה לחלונות זמנים, לחקור פיצ'רים על כל חלון זמנים ולאמן מסווגים או רגרסורים בסגנון Random Forest. אפשר לנסות לעבור ממימד הזמן למימד התדר עם התמרות קלאסיות כגון התמרת פוריה. אפשר לאמן ישירות מודלים מודרניים כגון טרנספורמרים או RNNs על סדרות הזמן. אפשר גם להביא לידי ביטוי ידע יחודי של משתתפים בתחרות בעולמות ה- RF, ה- WiFi ובעולם עיבוד האות – ולהשתמש בו כדי לעשות איזשהו פרה-פרוססינג חכם או אוגמנטציות מתוחכמות.
חלק מהמשתתפים בתחרות אולי ינסו לנצל את העובדה שבסט האימון מופיעות "פרספקטיבות" שונות של אותה התופעה – סדרות זמן של צמדים שונים של משדר-מקלט (נתב-מכשיר קצה) עם ערכי RSSI – כאשר הנתב נמצא במיקום סטטי אבל מכשירי הקצה במיקומים שונים – וכך לכייל או לפצות על תופעות שונות בצורה חכמה.
במודל הבייסליין הנאיבי שאימנו, ומפורסם למשתתפים בתחרות כמחברת קולאב, הגענו ל- ROC AUC של 0.759 (בבעיית הקלסיפיקציה) ול- MAE של 0.675 (בבעיית הרגרסיה) על סט המבחן הפומבי – יותר טוב מהטלת מטבע, אבל אם אנחנו צריכים לנחש, ננחש שזה רחוק מאוד מהביצועים של המודלים שיזכו בתחרות.
מי שרוצה להירשם – מוזמן!
כל המידע על התחרות נמצא כאן.
מיד אחרי ההרשמה תקבלו גישה לדאטה-סט ותוכלו להתחיל לאמן מודלים ולהגיש.
בהצלחה!