5 טיפים שיעזרו לכם לנצח ב-DataHack – האקתון הדאטה הגדול בישראל

מאת אורי אליאבייב, 7 בספטמבר 2018

DataHack הוא ארגון ללא מטרת רווח המארגן האקתון שנתי ומפגשי למידה בנושאי ביג דאטה, למידת מכונה, בינה מלאכותית ועוד. ההאקתון מתקיים בירושלים זאת השנה הרביעית ומקדם את האקוסיסטם הירושלמי הצומח, כל שנה מגיעים 400-500 משתתפים מכל רחבי הארץ לשלושה ימים אינטנסיבים של עבודה על פרוייקטים טכנולוגיים חדשניים ויצירתיים. מדובר באחד מהאירועים הטכנולוגיים הגדולים ביותר בעיר ובין ההאקתונים הגדולים ביותר בארץ.

האירוע הוא פסטיבל גדול של דאטה וטכנולוגיה, מחבר בין דיסצפלינות שונות בינהם סטטיסטיקאים, מפתחים, מעצבים, מדעני נתונים וחוקרים. כל שנה נוצרים עשרות רבות של פרוייקטים, לדוגמא בשנים קודמות פיתחו הצוותים פתרונות בעלי ערך חברתי גדול (ואף זכו בפרס מיוחד עבור כך) כמו כלי אוטומטי שעוזר לאתר נוער בסיכון שנמצא במצוקה ברשת, מערכת שמנתחת וידיאו של תינוקות כדי לזהות שיתוק מוחין, מערכת ניווט להולכי רגל להפחתת סיכוני פשיעה, מערכת לחיזוי עיכובים בטיסות ועוד. מעבר לכך, חלק מהפרויקטים היו באווירה קלילהו והומוריסטית יותר, כמו כלי למציאת כלב שהכי דומה לאדם מסוים או מנוע המלצות לאוכל המתאים ביותר לנשנוש לצד סרט נבחר.

בעוד חודש, 3-5.10, ייערך האירוע בפעם הרביעית, בבית אליאנס בירושלים. דין לנגסם, שזכה שנה שעברה במסלול הראשי, בחר לחלוק מספר נקודות שלדעתו הביאו לו ולקבוצתו את הניצחון:

שנה שעברה, הקבוצה שלי ואני זכינו בדאטההאק, עם בוט פייסבוק שמאמ;לק (מסכם, מלשון אמ;לק – ארוך מדי לא קראתי) כתבות מאתרי חדשות. לא נחשפתי לדפי הניקוד של השופטים, אבל הנה 5 סיבות שלדעתי עזרו לנו לנצח.

אמ;לק – אלגוריתם הלמידה שתבחרו הוא מאוד חשוב, אך הוא הוא לא הגורם מספר אחת לניצחון.

  1. אלגוריתם – זה נקרא דאטה-האק כי קודם כל אנחנו עוסקים בדאטה, ואלגוריתמים הם הלחם והחמאה שלנו. שנה שעברה הייתה, בדיעבד, השנה של NLP, ואם אני זוכר נכון, כל מי שהגיע לגמר עסק בעיבוד שפה טבעית. לנו היה אלגוריתם טוב, שעובד, אבל הוא לא היה חדשני או פורץ-דרך. אלגוריתם טוב הוא הבסיס שלכם כדי להגיע לגמר, אבל אל תבזבזו שעות ארוכות, כשאתם עייפים ב3 בבוקר, בשביל להשיג 0.1% שיפור ב Precision.
  2. רעיון – קחו את הזמן ותבחרו את הרעיון הנכון. אל תתפשרו על רעיון נחמד – תחשבו מה יהיה לכם ביד אחרי 2 לילות מעייפים של קידוד – זה הולך להיות משהו מגניב? זה הולך להיות משהו שאם תיקחו צעד אחורה ותסתכלו עליו יגרום לכם להגיד "ואוו, הדבר הזה אדיר"? ועם הרעיון זה בראש, הדבר הבא שיביא לכם את הניצחון הוא
  3. מוצר – אל תסתפקו ב-F1 Score מעולה, או באחוז Accuracy מרשים, זה לא מה שיביא לכם את הניצחון. אנחנו באנו לעשות כיף. את האלגוריתם שלנו עטפנו בבוט פייסבוק שמקבל לינק לכתבה ומחזיר את האמ;לוק שלה. קבוצות אחרות עטפו את האלגוריתמים שלהן בצורת אתרי ווב מגניבים או אפליקציות מובייל. אפילו אם בסוף לא תנצחו, זו הרגשה ממש טובה כשיש לכם את פרויקט ה-Data Science שלכם ארוז כמוצר אמיתי שעובד.
  4. הדאטה – הדאטה שלנו נלקח מעמוד הפייסבוק אמ;לק, כך שלמעשה היה לנו דאטה סט Supervised של כתבות והאמ;לוקים שלהן. הדאטה סט הזה הוא ייחודי, ולמעשה בזמן ההאקתון לאף אחד אחר בעולם לא היה אותו. זה לא שאי אפשר לעשות דברים יפים עם הדאטה סטים המפורסמים של האירוסים או של הטיטניק, אבל דאטה סט ייחודי יעשה את הדברים האלה הרבה יותר טובים.
  5. הייפ – המטרה הלא רשמית של הדאטה-האק היא לעשות כיף, ואם יהיה לכם כיף, אנשים ישימו לב. אנשים אוהבים להיות ליד אנשים שכיף איתם. אנחנו הגענו עם חולצה מיוחדת שעשינו לקבוצה, תלינו שלטים ברחבי המתחם שהובילו אנשים לחדר שעבדנו בו והזמנו אותם לדבר איתם, פיזרנו בלונים, עשינו צחוקים ואפילו חילקנו סטיקרים ללפטופ! ההייפ בוודאות לא נמצא על דפי הניקוד של השופטים, אבל אם תעשו את שלבים 1-4 בצורה מצוינת, ההייפ או מה שייתן לכם את האקסטרא לניצחון.

 

ההרשמה לדאטה-האק 2018 כבר נפתחה, ואם בא לכם על שלושה ימים של דאטה וכיף, אתם מוזמנים להרשם.

X