כתבות עם התגית Yam Peleg

אמנם, האתגר לא באמת נגמר כמו שצריך בגלל הוירוס. אבל עבדתי די קשה, אני מרשה לעצמי לסכם בכל מקרה!

לפני שבועיים Uri Goren פרסם את אתגר מערכות ההמלצה של jul.
אני מתעסק במערכות המלצה בתור (חצי) תחביב כבר כמעט שנה והרבה זמן חיפשתי תירוץ לצלול לעומק העניין.
אז למארגנים: תודה על הFOMO, אחלה תירוץ!

הבעיה: אנשים קנו מוצרים. אנחנו צריכים לאמר איזה מוצר הם יקנו בפעם הבאה.
הדאטה: טרנזקציות – אדם x קנה מוצר y בתאריך z.
ניקוד: אם קלענו למוצר אחד מתוך רשימת המוצרים העתידיים, האדם נספר לנו לחישוב הדיוק הסופי, שהוא לא יותר מאחוז האנשים בהם צדקנו.
עוד פרט חשוב: מספיק לנו לקלוע למוצר אחד. (ובדקתי את הפרט הזה דרך ההגשות ללידרבורד!)
ועוד פרט חשוב: אנחנו לא יודעים מה המוצרים! יש לנו רק id. זה חכם מצד המארגנים, היתי מנצל את זה לרעה אם זה לא היה ככה.

התחלתי לירות בייסליינים כבר בעשר הדקות הראשונות מפתיחת הטבלה.

הבייסליין הראשון כמובן: "תציע לכולם את המוצר הכי נפוץ".
השני היה: "תציע לכולם את המוצר הכי KNN.predict"

אחרי שניקיתי קצת, העפתי את העברית (כי זה דפק כל דבר אפשרי), העפתי את כל האנשים שאני יודע עליהם רק קניה אחת והגשתי את הבייסליין "תציע לכל אדם פשוט מה שהוא קנה ממנו הכי הרבה" ואת הבייסליין "תציע לכל אדם מה שכולם קונים הכי הרבה" והבייסליין "תציע לכל אדם מה שקונים ממנו הכי הרבה באותו החודש"
והכי חשוב,הרצתי את הבייסליין:

for cols_combination in כל_הקומבינציות(cols):
תציע לאותו אדם: df.groupby(cols_combination).agg(lambda x: x.value_counts().index[0])

שבאופן ממש מביך הביא אותי למקום הראשון בטבלה..
חצי שעה מפתיחת התחרות..

ואז התחלתי לעבוד באמת. לכתבה המלאה >>

בשבוע שעבר התחלתי ניסוי קטן שבו אני מפרסם גם כאן בבלוג את כל הפוסטים החשובים שעלו בקבוצה בשבוע החולף (לצד הפרסום בניוזלטר). בשבוע שעבר קבלתי פידבקים מעולים לכן אני ממשיך עם כך גם השבוע. דרך אגב, אתם יכולים למצוא את הניוזלטר המלא בלינק הבא (יש בו מידע על המיטאפ שלו ועל כל המשרות החדשות שהתווספו ללוח משרות). אם אתם רוצים לקבל את הניוזלטר בצורה אוטומטית פשוט תירשמו כאן.

כפי שאתם יכולים לראות השבוע היה לנו שבוע מצוין עם לא מעט תוכן איכותי בקבוצה. מרבית הדיונים שנפתחו היו סביב עבודות ומאמרים חדשים שנכתבו לאחורנה והצליחו ליצור עניין רב בקרב חברי הקהילה. לשמחתי השבוע היו גם כמה מאמרים ופוסטים שנכתבו על ידי חברה הקבוצה עצמם מה שתמיד מצוין ויוצר דיונים מעולים.

Group's Highlights from last week

1. Imry Kissos from Amazon shared an interesting blog post from Google with the title "TF-Ranking: A Scalable TensorFlow Library for Learning-to-Rank". Imry also shared this great content: "Unsupervised Deep Learning – Google DeepMind & Facebook Artificial Intelligence NeurIPS 2018".

2. Amitai Armon from Intel shared with us an article they released at NeurIPS 2018. The article name is "Automated Testing of Graphics Units by Deep-Learning Detection of Visual Anomalies".

3. Yonatan Hadar from YellowRoad made us all feel much better with his new article: "Top Examples of Why Data Science is Not Just .fit().predict()".

4. Yam Peleg from Deep Trading open our eyes with this great article: "Auto-Keras: Efficient Neural Architecture Search with Network Morphism".

5. Rani Horev from Snip shared a new cool tool that he developed which will make your life easier next time you would find a new article.

6. Assaf Shocher from Weizmann Institute of Science shared an article he wrote with Shai Bagon, Phillip Isola, and Michal Irani. The article name is: "Internal Distribution Matching for Natural Image Retargeting". If you need to read only one post, make it this one.

7. Bonus: The one and only, Gal Yona from Cellebrite started a very important poll. Don't miss it.

X