כתבות עם התגית machine learning

כמידי שבוע אני מאגד לכם את כל הפוסטים הדיונים החשובים שעלו בקבוצה. השבוע היו לא מעט דיונים מרתקים על מגוון רחב של נושאים שכדאי לכם לבדוק.  כפי שאתם בוודאי יודעים, הרשימה הזו נשלחת גם בניוזלטר שלנו כמידי שבוע (הירשמו כאן!). את הניוזלטר המלא ניתן למצוא כאן (השבוע: אירוע ראשון של קהילת הקוואנטום בישראל וכמה משרות חדשות מאוד מרתקות).

We had a great week with many good recommendations and informative links. Let's start:

1. Philip Tannor shared that his group won the first place at the MAFAT challenge! A several weeks ago I have told you about the new Kaggle style competition MAFAT is running and now I'm glad to tell you that an Israeli team has won the challenge. Don't miss his post.

לכתבה המלאה >>

השבוע, כמידי שבוע, אני מאגד במקום אחד את כל המידע החשוב שעלה בקבוצה ואת כל הפוסטים שקיבלו הכי הרבה חשיפה. כפי שאתם בוודאי יודעים, הרשימה הזו נשלחת גם בניוזלטר שלנו כמידי שבוע (הירשמו כאן!). את הניוזלטר המלא ניתן למצוא כאן (לינק לכל האירועים בינואר וכל המשרות שנכנסו השבוע).

לכתבה המלאה >>

וואו, השבוע היה לנו המון פוסטים מעולים וחשובים בקבוצה. ספרתי בקלות יותר מ-15 פוסטים שכאלה ועשיתי את מרבית המאמצים כדי לארגן לכם את כולם במקום אחד מסודר. כפי שאתם בוודאי יודעים, הרשימה הזו נשלחת גם בניוזלטר שלנו כמידי שבוע (הירשמו כאן!). הניוזלטר המלא ניתן למצוא כאן.

Group's Highlights from last week

1. Noam Cohen from the Technion shared with us a wonderful blog post about "A Signal Processing Perspective For Graph Structured Information ". It got many upvoted so don't miss it.

2. Iyar Lin needed to settle an argument with a coworker so he created an interesting poll at the group which got many votes. If that's not enough he just published a test he maid to check some insights he got from the group.

3. Gidi Shperber shared the second part of this blog post "A different kind of (deep) learning: part 2". We all loved the first one so be sure to check this one also.

4. The one and only, Jonathan Laserson, shared with us a blog post he wrote about this work at Zebra medical. If you need to read only one post make it this one.

לכתבה המלאה >>

אני מקבל לא מעט פניות מחברי הקבוצה שמחפשים הכוונה לקורס או הכשרה פרונטליים כלשהם בתחום של Machine Learning. בעקבות ההתעניינות העולה וגוברת בתחום, צצו לא מעט יוזמות כאלה או אחרות המציעות ללמד אתכם את רזי המקצוע ואף להכין אתכם לשוק התעסוקה. לאחר לא מעט בקשות סיוע ועזרה, בעיקר בהודעות פרטיות או שיחות אחד על אחד, החלטתי לרכז כמה מהתובנות שאני משתף עם כל מי שבוחר להתייעץ איתי בנוגע לקורסים השונים הקיימים בשוק.

לפני שאנחנו צוללים פנימה אני אציין מספר נקודות חשובות מאוד שיש לקחת אותן בחשבון. הנקודה הראשונה היא שמדובר על דעתי האישית בלבד, אשר מבוססת על שיחות שקיימתי הן עם מעסיקים שונים והן עם חלק לא קטן מהגופים שעומדים מאחורי הקורסים הללו. הנקודה השנייה, ואולי החשובה ביותר, היא שאין קיצורי דרך. מרבית האנשים שעוסקים בתחום הגיעו אליו לאחר שלמדו תואר מתקדם השייך לעולם המדעיים המדויקים (עם עדיפות למדמ"ח). אם אתם מגיעים מעולם אחר לחלוטין תצטרכו לעשות לא מעט השלמות כדי להגיע למצב שבו אתם יכולים להתחיל לעסוק בתחום – אך גם לכך ראינו תקדימים. הסיבה שאני מדגיש את חסמי הכניסה היא כדי לפזר את שלל ההבטחות שחלק מבעלי הקורסים זורקים באוויר. השוק אומנם צמא לאנשים איכותיים, אך עדיין המעסיקים לא מוכנים להתפשר על הרמה של המועמדים השונים.

הנקודה השלישית היא כי מרבית המידע הרלוונטי זמין וקיים באינטרנט בצורה חופשית ונגישה לכל. בעבר פרסמתי רשימה של קורסים מקוונים שהומלצו על חברי הקהילה, אשר זמינים בחינם באופן מלא כולל הסילבוס, המצגות, תרגילי הבית ועוד. דוגמא אחת מצוינת לכך הוא הקורס של סטנפורד המככב מזה זמן רב בראש מצעד הקורסים בתחום ה-Deep Learning. לא לחינם בחרנו להעביר דווקא אותו בקורס ההתנדבותי שאנו מעבירים לקהילה. הקורס הנ"ל הוא דוגמא מצוינת לשפע המידע הזמין ברשת, כאשר מידי חודש מתפרסמים עוד ועוד קורסים פתוחים לקהל שמנגישים תחום כזה או אחר בעולם התוכן שלנו. אם קורסים אינם דרך הלמידה המועדפת עליכם, תשמחו לדעת שיש גם ספרים מומלצים בתחום שיכולים לסייע לכם להיכנס לתחום לצבור ידע תיאורטי ופרקטי. כל זאת ועדיין לא ציינו את הקורסים בתשלום באתרי הלמידה האונליין הגדולים בעולם שכולם כאחד מציעים שלל קורסים בתחום.

לסיכום, באם בכל זאת אתם מעוניינים בקורס פרונטליי, בין אם זה עבור המסגרת, התוכן בעברית, הלמידה בצוותא או אפילו החניכה האישית – ככל הנראה ישנם קורסים שיתאימו לכם. עכשיו נשאלת השאלה, כיצד לבחור את הקורס הנכון עבורכם. לשם כך סיכמתי מספר נקודות שיכולות לשפוך אור על התהליך עצמו ולסייע לכם לקבל את ההחלטה הנכונה ביותר עבור הקריירה שלכם.

1. מרצים וסילבוס

הדבר הראשון, ואולי הטריוויאלי ביותר, שיש לעשות כאשר בוחנים קורס הוא לבחון את סגל המרצים ואת הסילבוס הקיים באתר הקורס. בדקו ביסודיות מי מעביר את ההרצאות לאורך כל הקורס ומה הניסיון של המרצים השונים. אתם תרצו כאלה שידעו להעניק לכם את הידע התאורטי והאקדמי על מנת לצבור בסיס חזק – בסיס שיש לו חשיבות רבה אצל לא מעט מהמעסיקים. לצד הנחה זו, תרצו גם אנשי תעשייה שיודעים לתרגם את כל מה שלמדתם לעולם האמיתי ואפילו להסביר לכם איך להעביר את המודל שהכנתם לפרודקשיין. חשוב שסגל המרצים ידע להביא מענה לשני האלמנטים החשובים הללו מאחר ולהם חשיבות רבה עבור מי שרוצה למצוא עבודה חדשה או לבצע שינוי קריירה משמעותי. לשמחתנו, בעידן האינטרנט, מאוד קל למצוא מידע אודות המרצים, ואף לבחון את היסטוריית התעסוקה/מחקר שלהם ובכך לנסות להבין האם יוכלו לספק לכם את הערך הנדרש. עוד טיפ קטן, חפשו גם כאלה שיש להם ניסיון בהוראה או כאלה שלימדו במוסדות לימוד שונים (לא בהכרח באקדמיה). זכרו, ידע בתחום לא מבטיח יכולת גבוהה בהעברת הידע.

לצד המרצים, העוגן הנוסף שיש לכם בעת בחינת הקורס הוא הסילבוס. מסמך זה אמור לאגד את כל הנושאים והטכנולוגיות אותם תלמדו במהלך הקורס ואולי אף יכלול התייחסות בנוגע לפרויקטי גמר או מטלות לאורך הקורס. חשוב לבחון את הסילבוס ולעבור עליו ביסודיות בכדי להבין האם הוא בכללותו יוכל לספק לכם את הידע הנדרש לעמידה ביעד שהצבתם לעצמם. מה לעשות אם אין לכם מושג מה כתוב בסילבוס ואם המונחים השונים נראים לכם כמו סינית?

לכתבה המלאה >>

קוראי הניוזלטר האדוקים, בוודאי יודעים שאני מסכם מידי שבוע את כל הפוסטים החשובים ביותר שעלו בקבוצת פייסבוק של הקהילה. כל שבוע אני סורק את הקבוצה ומחפש אחר הדיונים המרתקים ביותר שהתקיימו ומרכז את כולם במקום אחד כדי שאתם תוכלו לוודא שלא פספסתם אף נושא חשוב שעלה באותו השבוע. לאחרונה קבלתי הרבה בקשות להעביר את הפורמט של הסיכום השבועי למקום שיהיה יותר קל לשתף אותו ולשלוח לחברים. לכן, אני אתחיל לכתוב גם כאן בבלוג את הסיכום השבועי. חשוב לי להדגיש שבכל מקרה אשלח את הסיכום השבועי כלינק מסודר בניוזלטר, ככה שלא הרבה הולך להשתנות.

דרך אגב, אם אתם רוצים לוודא שאתם לא מפספסים את הסיכום השבועי, פשוט תירשמו לניוזלטר וככה תוכלו להישאר מעודכנים תמיד. כל שישי בבוקר יחכה לכם בתיבת המייל ניוזלטר חדש עם מידע שחשוב שתכירו. עוד סיבה ממש טובה להירשם לניוזלטר היא שאני מעדכן שם מידי פעם על כל מיני יוזמות ושיתופי פעולה שאני עובד עליהם הרבה לפני שהם עולים לקבוצה (ככה אני יכול לבדוק את התגובות לפני 🙂 ). בקיצור אל תפספסו.

עוד הערה קטנה, הסיכום השבועי ימשיך להיות באנגלית כי ככה יותר קל לכתוב אותו בצורה רציפה ללא ערבוב של האנגלית והעברית. נתחיל?

לכתבה המלאה >>

אנחנו עוסקים לא מעט בקהילה בדרכים בהן ניתן לצרף אנשים נוספים לתחום ולהנגיש, ככל שניתן, את הידע הנדרש כדי להשיג את העבודה הראשונה כ-Data scientist. רבים מכם יודעים כי לא מדובר על משימה קלה במיוחד, השילוב של חוסר הכרה של העולם התוכן לעומקו ומגוון ההכשרות הרחב שיש בשוק, מקשה על בוגרי תארים מתקדמים, או אפילו מפתחים בעלי ניסיון, לעשות את המעבר ולהשיג את דריסת הרגל הנדרשת.

אני מקדיש לנושא זה תשומת לב רבה ולעיתים עולות יוזמות חדשות בקהילה אשר מנסות להעניק מענה הולם לבעיה הזו. כדי להעצים את העשייה שלי בתחום ובשאיפה לעזור לכמה שיותר אנשים, אני כעת חובר לארגון  בשם Israel Tech Challenge, ארגון ללא מטרות רווח, אשר מציע תכנית הכשרה מקיפה ומלאה בתחום ה-Data science. כחלק משיתוף הפעולה שלי עם ITC אני מסייע להם באיתור מועמדים רלוונטיים שיכולים לקחת חלק בתכנית האקסלוסיבית שהם בונים.

קצת פרטים על התכנית עצמה: ההכשרה מתבצעת בתחום ה-Computer Vision (ראייה ממוחשבת) וה-NLP (עיבוד שפה טבעית), כאשר לב ליבה של התכנית היא שימוש בטכניקות מעולם ה-Deep Learning לביצוע משימות בתחום זה. התכנית היא חלק ממסלול ה-Data Science של תכנית ה-Fellows. התכנית הנ"ל מיועדת לבוגרי Bs.c מצטיינים מאוניברסיטאות מובילות בארץ ובעולם, בדגש על בוגרי תארים במדעי המחשב, הנדסה, מתמטיקה, פיסיקה, כימיה וביולוגיה שלהם ידע בתכנות. ההכשרה כולה בנויה משלושה חלקים עיקריים: החלק הראשון, אשר אורך ארבעה חודשים, עוסק בלימוד עצמו ומקנה לסטודנטים את כל הכלים להתמודדות עם בעיות שונות בתחום ה-Data science. בחלק זה מגיעים מרצים אורחים משלל חברות מובילות במשק אשר משתפים מינסיונם בעבודה היומיומית שלהם, וזאת במטרה לחשוף את הסטודנטים לבעיות אמתיות שעולות כחלק מתהליך העבודה. החלק השני כולל חמישה שבועות של התמחות קצרה אצל אחת מהחברות הפועלות עם ITC בהן הסטונדטים עובדים על בעיות מוגדרות עם ליווי של אנשי החברה.

החלק השלישי, אשר אורך חמישה חודשים, הוא התמחות בשכר אצל חברות מובילות בתפקידי פיתוח ומחקר במגוון רחב של חברות אשר פעולות בשיתוף פעולה עם ITC. השכר הממוצע לחודש בזמן ההתמחות הוא 20 אלף שקל לחודש, כאשר בסופו של שלב זה מרבית הסטודנטים כבר מקבלים הצעות מהחברות עצמן למשרות לטווח הארוך. לקורס יש שני מחזורים בשנה, הראשון מתקיים בחודש באפריל ובעוד השני שמתחיל בחודש אוקטובר (בעוד חודשיים). העלות של התכנית כולה היא היא 30,000 שקלים.

הסבר על התכנית

על מנת ללמוד על תכנית ההכשרה לעומק, קיימתי ראיון מקיף עם לואיס וולך, Data Science Lead ב-ITC ובר וינוגרד, יועץ בתחום ה-Data Science ואחד מסגל המורים בקורס. לאויס ובר אמונים על הפיתוח המקצועי של תכנית ההכשרה ושניהם מגיעים עם ניסיון רב בתחום וידע פרקטי בעולמות ה-Data Science. לאורך הראיון נצלול פנימה ונכיר את אבני הבניין השונות של תכנית זו ונבין כיצד היא יכולה לסייע לאלה אשר רוצים לעשות את שינוי הקריירה המיוחל לכתבה המלאה >>

לאחר הרבה הכנות והפקת לקחים מהקורס הקודם, גיל, ניר, ערן ואני שמחים להודיע כי אנחנו פותחים מחזור נוסף לקורס הdeep learning של הקהילה ומפרסמים לינק להרשמה לקראת המחזור הבא.

למי שלא מכיר: בשנה שעברה החלטנו ארבעת האדמינים בקבוצה לקחת את הקורס המוכר של סטנפורד "CS231n: Convolutional Neural Networks for Visual Recognition" ולהעביר אותו בצורה פורנטלית ובעברית באופן התנדבותי לחלוטין – וללא כל עלות למשתתפים. הקורס הועבר לקבוצה של 60 סטודנטים שהגיעו מידי שבוע במשך ארבעה חודשים לגוגל קמפוס כדי ללמוד על התחום. לאחר ארבעת החודשים הצמדנו לבוגרים שרצו מנטורים מהתעשייה לטובת פרויקט גמר שמציג את הידע הנרכש בקורס עצמו.

הקורס הקודם היה הצלחה. אלו שצלחו את הקורס עד סופו רכשו סט כלים חדש וידע שעזר לחלקם למצוא עבודות חדשות או לעשות שינוי קריירה בתוך הארגון בהם הם עובדים. השנה אנחנו מתכוונים להפוך את הקורס למקצועי עוד יותר וליישם את כל הלקחים שהפקנו מהמחזור הקודם. אנחנו נוסיף הדרכות על שירות הענן של גוגל, תרגולים סביב עבודות הבית וחיבור חזק יותר לתעשייה בפרויקטי הגמר. כפועל יוצא מכך זה אומר שרף הסינון עולה והרצינות שאנחנו מצפים מהמחזור החדש עולה גם היא.

כמו כן, קחו בחשבון שהקורס הוא מאוד Hands On ומתמטי לכן נדרשים גם ידע מתמטי ותכנותי ברמה גבוהה (אלגברה לינארית, חד"וא, הסתברות ופיתון). ידע זה קריטי להבנת הקורס ומטלות הבית השונות לכן אנא הירשמו רק אם יש לכם שליטה מספקת בנושאים הנ"ל.

אנחנו מציינים את הנהלים כבר עכשיו, לפני ההרשמה עצמה, כדי שתוכלו לעבור על כל התנאים ולהבין שהם מתאימים לכם. אנחנו לא מתכוונים לעגל פינות והמשמעת הנוקשה נועדה כדי שכל אחד שנבחר יפיק את המירב מהקורס ויצדיק את העובדה שדווקא הוא נבחר על פני מועמד אחר. בדיוק כמו בשנה הקודמת, גם הפעם אנחנו נקפיד על ייצוג שווה בין נשים וגברים בקורס, אך אין זה אומר שנקודה זו משפיעה על הסינון עצמו או על הרף הנדרש.

נהלים חשובים של הקורס:

לכתבה המלאה >>

DataHack הוא ארגון ללא מטרת רווח המארגן האקתון שנתי ומפגשי למידה בנושאי ביג דאטה, למידת מכונה, בינה מלאכותית ועוד. ההאקתון מתקיים בירושלים זאת השנה הרביעית ומקדם את האקוסיסטם הירושלמי הצומח, כל שנה מגיעים 400-500 משתתפים מכל רחבי הארץ לשלושה ימים אינטנסיבים של עבודה על פרוייקטים טכנולוגיים חדשניים ויצירתיים. מדובר באחד מהאירועים הטכנולוגיים הגדולים ביותר בעיר ובין ההאקתונים הגדולים ביותר בארץ.

האירוע הוא פסטיבל גדול של דאטה וטכנולוגיה, מחבר בין דיסצפלינות שונות בינהם סטטיסטיקאים, מפתחים, מעצבים, מדעני נתונים וחוקרים. כל שנה נוצרים עשרות רבות של פרוייקטים, לדוגמא בשנים קודמות פיתחו הצוותים פתרונות בעלי ערך חברתי גדול (ואף זכו בפרס מיוחד עבור כך) כמו כלי אוטומטי שעוזר לאתר נוער בסיכון שנמצא במצוקה ברשת, מערכת שמנתחת וידיאו של תינוקות כדי לזהות שיתוק מוחין, מערכת ניווט להולכי רגל להפחתת סיכוני פשיעה, מערכת לחיזוי עיכובים בטיסות ועוד. מעבר לכך, חלק מהפרויקטים היו באווירה קלילהו והומוריסטית יותר, כמו כלי למציאת כלב שהכי דומה לאדם מסוים או מנוע המלצות לאוכל המתאים ביותר לנשנוש לצד סרט נבחר.

בעוד חודש, 3-5.10, ייערך האירוע בפעם הרביעית, בבית אליאנס בירושלים. דין לנגסם, שזכה שנה שעברה במסלול הראשי, בחר לחלוק מספר נקודות שלדעתו הביאו לו ולקבוצתו את הניצחון: לכתבה המלאה >>

לגייס Data scientists זו לא משימה קלה. העלייה המשמעותית במספר החברות שנכנסות לעולם ה-Machine Learning לצד כמות הסטארטפים שפועלים בתחום הגבירו את הביקוש ל-Data scientists, מה שיוצר קשיי גיוס רבים ללא מעט חברות. יש לציין, לפני שאנחנו צוללים פנימה, כי גם חברות גדולות ותאגידים גדולים מתקשים למצוא את האנשים המתאימים ולא מדובר על מכשול שקיים רק אצל חברות צעירות או גופים לא טכנולוגים.

בדיוק לשם כך, קיימתי לפני מספר שבועות אירוע מצומצם בו חלקתי חלק מהתובנות שיש לי בנושא, המתבססות על סקר הקהילה שעשינו ולוח המשרות העשיר שמנוהל באתר זה. נתונים אלה, בשילוב לאינספור שיחות שקיימתי עם עובדים בתחום וחברות שונות המגייסות, סייעו לי לגבש מספר מסקנות וטיפים שיוכלו לעזור לכל מי שרוצה לגייס Data scientist. בנוסף להרצאה שלי, לקח חלק באירוע גם Alfie Booker המשמש כמגייס טכני ב- Google UK בחמש השנים האחרונות. אלפי עסק בעיקר בתהליך הגיוס בגוגל וכיצד ניתן לבנות אותו בצורה חכמה מול המועמדים השונים.

עיקר החלק שלי מבוסס על המצגת שהעברתי במפגש עצמו והיא מצורפת כאן לשימושכם:

לכתבה המלאה >>

פעמים רבות עולות שאלות בקהילה אודות חוקרים שונים באקדמיה העוסקים ב-Machine learning ו-Deep learning. בכדי לעשות סדר בנושא ולעזור לחברי הקהילה לקבל תמונת מצד מדויקת של כל העוסקים במלאכה באקדמיה, החלטתי ליצור רשימה מסודרת ומאוחדת שתרכז את כל החוקרים בתחום. הרשימה כוללת מספר רב של חוקרים בתחום מכל מוסדות הלימוד בארץ כאשר הם מחולקים לתחומי הפעילות שלהם (ראייה ממחושבת, עיבוד שפה טבעית וכו'). בנוסף לכך, לצד כל חוקר יש מידע נוסף אודות תחומי הפעילות העיקריים שלו, קישור לאתר האישי ועוד. השאיפה היא לשמור על הרשימה עדכנית ככל שניתן ומידי פעם אעבור עליה ואעדכן את הפרטים הרלוונטיים לכל חוקר וחוקר לכתבה המלאה >>

X