כתבות עם התגית למידה חישובית

אני מקבל לא מעט פניות מחברי הקבוצה שמחפשים הכוונה לקורס או הכשרה פרונטליים כלשהם בתחום של Machine Learning. בעקבות ההתעניינות העולה וגוברת בתחום, צצו לא מעט יוזמות כאלה או אחרות המציעות ללמד אתכם את רזי המקצוע ואף להכין אתכם לשוק התעסוקה. לאחר לא מעט בקשות סיוע ועזרה, בעיקר בהודעות פרטיות או שיחות אחד על אחד, החלטתי לרכז כמה מהתובנות שאני משתף עם כל מי שבוחר להתייעץ איתי בנוגע לקורסים השונים הקיימים בשוק.

לפני שאנחנו צוללים פנימה אני אציין מספר נקודות חשובות מאוד שיש לקחת אותן בחשבון. הנקודה הראשונה היא שמדובר על דעתי האישית בלבד, אשר מבוססת על שיחות שקיימתי הן עם מעסיקים שונים והן עם חלק לא קטן מהגופים שעומדים מאחורי הקורסים הללו. הנקודה השנייה, ואולי החשובה ביותר, היא שאין קיצורי דרך. מרבית האנשים שעוסקים בתחום הגיעו אליו לאחר שלמדו תואר מתקדם השייך לעולם המדעיים המדויקים (עם עדיפות למדמ"ח). אם אתם מגיעים מעולם אחר לחלוטין תצטרכו לעשות לא מעט השלמות כדי להגיע למצב שבו אתם יכולים להתחיל לעסוק בתחום – אך גם לכך ראינו תקדימים. הסיבה שאני מדגיש את חסמי הכניסה היא כדי לפזר את שלל ההבטחות שחלק מבעלי הקורסים זורקים באוויר. השוק אומנם צמא לאנשים איכותיים, אך עדיין המעסיקים לא מוכנים להתפשר על הרמה של המועמדים השונים.

הנקודה השלישית היא כי מרבית המידע הרלוונטי זמין וקיים באינטרנט בצורה חופשית ונגישה לכל. בעבר פרסמתי רשימה של קורסים מקוונים שהומלצו על חברי הקהילה, אשר זמינים בחינם באופן מלא כולל הסילבוס, המצגות, תרגילי הבית ועוד. דוגמא אחת מצוינת לכך הוא הקורס של סטנפורד המככב מזה זמן רב בראש מצעד הקורסים בתחום ה-Deep Learning. לא לחינם בחרנו להעביר דווקא אותו בקורס ההתנדבותי שאנו מעבירים לקהילה. הקורס הנ"ל הוא דוגמא מצוינת לשפע המידע הזמין ברשת, כאשר מידי חודש מתפרסמים עוד ועוד קורסים פתוחים לקהל שמנגישים תחום כזה או אחר בעולם התוכן שלנו. אם קורסים אינם דרך הלמידה המועדפת עליכם, תשמחו לדעת שיש גם ספרים מומלצים בתחום שיכולים לסייע לכם להיכנס לתחום לצבור ידע תיאורטי ופרקטי. כל זאת ועדיין לא ציינו את הקורסים בתשלום באתרי הלמידה האונליין הגדולים בעולם שכולם כאחד מציעים שלל קורסים בתחום.

לסיכום, באם בכל זאת אתם מעוניינים בקורס פרונטליי, בין אם זה עבור המסגרת, התוכן בעברית, הלמידה בצוותא או אפילו החניכה האישית – ככל הנראה ישנם קורסים שיתאימו לכם. עכשיו נשאלת השאלה, כיצד לבחור את הקורס הנכון עבורכם. לשם כך סיכמתי מספר נקודות שיכולות לשפוך אור על התהליך עצמו ולסייע לכם לקבל את ההחלטה הנכונה ביותר עבור הקריירה שלכם.

1. מרצים וסילבוס

הדבר הראשון, ואולי הטריוויאלי ביותר, שיש לעשות כאשר בוחנים קורס הוא לבחון את סגל המרצים ואת הסילבוס הקיים באתר הקורס. בדקו ביסודיות מי מעביר את ההרצאות לאורך כל הקורס ומה הניסיון של המרצים השונים. אתם תרצו כאלה שידעו להעניק לכם את הידע התאורטי והאקדמי על מנת לצבור בסיס חזק – בסיס שיש לו חשיבות רבה אצל לא מעט מהמעסיקים. לצד הנחה זו, תרצו גם אנשי תעשייה שיודעים לתרגם את כל מה שלמדתם לעולם האמיתי ואפילו להסביר לכם איך להעביר את המודל שהכנתם לפרודקשיין. חשוב שסגל המרצים ידע להביא מענה לשני האלמנטים החשובים הללו מאחר ולהם חשיבות רבה עבור מי שרוצה למצוא עבודה חדשה או לבצע שינוי קריירה משמעותי. לשמחתנו, בעידן האינטרנט, מאוד קל למצוא מידע אודות המרצים, ואף לבחון את היסטוריית התעסוקה/מחקר שלהם ובכך לנסות להבין האם יוכלו לספק לכם את הערך הנדרש. עוד טיפ קטן, חפשו גם כאלה שיש להם ניסיון בהוראה או כאלה שלימדו במוסדות לימוד שונים (לא בהכרח באקדמיה). זכרו, ידע בתחום לא מבטיח יכולת גבוהה בהעברת הידע.

לצד המרצים, העוגן הנוסף שיש לכם בעת בחינת הקורס הוא הסילבוס. מסמך זה אמור לאגד את כל הנושאים והטכנולוגיות אותם תלמדו במהלך הקורס ואולי אף יכלול התייחסות בנוגע לפרויקטי גמר או מטלות לאורך הקורס. חשוב לבחון את הסילבוס ולעבור עליו ביסודיות בכדי להבין האם הוא בכללותו יוכל לספק לכם את הידע הנדרש לעמידה ביעד שהצבתם לעצמם. מה לעשות אם אין לכם מושג מה כתוב בסילבוס ואם המונחים השונים נראים לכם כמו סינית?

לכתבה המלאה >>

לאחר הרבה הכנות והפקת לקחים מהקורס הקודם, גיל, ניר, ערן ואני שמחים להודיע כי אנחנו פותחים מחזור נוסף לקורס הdeep learning של הקהילה ומפרסמים לינק להרשמה לקראת המחזור הבא.

למי שלא מכיר: בשנה שעברה החלטנו ארבעת האדמינים בקבוצה לקחת את הקורס המוכר של סטנפורד "CS231n: Convolutional Neural Networks for Visual Recognition" ולהעביר אותו בצורה פורנטלית ובעברית באופן התנדבותי לחלוטין – וללא כל עלות למשתתפים. הקורס הועבר לקבוצה של 60 סטודנטים שהגיעו מידי שבוע במשך ארבעה חודשים לגוגל קמפוס כדי ללמוד על התחום. לאחר ארבעת החודשים הצמדנו לבוגרים שרצו מנטורים מהתעשייה לטובת פרויקט גמר שמציג את הידע הנרכש בקורס עצמו.

הקורס הקודם היה הצלחה. אלו שצלחו את הקורס עד סופו רכשו סט כלים חדש וידע שעזר לחלקם למצוא עבודות חדשות או לעשות שינוי קריירה בתוך הארגון בהם הם עובדים. השנה אנחנו מתכוונים להפוך את הקורס למקצועי עוד יותר וליישם את כל הלקחים שהפקנו מהמחזור הקודם. אנחנו נוסיף הדרכות על שירות הענן של גוגל, תרגולים סביב עבודות הבית וחיבור חזק יותר לתעשייה בפרויקטי הגמר. כפועל יוצא מכך זה אומר שרף הסינון עולה והרצינות שאנחנו מצפים מהמחזור החדש עולה גם היא.

כמו כן, קחו בחשבון שהקורס הוא מאוד Hands On ומתמטי לכן נדרשים גם ידע מתמטי ותכנותי ברמה גבוהה (אלגברה לינארית, חד"וא, הסתברות ופיתון). ידע זה קריטי להבנת הקורס ומטלות הבית השונות לכן אנא הירשמו רק אם יש לכם שליטה מספקת בנושאים הנ"ל.

אנחנו מציינים את הנהלים כבר עכשיו, לפני ההרשמה עצמה, כדי שתוכלו לעבור על כל התנאים ולהבין שהם מתאימים לכם. אנחנו לא מתכוונים לעגל פינות והמשמעת הנוקשה נועדה כדי שכל אחד שנבחר יפיק את המירב מהקורס ויצדיק את העובדה שדווקא הוא נבחר על פני מועמד אחר. בדיוק כמו בשנה הקודמת, גם הפעם אנחנו נקפיד על ייצוג שווה בין נשים וגברים בקורס, אך אין זה אומר שנקודה זו משפיעה על הסינון עצמו או על הרף הנדרש.

נהלים חשובים של הקורס:

לכתבה המלאה >>

DataHack הוא ארגון ללא מטרת רווח המארגן האקתון שנתי ומפגשי למידה בנושאי ביג דאטה, למידת מכונה, בינה מלאכותית ועוד. ההאקתון מתקיים בירושלים זאת השנה הרביעית ומקדם את האקוסיסטם הירושלמי הצומח, כל שנה מגיעים 400-500 משתתפים מכל רחבי הארץ לשלושה ימים אינטנסיבים של עבודה על פרוייקטים טכנולוגיים חדשניים ויצירתיים. מדובר באחד מהאירועים הטכנולוגיים הגדולים ביותר בעיר ובין ההאקתונים הגדולים ביותר בארץ.

האירוע הוא פסטיבל גדול של דאטה וטכנולוגיה, מחבר בין דיסצפלינות שונות בינהם סטטיסטיקאים, מפתחים, מעצבים, מדעני נתונים וחוקרים. כל שנה נוצרים עשרות רבות של פרוייקטים, לדוגמא בשנים קודמות פיתחו הצוותים פתרונות בעלי ערך חברתי גדול (ואף זכו בפרס מיוחד עבור כך) כמו כלי אוטומטי שעוזר לאתר נוער בסיכון שנמצא במצוקה ברשת, מערכת שמנתחת וידיאו של תינוקות כדי לזהות שיתוק מוחין, מערכת ניווט להולכי רגל להפחתת סיכוני פשיעה, מערכת לחיזוי עיכובים בטיסות ועוד. מעבר לכך, חלק מהפרויקטים היו באווירה קלילהו והומוריסטית יותר, כמו כלי למציאת כלב שהכי דומה לאדם מסוים או מנוע המלצות לאוכל המתאים ביותר לנשנוש לצד סרט נבחר.

בעוד חודש, 3-5.10, ייערך האירוע בפעם הרביעית, בבית אליאנס בירושלים. דין לנגסם, שזכה שנה שעברה במסלול הראשי, בחר לחלוק מספר נקודות שלדעתו הביאו לו ולקבוצתו את הניצחון: לכתבה המלאה >>

תוספת 2018: תכנית עילית: הכירו את תוכנית ההכשרה בתחום ה-Data science של ITC.

 

מדריך זה נכתב על ידי ג'ף מוסקוביץ

לפני מספר ימים כתבתי פוסט בקבוצת הפייסבוק Machine & Deep Learning Israel שעסק במספר פרויקטים שעשיתי לאחרונה. בסוף הפוסט הצעתי, בדרך אגב, עזרה לכל מי שמעוניין לקבל המלצה על קורסים רלוונטיים או איך להתחיל להתמקצע בתחום ה-Machine learning. להפתעתי גיליתי שיש הרבה אנשים בקבוצה שמעוניינים במידע הזה אז במקום לדבר עם כולם בנפרד, אני מאגד את כל ההמלצות שלי במדריך הזה שלפניכם. לפני שאנחנו מתחילים, אני אבקש סליחה מראש על שגיאות הכתיב שלי – עברית היא לא שפת האם שלי.

הרקע שלי

נתחיל עם הבהרה קצרה על הרקע שלי, מאחר וקיבלתי הרבה שאלות בסגנון הזה:

״אבל ג׳ף, בטח יש לך דוקטורט בחילוק ארוך מתקדם או משהו ויש לי רק תואר שני בזה. איך אני אסתדר עם המתמטיקה??״

יש לי תואר ראשון בעיתונאות ועוד אחד בהיסטוריה. זהו.

״אבל זה נושא די טכני, אני עדיין יכול לעשות את הקורסים האלה אם יש לי רק תואר ראשון במדע מחשב??״

עוד פעם, יש לי תואר ראשון בעיתונאות ועוד אחד בהיסטוריה …

תירגעו. כן, זה אפשרי.

כמו שMark Twain אמר:

"Never let your schooling interfere with your education”

דרישות קדם

דרישות הקדם היחידות הן סביב כישורי המתמטיקה שלכם, אתם תצטרכו הבנה בסיסית (באמת בסיסית) בנושאים הבאים:

  1. אלגברה לינארית.
  2. חדו"א (חשבון דיפרנציאלי ואינטגרלי).
  3. הסתברות.

לכתבה המלאה >>

קהילת ה-Machine learning בארץ הולכת וגדלה מידי יום ובכל שבוע ישנם מספר אירועים העוסקים בתחום. בכדי לעשות סדר בכל האירועים פתחתי יומן משותף לחברי הקהילה בו הם יוכלו להתעדכן בנוגע לאירועים עתידיים הרלוונטיים אליהם. ניתן לצפות ביומן דרך התצוגה המקדימה באתר או לצרף את היומן לשאר היומנים שלכם (ממולץ). ניתן לצרף היומן על ידי לחיצה על כפתור ה- "+" שנמצא בתחתית היומן. כמו כן, היומן זמין גם בקישור הבא.

בהזדמנות זו אני אשמח לפנות לכל מארגני האירועים/כנסים/מיטאפים המעוניינים להוסיף את האירוע שלהם ולבקש מהם לשלוח לי הודעה כדי שאוכל להעניק להם הרשאות להוספת אירועים ליומן.

לפני קרוב לחודשיים פרסמתי כאן פוסט הקורא למומחים העוסקים במתן ייעוץ בנושאי Machine Learning להצטרף לרשימה שאני מארגן, המאגדת את מי שעוסק בתחום. מטרתה של הרשימה הייתה לאפשר חיבור טוב יותר בין חברות טכנולוגיה ובין יועצים חיצוניים ובכך לעזור לקהילה לגדול ולאפשר לעוד חברות להטמיע פתרונות מבוססי Machine Learning במוצריהם.

נכון לכתיבת שורות אלה, ישנם קרוב ל-30 מומחים וחברות ייעוץ אשר הצטרפו לרשימה. חברי הרשימה עוסקים במגוון רחב של תחומים: ראיה ממוחשבת, עיבוד שפה טבעית וכו'. מרבית המומחים פירטו בצורה נרחבת על הידע והניסיון שלהם וחלקם הגדול אף כלל רשימה של לקוחות קודמים עמם עבדו. בכדי ליצור אחוזי התאמה גבוהים יותר, ישנו גם חלק יעודי ללקוחות עתידיים עמם המומחים ירצו לעבוד ואופי החברות הרלוונטיות אליהם.

מחפשים משרה בתחום? היכנסו ללוח המשרות שלנו.

בעקבות בקשות רבות מחברי הקהילה ואלו שמחוצה לה, אני פותח את הרשימה לקהל הרחב ומאפשר לכל אחד לפנות לאותם מומחים, ולצד זאת להוסיף את עצמו לרשימה כמומחה. במידה ואכן תמצאו מומחה העונה לדרישות שלכם, תוכלו לפנות אליו במספר אמצעי ההתקשרות הזמינים ברשימה (אימייל, אתר, לינקדאיין, טלפון ועוד). במידה ואתם מומחים בעצמכם, אתם מוזמנים למלא את כל הפרטים ולהוסיף את שמכם למאגר. ככל שתמלאו את הפרטים בצורה מלאה יותר כך יגדל הסיכוי שחברות אכן יפנו אליכם לכתבה המלאה >>

עריכה: הרשימה זמינה לקהל הרחב בפוסט הבא. אין צורך לפנות יותר לבוט אלא ניתן פשוט לגשת לרשימה ולבחור את המומחים הרלוונטים.

בתור מייסד קהילת ה-Machine learning בארץ הרבה חברות/אנשים פונים אלי כדי לקבל המלצה על יועצים או חברות המעניקים פתרונות ושירותים בתחום הלמידה החישובית. עד כה הייתי מחבר בין אותם הגורמים לחברי הקהילה השונים שידעתי שעוסקים בתחום וכך שני הצדדים היו מרוויחים. עכשיו אני רוצה לעשות את התהליך כולו למסודר יותר ובכך לעזור לחברי הקהילה ולחברות השונות שמחפשות מומחים בנושא.

בכדי להפוך את התהליך כולו ליעיל יותר, יצרתי עמוד הרשמה מיוחד שבו יועצים או חברות המספקים שירותי ייעוץ בתחום ה-ML יכולים למלא את פרטיהם ולהצטרף לרשימה מיוחדת של מומחים בתחום. כעת, לאחר פחות משבוע, הרשימה מונה 22 מומחים המגיעים ממגוון רחב של תחומי פעילות (NLP, ראייה ממוחשבת ועוד). כל אותם מומחים מגיעים עם ניסיון עשיר ורזומה הכולל עבודה עם מספר רב של חברות טכנולוגיה. במידה ואתם רוצים להצטרף לרשימה, נא מלאו את טופס ההרשמה בקישור הבא. לכתבה המלאה >>

לפני מספר שבועות פרסמתי מאמר שמרכז את כל הקורסים המובילים בנושאי Machine learning ו-Deep learning שהתבסס על המלצות חברי הקהילה הישראלית. בעקבות ההצלחה של המאמר הקודם, החלטתי לרכז את כל הספרים הממולצים ביותר בתחום ולאגד אותם לכדי רשימה אחת מסודרת. חשוב להדגיש כי גם הפעם סדר הופעת הספרים נגזר באופן ישיר מהצבעות חברי הקהילה. עבור כל ספר אני מצרף קישור לרכישה באמזון ולצד זאת גרסה דיגיטלית לשימוש אישי.

1. Understanding Machine Learning: From Theory to Algorithms

הספר הראשון שזכה למרבית הקולות הוא Understanding Machine Learning: From Theory to Algorithms. הספר נכתב על ידי פרופסור שי שליו-שוורץ מהאוניברסיטה העברית בירושלים ופרופסור שי בן-דוד מאוניברסיטת ווטרלו שבקנדה. הספר יצא לאור בשנת 2014 על ידי אוניברסיטת קיימברידג' (Cambridge University Press). על פי תיאור הספר מטרתו היא להציג לקורא את תחום ה-Machine learning ואת האלגוריתמים הנפוצים בנושא. ניתן להתרשם מהתיאור המלא של הספר: לכתבה המלאה >>

את חברת EMC אין צורך באמת להציג. מדובר על אחת החברות הגדולות ביותר בעולם המתמחה באספקת מוצרים, שירותים ופתרונות בתחום אחסון וניהול מידע. החברה, שהייתה מחלוצות פארק ההייטק בבאר שבע, הקימה במרכז המחקר והפיתוח הדרומי שלה צוות Data Science as a Service העמל על מגוון רחב של פיתוחים. צוות זה מיישם טכניקות רבות בתחום ה-Machine learning ואף רותם אותן בכדי לפתח מוצרים מסקרנים במיוחד. קיימתי ראיון עם אושרי בן הרוש, Senior Manager ו-Data Scientist בחברת EMC, שהסביר לי על הצוות כולו ועל האתגרים עמם הם מתמודדים.

"הקבוצה שלנו נקראת Data Science as a Service וכשמה כן היא. אנחנו בעצם מספקים שירותי Data Science ליחידות עסקיות שונות ב-EMC וגם ללקוחות חיצוניים. הקבוצה הוקמה לפני 4.5 שנים כסטארטאפ פנימי בתוך EMC עצמה. הרעיון היה ש-EMC כארגון, הדומה לכל הארגונים האחרים, מתמודד עם בעיות שהן Data driven שכדאי לשם עליהן דגש ולנסות לתת להן מענה." הסביר בן הרוש. "לכן, החלטנו להקים צוות שיספק את השירותים האלה תחילה פנימה: כלומר הצוות יתחיל לפתור את הבעיות העסקיות של EMC תחת ההבנה שבעיות עסקיות של EMC יעניינו מאוד את הלקוחות של EMC. לאחר מכן נוכל לשלב את הפתרונות האלה במסגרת המוצרים שאנחנו יכולים להציע ללקוחות." לכתבה המלאה >>

אירוע המפתחים של גוגל, אשר התקיים בשבוע שעבר, חשף מגוון רחב של מוצרים וטכנולוגיות אותן עתידה גוגל להציע לקהל הרחב בעתיד הקרוב מאוד. מי שהקשיב לנאום הפתיחה של מנכ"ל גוגל, סונדאר פיצ'אי, בוודאי זוכר את מספר הפעמים הרב בו הוזכר תחום ה-Machine Learning ועד כמה הודגשה השפעתו על כמעט כל פיתוח שהוצג באותו הערב.

לקראת כנס Google Next שיתקיים מחר בתל אביב, קיימנו ראיון עם ניר חינסקי, מנהל פעילות הענן של גוגל באזור MEA, ששפך אור על החשיבות הרבה שמייחסת גוגל לתחום ה-Machine Learning.

לכתבה המלאה >>

X