כתבות עם התגית Natural Language Processing

אנחנו עוסקים לא מעט בקהילה בדרכים בהן ניתן לצרף אנשים נוספים לתחום ולהנגיש, ככל שניתן, את הידע הנדרש כדי להשיג את העבודה הראשונה כ-Data scientist. רבים מכם יודעים כי לא מדובר על משימה קלה במיוחד, השילוב של חוסר הכרה של העולם התוכן לעומקו ומגוון ההכשרות הרחב שיש בשוק, מקשה על בוגרי תארים מתקדמים, או אפילו מפתחים בעלי ניסיון, לעשות את המעבר ולהשיג את דריסת הרגל הנדרשת.

אני מקדיש לנושא זה תשומת לב רבה ולעיתים עולות יוזמות חדשות בקהילה אשר מנסות להעניק מענה הולם לבעיה הזו. כדי להעצים את העשייה שלי בתחום ובשאיפה לעזור לכמה שיותר אנשים, אני כעת חובר לארגון  בשם Israel Tech Challenge, ארגון ללא מטרות רווח, אשר מציע תכנית הכשרה מקיפה ומלאה בתחום ה-Data science. כחלק משיתוף הפעולה שלי עם ITC אני מסייע להם באיתור מועמדים רלוונטיים שיכולים לקחת חלק בתכנית האקסלוסיבית שהם בונים.

קצת פרטים על התכנית עצמה: ההכשרה מתבצעת בתחום ה-Computer Vision (ראייה ממוחשבת) וה-NLP (עיבוד שפה טבעית), כאשר לב ליבה של התכנית היא שימוש בטכניקות מעולם ה-Deep Learning לביצוע משימות בתחום זה. התכנית היא חלק ממסלול ה-Data Science של תכנית ה-Fellows. התכנית הנ"ל מיועדת לבוגרי Bs.c מצטיינים מאוניברסיטאות מובילות בארץ ובעולם, בדגש על בוגרי תארים במדעי המחשב, הנדסה, מתמטיקה, פיסיקה, כימיה וביולוגיה שלהם ידע בתכנות. ההכשרה כולה בנויה משלושה חלקים עיקריים: החלק הראשון, אשר אורך ארבעה חודשים, עוסק בלימוד עצמו ומקנה לסטודנטים את כל הכלים להתמודדות עם בעיות שונות בתחום ה-Data science. בחלק זה מגיעים מרצים אורחים משלל חברות מובילות במשק אשר משתפים מינסיונם בעבודה היומיומית שלהם, וזאת במטרה לחשוף את הסטודנטים לבעיות אמתיות שעולות כחלק מתהליך העבודה. החלק השני כולל חמישה שבועות של התמחות קצרה אצל אחת מהחברות הפועלות עם ITC בהן הסטונדטים עובדים על בעיות מוגדרות עם ליווי של אנשי החברה.

החלק השלישי, אשר אורך חמישה חודשים, הוא התמחות בשכר אצל חברות מובילות בתפקידי פיתוח ומחקר במגוון רחב של חברות אשר פעולות בשיתוף פעולה עם ITC. השכר הממוצע לחודש בזמן ההתמחות הוא 20 אלף שקל לחודש, כאשר בסופו של שלב זה מרבית הסטודנטים כבר מקבלים הצעות מהחברות עצמן למשרות לטווח הארוך. לקורס יש שני מחזורים בשנה, הראשון מתקיים בחודש באפריל ובעוד השני שמתחיל בחודש אוקטובר (בעוד חודשיים). העלות של התכנית כולה היא היא 30,000 שקלים.

הסבר על התכנית

על מנת ללמוד על תכנית ההכשרה לעומק, קיימתי ראיון מקיף עם לואיס וולך, Data Science Lead ב-ITC ובר וינוגרד, יועץ בתחום ה-Data Science ואחד מסגל המורים בקורס. לאויס ובר אמונים על הפיתוח המקצועי של תכנית ההכשרה ושניהם מגיעים עם ניסיון רב בתחום וידע פרקטי בעולמות ה-Data Science. לאורך הראיון נצלול פנימה ונכיר את אבני הבניין השונות של תכנית זו ונבין כיצד היא יכולה לסייע לאלה אשר רוצים לעשות את שינוי הקריירה המיוחל לכתבה המלאה >>

לגייס Data scientists זו לא משימה קלה. העלייה המשמעותית במספר החברות שנכנסות לעולם ה-Machine Learning לצד כמות הסטארטפים שפועלים בתחום הגבירו את הביקוש ל-Data scientists, מה שיוצר קשיי גיוס רבים ללא מעט חברות. יש לציין, לפני שאנחנו צוללים פנימה, כי גם חברות גדולות ותאגידים גדולים מתקשים למצוא את האנשים המתאימים ולא מדובר על מכשול שקיים רק אצל חברות צעירות או גופים לא טכנולוגים.

בדיוק לשם כך, קיימתי לפני מספר שבועות אירוע מצומצם בו חלקתי חלק מהתובנות שיש לי בנושא, המתבססות על סקר הקהילה שעשינו ולוח המשרות העשיר שמנוהל באתר זה. נתונים אלה, בשילוב לאינספור שיחות שקיימתי עם עובדים בתחום וחברות שונות המגייסות, סייעו לי לגבש מספר מסקנות וטיפים שיוכלו לעזור לכל מי שרוצה לגייס Data scientist. בנוסף להרצאה שלי, לקח חלק באירוע גם Alfie Booker המשמש כמגייס טכני ב- Google UK בחמש השנים האחרונות. אלפי עסק בעיקר בתהליך הגיוס בגוגל וכיצד ניתן לבנות אותו בצורה חכמה מול המועמדים השונים.

עיקר החלק שלי מבוסס על המצגת שהעברתי במפגש עצמו והיא מצורפת כאן לשימושכם:

לכתבה המלאה >>

פעמים רבות עולות שאלות בקהילה אודות חוקרים שונים באקדמיה העוסקים ב-Machine learning ו-Deep learning. בכדי לעשות סדר בנושא ולעזור לחברי הקהילה לקבל תמונת מצד מדויקת של כל העוסקים במלאכה באקדמיה, החלטתי ליצור רשימה מסודרת ומאוחדת שתרכז את כל החוקרים בתחום. הרשימה כוללת מספר רב של חוקרים בתחום מכל מוסדות הלימוד בארץ כאשר הם מחולקים לתחומי הפעילות שלהם (ראייה ממחושבת, עיבוד שפה טבעית וכו'). בנוסף לכך, לצד כל חוקר יש מידע נוסף אודות תחומי הפעילות העיקריים שלו, קישור לאתר האישי ועוד. השאיפה היא לשמור על הרשימה עדכנית ככל שניתן ומידי פעם אעבור עליה ואעדכן את הפרטים הרלוונטיים לכל חוקר וחוקר לכתבה המלאה >>

תוספת 2018: תכנית עילית: הכירו את תוכנית ההכשרה בתחום ה-Data science של ITC.

 

מדריך זה נכתב על ידי ג'ף מוסקוביץ

לפני מספר ימים כתבתי פוסט בקבוצת הפייסבוק Machine & Deep Learning Israel שעסק במספר פרויקטים שעשיתי לאחרונה. בסוף הפוסט הצעתי, בדרך אגב, עזרה לכל מי שמעוניין לקבל המלצה על קורסים רלוונטיים או איך להתחיל להתמקצע בתחום ה-Machine learning. להפתעתי גיליתי שיש הרבה אנשים בקבוצה שמעוניינים במידע הזה אז במקום לדבר עם כולם בנפרד, אני מאגד את כל ההמלצות שלי במדריך הזה שלפניכם. לפני שאנחנו מתחילים, אני אבקש סליחה מראש על שגיאות הכתיב שלי – עברית היא לא שפת האם שלי.

הרקע שלי

נתחיל עם הבהרה קצרה על הרקע שלי, מאחר וקיבלתי הרבה שאלות בסגנון הזה:

״אבל ג׳ף, בטח יש לך דוקטורט בחילוק ארוך מתקדם או משהו ויש לי רק תואר שני בזה. איך אני אסתדר עם המתמטיקה??״

יש לי תואר ראשון בעיתונאות ועוד אחד בהיסטוריה. זהו.

״אבל זה נושא די טכני, אני עדיין יכול לעשות את הקורסים האלה אם יש לי רק תואר ראשון במדע מחשב??״

עוד פעם, יש לי תואר ראשון בעיתונאות ועוד אחד בהיסטוריה …

תירגעו. כן, זה אפשרי.

כמו שMark Twain אמר:

"Never let your schooling interfere with your education”

דרישות קדם

דרישות הקדם היחידות הן סביב כישורי המתמטיקה שלכם, אתם תצטרכו הבנה בסיסית (באמת בסיסית) בנושאים הבאים:

  1. אלגברה לינארית.
  2. חדו"א (חשבון דיפרנציאלי ואינטגרלי).
  3. הסתברות.

לכתבה המלאה >>

בתאריך ה-25.4 קיימנו את המפגש השני של Machine Learning Israel Seminar אשר עסק ב-NLP. המפגש הנוכחי, וכך גם שאר המפגשים בעתיד, בנוי משתי הרצאות: אחת מטעם חוקר מהאקדמיה והשנייה מטעם גורם מהתעשייה (סטארטאפ או חברה). כפי שהבטחתי אני מצרף כאן את המצגות של שני המרצים. בהזדמנות זו אני מציע לכם להירשם לניוזלטר של הקהילה ובכך לא לפספס את ההרשמה לאירוע הבא.

הרצאה ראשונה:

שם המרצה: Roee Aharoni
חברה: Bar Ilan University's NLP Lab
תפקיד: Phd Candidate at Bar Ilan University's NLP Lab
לצפייה במצגת לחצו כאן.

תיאור ההרצאה:

 

לכתבה המלאה >>

בתקופה האחרונה אנחנו עדים להתעניינות הולכת וגוברת בכל הקשור לתחום ה-Natural Language Processing (עיבוד שפה טבעית). פייסבוק השקיעה רבות במנוע עיבוד שפה בשם Deeptext לו היא מייעדת תפקידים אסטרטגים רבים כמעט בכל חטיבה בחברה, גוגל פתחה לקהל הרחב את Cloud Natural Language API ו-Cloud Speech API המעניקים את יכולות ה-NLP למפתחים באשר הם ואמזון משפרת את היכולות של Amazon Echo והופכת את אלכסה, העוזרת האישית של החברה, לחכמה יותר מרגע לרגע.

בין אם להתאמת פרסומות למשתמש ספציפי, ניהול שיחה קולחת יותר עם בוט או אפילו ניתוח של ביקורות גולשים – הבנת שפה הפכה להיות אחד מהאתגרים המדוברים והמסקרנים ביותר בקרב ענקיות הטכנולוגיה. אם כך נשאלת השאלה, היכן אנחנו נמצאים במסע לעבר הבנת אוטומטית של שפה וטקסט? ועד כמה אנחנו רחוקים מהיום בו מערכות מבוססות בינה מלאכותית באמת יוכלו לשוחח עמנו ברמה אנושית? לכתבה המלאה >>

X