כתבות עם התגית Data Science

פוסט זה נכתב על ידי עומר קורן, מנכ״ל Webiks

בחודשים האחרונים הייתי חבר בצוות שפעל מטעם מפא"ת ובחן את השימושיות של טכנולוגיות בינה מלאכותית בהתמודדות של גופים שונים בישראל עם משבר הקורונה. העבודה שלי התבססה על דאטה פתוח מהארץ ומהעולם. אני חושב שהייתה לי פרספקטיבה מעניינת על המפגש בין "הקהילה" שלנו, קהילת הדאטה-סיינס, למידת המכונה והבינה המלאכותית בישראל, לבין "המדינה" – משרד הבריאות, משרדי ממשלה ומוסדות נוספים.

מהפרספקטיבה הזו אני מרשה לעצמי לומר שאני חושב שפספסנו כאן הזדמנות אדירה להביא חדשנות פתוחה ושימושית מתוך המפגש הזה. במבחן התוצאה, אנחנו, בתור קהילה, לדעתי, נכשלנו. לא תרמנו תרומה משמעותית להתמודדות של מדינת ישראל עם משבר הקורונה.

זה לא פוסט של הלקאה עצמית. זה גם לא פוסט של ריסוס האשמות כלפי אחרים. זה פוסט של הסתכלות ביקורתית על העבר מתוך תקווה ללמוד ולהשתפר בעתיד. צעד אחד קטן של Backpropagation, אם תרצו.

נהוג לומר בימים אלו "הקורונה כאן כדי להישאר" ו"אנחנו צריכים ללמוד לחזור לשגרה בנוכחות קורונה" – וברוח זו אני חושב שעדיין לא מאוחר לתקן טעויות שעשינו. בניגוד לאחרים אני לא חושב שהבעיה היא בעיה מהותית, שמסיבה אינטרינזית כזו או אחרת דאטה-סיינס פשוט לא יכול לעזור להתמודדות עם פנדמיות. להיפך, אני חושב שהבעיה היא בעיה של התנהלות ושל דינמיקה, ואת אלו אפשר ואפילו קל, אולי, לשנות ולשפר.

אתחיל מלתאר שתי דוגמאות ל"פספוסים". שני נושאים שבהם הקהילה שלנו, לדעתי, יכלה לתרום תרומה משמעותית להתמודדות של מדינת ישראל עם המשבר. אחרי הדוגמאות לפספוסים אנסה להציע קצת הסברים.  לכתבה המלאה >>

נכתב על ידי עמית מנדלבוים, Director, Mellanox AI @ Nvidia, כפוסט בקבוצה MDLI (ממליץ להיכנס לקרוא גם את התגובות).

——————————————-

בצורה קצת יותר מפורטת. למה לעשות תואר שני, איך לעשות תואר שני, וכל הסיבות למה אתם לא עושים או רוצים לעשות תואר שני ולמה הן לא רלוונטיות. אזהרה: פוסט ארוך!

קצת רקע, ראיינתי בשנתיים וחצי האחרונות למעלה מ150 מועמדים לתפקידי דאטה סאיינטיסט. אני שומר על ראש פתוח ולכן ראיינתי כמעט כל סוג אפשרי

1. אנשים ותיקים מאוד בהיי-טק שלאחרונה נכנסו לתחום.

2. אנשים שעשו תואר ראשון (ואולי גם שני ושלישי) ואז עשו קורס של אחת המכללות למיניהן (בלי להזכיר שמות) כולל תוכניות מאוד אינטנסיביות שחלק כאן מכירים.

3. אנשים כמעט בלי רקע בתחום אבל עם רקע מתמטי\מדעי חזק מאוד.

4. אנשים שעובדים כבר כמה שנים בתחום.

5. אנשים שסיימו עכשיו תואר שני בתחום.

6. אנשים שסיימו תואר ראשון ולקחו כמה קורסים + פרויקט.

בלי להיכנס כרגע להכללות ובלי לפגוע באף אחד, ותוך הסתייגות שתמיד תמיד יש יוצאי דופן, להפתעתי (שוב, כי אני מנסה לשמור על ראש פתוח), מי שהפגינו את היכולות הטובות ביותר בראיונות היו אלו שעשו תואר שני בתחום (או לכל הפחות קרוב לתחום) עם סטייה קלה לאנשים שעשו תואר שני או שלישי אחר (למשל פיזיקה, ביולוגיה, מתמטיקה) עם רקע של הצטיינות ונכנסו לתחום לאחרונה דרך המחקר שלהם, עבודה שלהם, או עצמאית. כמובן שאלה שעשו תואר שני וכבר עובדים כמה שנים בתחום היו טובים, אבל אלה למרבה הצער נדירים ביותר.

קצת רקע נוסף שלא תחשבו שאני סתם איזה מתנשא שזורק עליכם "תעשו תואר שני" בלי שיש לכם אפשרות, אז אני התחלתי תואר שני במדעי המחשב, בגיל 30, כשהייתי עם שני ילדים, אחרי שנתיים בתעשייה ועם תואר ראשון בהנדסה (כלומר הרבה השלמות לתואר השני) ועם זה שהייתי צריך גם לעבוד במקביל לחלק מהתואר. וכן, היו אתי בתואר השני לא מעט אנשים כאלה (פחות או יותר), כולם סיימו וכולם עובדים היום בתחום.

אז נתחיל משאלת השאלות, למה בכלל לעשות תואר שני?

לכתבה המלאה >>

מדריך זה נכתב על ידי איתמר כספי כפוסט בקבוצת Machine & Deep learning Israel.

מבוא לסביבות פייתון למדעני נתונים

אמ;לק –

conda create -n my_project_env
conda activate my_project_env

[ you are now in a new python environment! ]

conda install necessary_packages_seperated_by_spaces

[ run tests on your script and make sure everything works! ]

python -m pip freeze > my_project_requirements.txt

טריוויאלי? יופי. בסוף יש טיפים למיטבי לכת אולי שם יהיה לכן מעניין.

לכתבה המלאה >>

חברת לייטריקס הירושלמית היא אחת מחברות האפליקציות המצליחות ביותר בארץ, עם עשרות מליוני הורדות מרחבי העולם. למי שלא מכיר, לייטריקס היא החברה המפתחת שלל אפליקציות פופולריות וזוכות פרסים לעיבוד תמונות ווידאו ועריכת תוכן במובייל. החברה בעיקר מוכרת בזכות לאפליקציית Facetune, שהפכה ללהיט ברחבי העולם המאפשרת יכולות עריכה מתקדמות. כעת מודיעה החברה על השקת תוכנית מלגות חדשה שתאפשר לסטודנטים בתחומי מדעי הנתונים מהאוניברסיטה העברית לקבל תמיכה כספית במהלך התואר.

במסגרת התכנית תעניק לייטריקס מלגות לשנה הראשונה ללימודים במסגרת תואר שני בחוג לסטטיסטיקה באוניברסיטה העברית בירושלים. הסטודנטים שיזכו במלגה יקבלו מענק של 13,800 ש"ח לכיסוי הוצאות שכר הלימוד לשנת הלימודים הנוכחית , וכן 5,000 ש"ח לחודש למשך 12 חודשים בשנת הלימודים 2019-2020.

כדי ללמוד על תוכנית המלגות ועל הפעילות של החברה בתחומי למידת המכונה, קיימתי ראיון קצר עם יניב טנצר המשמש כראש חטיבת ה- Data science בלייטריקס. כפי שחלקכם בוודאי יודעים, לייטריקס פועלת רבות בתחום ואלגוריתמים לומדים הם חלק מאוד משמעותי בפעילות החברה. "בגדול קיימות בחברה שתי חטיבות שמתעסקות בלמידת מכונה אמנם מהיבטים שונים: חטיבת המרקטינג דאטא סיינס וחטיבת העיבוד תמונה. חטיבת המרקטינג דאטא סיינס, אותה אני מוביל, מתעסקת במגוון בעיות מרקטינג מזווית של למידת מכונה. לדוגמא: בניית מודלים לחיזוי הכנסות מקמפיינים שאנחנו מריצים ברשתות החברתיות, שמשרת את האנליסטים בחברה. דוגמא נוספת היא בניית מודלים לחיזוי מבין המשתמשים הקיימים, מי סביר שירכוש מנוי, מה שמאפשר לנו למקד את השיווק. זווית נוספת היא תכנון ניסויים וניתוח תוצאות. בשנה האחרונה השמשנו מערכת Multi – Arm – Bandit. חטיבת העיבוד תמונה מתעסקת בבעיות שונות מתחום העיבוד תמונה כמו סגמנטציה/ זיהוי אובייקטים ועוד." הסביר טנצר. מלבד זאת, טנצר אף הרחיב וסיפר קצר על הטכנולוגיות והמודלים איתם עובדים בחברה: "אנחנו עושים שימוש במגוון מודלים/כלים/טכנולוגיות – החל ממודלים סטנדרטים לקלאסיפיקציה בינארית כמו רגרסיה לוגיסטית ועד מודלי אנליזת הישרדות, מודלי סדרות זמן, רשתות עמוקות ועוד". מודלים אלו, ככל הנראה יהיו חלק מעבודתם של הסטודנטים במידה וירצו להצטרף לחברה במקביל או בסיום לימודיהם.

לכתבה המלאה >>

כמידי שבוע אני מאגד לכם את כל הפוסטים הדיונים החשובים שעלו בקבוצה. השבוע היו לא מעט דיונים מרתקים על מגוון רחב של נושאים שכדאי לכם לבדוק. כפי שאתם בוודאי יודעים, הרשימה הזו נשלחת גם בניוזלטר שלנו כמידי שבוע (הירשמו כאן!). את הניוזלטר המלא ניתן למצוא כאן (השבוע: הקורס הרביעי של Razor, מגוון עבודות חדשות ועוד).

לכתבה המלאה >>

DataHack הוא ארגון ללא מטרת רווח המארגן האקתון שנתי ומפגשי למידה בנושאי ביג דאטה, למידת מכונה, בינה מלאכותית ועוד. ההאקתון מתקיים בירושלים זאת השנה הרביעית ומקדם את האקוסיסטם הירושלמי הצומח, כל שנה מגיעים 400-500 משתתפים מכל רחבי הארץ לשלושה ימים אינטנסיבים של עבודה על פרוייקטים טכנולוגיים חדשניים ויצירתיים. מדובר באחד מהאירועים הטכנולוגיים הגדולים ביותר בעיר ובין ההאקתונים הגדולים ביותר בארץ.

האירוע הוא פסטיבל גדול של דאטה וטכנולוגיה, מחבר בין דיסצפלינות שונות בינהם סטטיסטיקאים, מפתחים, מעצבים, מדעני נתונים וחוקרים. כל שנה נוצרים עשרות רבות של פרוייקטים, לדוגמא בשנים קודמות פיתחו הצוותים פתרונות בעלי ערך חברתי גדול (ואף זכו בפרס מיוחד עבור כך) כמו כלי אוטומטי שעוזר לאתר נוער בסיכון שנמצא במצוקה ברשת, מערכת שמנתחת וידיאו של תינוקות כדי לזהות שיתוק מוחין, מערכת ניווט להולכי רגל להפחתת סיכוני פשיעה, מערכת לחיזוי עיכובים בטיסות ועוד. מעבר לכך, חלק מהפרויקטים היו באווירה קלילהו והומוריסטית יותר, כמו כלי למציאת כלב שהכי דומה לאדם מסוים או מנוע המלצות לאוכל המתאים ביותר לנשנוש לצד סרט נבחר.

בעוד חודש, 3-5.10, ייערך האירוע בפעם הרביעית, בבית אליאנס בירושלים. דין לנגסם, שזכה שנה שעברה במסלול הראשי, בחר לחלוק מספר נקודות שלדעתו הביאו לו ולקבוצתו את הניצחון: לכתבה המלאה >>

את חברת EMC אין צורך באמת להציג. מדובר על אחת החברות הגדולות ביותר בעולם המתמחה באספקת מוצרים, שירותים ופתרונות בתחום אחסון וניהול מידע. החברה, שהייתה מחלוצות פארק ההייטק בבאר שבע, הקימה במרכז המחקר והפיתוח הדרומי שלה צוות Data Science as a Service העמל על מגוון רחב של פיתוחים. צוות זה מיישם טכניקות רבות בתחום ה-Machine learning ואף רותם אותן בכדי לפתח מוצרים מסקרנים במיוחד. קיימתי ראיון עם אושרי בן הרוש, Senior Manager ו-Data Scientist בחברת EMC, שהסביר לי על הצוות כולו ועל האתגרים עמם הם מתמודדים.

"הקבוצה שלנו נקראת Data Science as a Service וכשמה כן היא. אנחנו בעצם מספקים שירותי Data Science ליחידות עסקיות שונות ב-EMC וגם ללקוחות חיצוניים. הקבוצה הוקמה לפני 4.5 שנים כסטארטאפ פנימי בתוך EMC עצמה. הרעיון היה ש-EMC כארגון, הדומה לכל הארגונים האחרים, מתמודד עם בעיות שהן Data driven שכדאי לשם עליהן דגש ולנסות לתת להן מענה." הסביר בן הרוש. "לכן, החלטנו להקים צוות שיספק את השירותים האלה תחילה פנימה: כלומר הצוות יתחיל לפתור את הבעיות העסקיות של EMC תחת ההבנה שבעיות עסקיות של EMC יעניינו מאוד את הלקוחות של EMC. לאחר מכן נוכל לשלב את הפתרונות האלה במסגרת המוצרים שאנחנו יכולים להציע ללקוחות." לכתבה המלאה >>

X