כתבות עם התגית אינטל

הכתבה בשיתוף פעולה אינטל.

הקורונה עדיין איתנו, מה שאומר שלא מעט כנסים עוברים לאונליין ואפשר ליהנות מהם מכל נקודה בעולם. אחד הכנסים שעשה את המעבר הזה לאונלין הוא כנס "AI Week" שהתקיים בפעם האחרונה עם יותר מ-3000 משתתפים באוניברסיטת תל אביב ועכשיו עבר גם הוא למתכונת דיגיטלית. לשמחתנו, הסרת המגבלות הפיזיות גרמה לכך שיש לנו אג'נדה מגוונת מאוד עם חוקרים חזקים ודמויות מפתח בתחום ה-AI מכל העולם, וגם הקהילה שלנו, Machine & Deep Learning Israel, היא פרטנרית של הכנס. חלק מהדוברים המעניינים שיהיו בכנס הם מחברת אינטל, שיזמה את האירוע והיא גם נותנת החסות הראשית השנה. 

בבלוג פוסט הזה נספר לכם על ההרצאות המעניינות שתשמעו מאינטל וגם על הרצאות נוספות כלליות שכדאי לכם להכיר. באתר הכנס תמצאו גם יריד וירטואלי, שמהווה חלופה לביתני נותני החסויות וכן אפשרות ליצור קשרים עם שאר המשתתפים בכנס. כפי שציינו, הכנס עתיד להימשך שלושה ימים ויכלול הרצאות ופאנלים בטכניים ומקצועיים. מה שמרשים לא פחות הוא רשימת הדוברים מחו"ל שייקחו חלק באירוע אשר כוללת כמה מהשמות המוכרים ביותר בתעשייה: פרופסור  Fei-Fei Li מסטנפורד, פרופסור Tomaso Poggio מ-MIT, פרופסור Mariarosaria Taddeo מאוקספורד ועוד רבים וטובים אחרים.

נזכיר כי הכנס יתקיים בין ה-22.4 לבין ה-24.2 וניתן להירשם לכנס בחינם ולקרוא את האג'נדה המלאה דרך הלינק הזה לכתבה המלאה >>

לפני זמן קצר, בחשיפה של דה מרקר, עלה כי ענקית הטכנולוגיה אינטל עתידה לרכוש את חברת מוביט הישראלית בעלות של לא פחות ממליארד דולר. ברגע שהידיעה עלתה לאוויר נשאלה מיד השאלה: מה הקשר בין חברת שבבים לבין אפליקצית תחבורה ציבורית? כפי שאתם יכולים לדמיין: דאטה. והרבה ממנו. 

נתחיל ונציין כי לאינטל לא באמת משנה אם קו 5 הגיע בזמן או לא. אינטל מעוניינת בתמונה הרחבה יותר שמוביט יוצרת על מצב התחבורה בערים שונות בעולם. מוביט מספקת את המידע החיוני הזה לעיריות וממשלות ברחבי העולם ובכך עוזרת להן לתכנן יותר טוב את המרחב האורבני ולהפחית את העומס על הכבישים. לכתבה המלאה >>

בארץ ישנם לא מעט תכניות סטארטאפים המסייעות לחברות בשלבים שונים. אותן תוכניות בדרך כלל פועלות תחת נושא משותף הרלוונטי לכל אותם הסטארטאפים (אייקומרס, תחבורה, סייבר ועוד). עם זאת, לחברות בתחום ה-ML אין מבחר מאוד גדול של תכניות שיכולות להעניק להן ערך מוסף, הן בסוגיות טכניות והן בסוגיות מקצועיות מול לקוחות. אחת התכניות שדווקא כן חרטה על דגלה לעזור לחברות בתחום ה-ML היא תכנית הסטארטאפים  Ignite של חברת אינטל, אשר כללה במחזור האחרון שלה לא מעט חברות מעולם זה.

כעת ההרשמה למחזור השני של Ignite פתוחה לסטארטאפים חדשים מישראל. בכתבה זו רציתי לבדוק מה יש ל-Ignite להציע לחברות ML וכיצד הם סייעו לחברות במחזור הקודם שפעלו בתחום זה. לשם כך קיימתי ראיון עם מנהל התכנית, צחי וייספלד, אשר סיפר לי על התכנית עצמה ועל הערך המוסף לחברות ML. לצד זאת, שאלתי מספר מייסדים של חברות מהמחזור הקודם על הדרך שבה Ignite סייע להם ולאן פונות פניהן כעת.

הרווארד של האקסלרטורים

לפני שאנחנו צוללים פנימה לעולמות ה-ML, ביקשתי מוייספלד שיספר מעט על התכנית ועל המתכונת בה הוא פועל. "מנכ"ל אינטל וצוות ההנהלה הבכיר של החברה ביקרו בישראל בסוף 2018 והחליטו שהיו רוצים להתחיל תכנית עולמית חדשה לסטארטאפים בשלבים מוקדמים, תכנית המחברת את אינטל בצורה בלתי אמצעית לסטארטאפים הטובים ביותר בעולם בתחומי טכנולוגיה מגוונים ומייצרת עבורם ערך. התכנית שהוכרזה ע"י המנכ"ל הינה תכנית גלובלית המתחילה בישראל". ציין וייספלד תחילה.

וייספלד המשיך והסביר כי: "התכנית, שכונתה בעיתונות כ-'הרווארד של האקסלרטורים', בוחרת בקפידה את משתתפיה (בכל מחזור נבחרים כ-10 מתוך 200 מועמדים). כל סטארטאפ משודך ליזם סדרתי מהתעשייה שחונך אותו ברמה השבועית (יינון ברכה, רון יקותיאל, רני וולינגשטיין, זוהר לבקוביץ, אמיר אהרוני ואחרים), כמו כן למנטורים מאינטל – מקבוצות הטכנולוגיה, AI , מקבוצות השיווק והמכירות. לצד אלו, היזמים נהנים מסידרת סדנאות ושעות ייעוץ פרטניות במגוון רחב של תחומים ע"י המומחים הטובים בעולם בתחומם – לדוגמא וירטואוזו (מהמומחים הגדולים בעולם ל storytelling). גישה למשאבים, משקיעים ולקוחות."

לצד העזרה העצומה בכמעט כל רובד אפשרי בחיי הסטארטאפ, ב-Ignite משקיעים לא מעט במתן סיוע מקצועי וטכני לחברות המגיעות עם עומק טכנולוגי. חברות אלה יכולות להפיק ערך גדול מהידע הרב שהצטבר אצל אינטל בתחומי ה-ML. לשם הדוגמא, המומחים של אינטל משתפים מנסיונם על הדרך שבה ניתן לנהל מחקרים בצורה רחבה, כיצד להרים אופרציות חומרה או תוכנה/שירותים מתקדמות וכמובן כיצד למכור את שירותי ה-ML לשחקנים הגדולים ביותר בעולם. לכתבה המלאה >>

הערה: המדריך קיים גם בשפה האנגלית במידה ותרצו לשתף עם גורמים אחרים.

החלטתם שאתם רוצים לקנות מחשב לצורכי אימון אלגוריתמים לומדים. או שאולי אתם פשוט עובדים בארגון בו המושגים האלה נזרקים לא מעט לחלל, ואתם רוצים להבין קצת טוב יותר במה מדובר. זה לא עסק נורא פשוט, ולכן החלטנו לכתוב את המדריך הזה. יש הרבה דרכים להסתכל על נושא החומרה בתחום ופה אנסה לדבוק באחת מהן.

מי אני?

אני ניר בן-צבי, חוקר deep learning וחובב חומרה עוד מהימים הזוהרים בהם הייתי מפרק ומרכיב מחשבים בזמן שחברים שיחקו כדורסל (גם את זה ניסיתי, חזרתי לחומרה די מהר). בשנים האחרונות יצא לי לייעץ לא מעט בנושא לחברים בכל מני ארגונים, וזה הוביל להחלטה לרכז את מעט הידע שצברתי למדריך שפה מולכם. היום אני עובד בחברת trigo שעושה הרבה דברים מעניינים בתחום הזה, וחלק מהידע שצברתי הגיע מבניית מחשבי האימון הראשונים שלפני לפני כ-3 שנים.

הערה לגבי עדכון המדריך

בחלקים מסוימים במדריך בחרתי לציין אם החלק הרלוונטי מעודכן או לא. המדריך כולו מתעדכן מפעם לפעם, אבל הגרסה המקורית שלו בת כמעט 4 שנים.
זה די מדהים כמה שדברים מסוימים לא משתנים במיוחד. למשל, בין נובמבר 2018 לאפריל 2020, NVIDIA לא עדכנה את המאיצים הגרפיים שלה – לא את אלו המיועדים ל-data centers (סדרת Tesla) ולא את אלו המיועדים למשתמשים פרטיים (סדרת GeForce). אינטל, מנגד, הספיקה לרענן את המעבדים שלה פעמיים ובדרך לשלישית. המהפכה שהיה ניתן לצפות לה עם הדור האחרון של המעבדים של AMD לא קרתה כלל.

אז למה שהמדריך הזה יישאר רלוונטי בכלל בעתיד? קודם כל, אני משתדל לעדכן אותו כשעולה צורך. בנוסף, השתדלתי ברענון האחרון להוריד מהמדריך את החלקים שהיו ספציפיים-מדי לדור מסוים של רכיב חומרה. לדוגמא, אינטל מעדכנים את המעבדים שלהם כל הזמן, אבל אני לא בטוח שסדרה 10 שאמורה לצאת השנה תביא בשורה מיוחדת לעוסקים ב-deep learning על GPUs, ולכן החלק הרלוונטי במדריך מנסה להיות גנרי מספיק.

עוד הערה חשובה – הנושא של ״מחשב ל-deep learning״ הרבה יותר מוכר ומובן היום בשוק העולמי והמקומי, יש הרבה יותר מידע זמין באינטרנט ובניגוד ללפני כמה שנים רכישת מחשב מורכב-מראש נהיה דבר מעט יותר משתלם.

כמה מילים לגבי מחשבים ניידים

המדריך הזה לא מיועד לבחירת מחשבים ניידים לאימון מודלים, ודעתו של הכותב היא שאין כזה דבר יותר. בעבר היה הגיון מסוים ברכישת מחשב נייד (בעיקר מחשבים המיועדים לגיימרים) עם כרטיס מסך חזק שמסוגל להתמודד עם טעינה של מודלים מורכבים יחסית. המצב היום הוא שהארכיטקטורות המודרניות כל כך ״כבדות״ מבחינת משאבי חישוב דרושים (בעיקר GPU memory) שאני לא רואה הגיון ברכישת מחשב כזה. גם מחשב הגיימינג החזק ביותר – כאלו שאי אפשר לקרוא להם ״ניידים״ בשום צורה (והם נקראים בצדק DTR – Desktop Replacement) – יכולים במקרה הטוב להריץ מודלים כאלה על minibatches קטנים ולא ייאפשרו אימון, אפילו לא fine-tune על דאטאסט קטן. אציין שוב (1) שזו דעתי ו-(2) שההיכרות שלי היא עם עולם הראייה הממוחשבת ועד כמה שאני יודע בתחומים אחרים שעושים שימוש ב-deep learning אפשר בהחלט להסתפק ב-GPU memory צנוע לצרכי לימוד.

בעידן בו גוגל מספקים T4 ו-P100 בחינם על בסיס Colab, אני לא רואה סיבה להשקיע במחשב חזק ויקר. כמובן שעדיין כדאי מאוד להשקיע במחשב חזק, עם די זיכרון (16 זה הסטנדרט) וליבות. 

ומה עם כרטיסי מסך ניידים?

אני מודה שאני לא מכיר מספיק את העולם הזה, ולא ראיתי כרטיסים כאלה בשימוש נרחב שאינו לגיימינג. בסופו של דבר עדין מדובר בכרטיס מסך בודד, שכנראה לא יהיה חזק מספיק בשביל שימושים רציניים (כל דבר שאינו משחקים לצרכי לימוד עצמי). 

אתחיל מלחלק את האפשרויות הקיימות בפנינו לארבע קטגוריות עיקריות:

מה במדריך?

  1. מחשב שולחני פשוט יחסית עם כרטיס גרפי בודד.
  2. מחשב הזהה למחשב מס׳ 1, הנבדל ממנו בכך שיש לו שני כרטיסים גרפיים (או הכנה לכרטיס גרפי נוסף בעתיד).
  3. מחשב לאימון ״כבד״ – כלומר, מחשב בעל ארבעה כרטיסים גרפיים ומעלה.
  4. מחשבים לאימון כבד אף יותר, כאשר 8 מאיצים גרפיים זה בד״כ המקסימום (ראו הערה בהמשך).

לכתבה המלאה >>

X