כתבות עם התגית Amazon

בשבוע שעבר התחלתי ניסוי קטן שבו אני מפרסם גם כאן בבלוג את כל הפוסטים החשובים שעלו בקבוצה בשבוע החולף (לצד הפרסום בניוזלטר). בשבוע שעבר קבלתי פידבקים מעולים לכן אני ממשיך עם כך גם השבוע. דרך אגב, אתם יכולים למצוא את הניוזלטר המלא בלינק הבא (יש בו מידע על המיטאפ שלו ועל כל המשרות החדשות שהתווספו ללוח משרות). אם אתם רוצים לקבל את הניוזלטר בצורה אוטומטית פשוט תירשמו כאן.

כפי שאתם יכולים לראות השבוע היה לנו שבוע מצוין עם לא מעט תוכן איכותי בקבוצה. מרבית הדיונים שנפתחו היו סביב עבודות ומאמרים חדשים שנכתבו לאחורנה והצליחו ליצור עניין רב בקרב חברי הקהילה. לשמחתי השבוע היו גם כמה מאמרים ופוסטים שנכתבו על ידי חברה הקבוצה עצמם מה שתמיד מצוין ויוצר דיונים מעולים.

Group's Highlights from last week

1. Imry Kissos from Amazon shared an interesting blog post from Google with the title "TF-Ranking: A Scalable TensorFlow Library for Learning-to-Rank". Imry also shared this great content: "Unsupervised Deep Learning – Google DeepMind & Facebook Artificial Intelligence NeurIPS 2018".

2. Amitai Armon from Intel shared with us an article they released at NeurIPS 2018. The article name is "Automated Testing of Graphics Units by Deep-Learning Detection of Visual Anomalies".

3. Yonatan Hadar from YellowRoad made us all feel much better with his new article: "Top Examples of Why Data Science is Not Just .fit().predict()".

4. Yam Peleg from Deep Trading open our eyes with this great article: "Auto-Keras: Efficient Neural Architecture Search with Network Morphism".

5. Rani Horev from Snip shared a new cool tool that he developed which will make your life easier next time you would find a new article.

6. Assaf Shocher from Weizmann Institute of Science shared an article he wrote with Shai Bagon, Phillip Isola, and Michal Irani. The article name is: "Internal Distribution Matching for Natural Image Retargeting". If you need to read only one post, make it this one.

7. Bonus: The one and only, Gal Yona from Cellebrite started a very important poll. Don't miss it.

קוראי הניוזלטר האדוקים, בוודאי יודעים שאני מסכם מידי שבוע את כל הפוסטים החשובים ביותר שעלו בקבוצת פייסבוק של הקהילה. כל שבוע אני סורק את הקבוצה ומחפש אחר הדיונים המרתקים ביותר שהתקיימו ומרכז את כולם במקום אחד כדי שאתם תוכלו לוודא שלא פספסתם אף נושא חשוב שעלה באותו השבוע. לאחרונה קבלתי הרבה בקשות להעביר את הפורמט של הסיכום השבועי למקום שיהיה יותר קל לשתף אותו ולשלוח לחברים. לכן, אני אתחיל לכתוב גם כאן בבלוג את הסיכום השבועי. חשוב לי להדגיש שבכל מקרה אשלח את הסיכום השבועי כלינק מסודר בניוזלטר, ככה שלא הרבה הולך להשתנות.

דרך אגב, אם אתם רוצים לוודא שאתם לא מפספסים את הסיכום השבועי, פשוט תירשמו לניוזלטר וככה תוכלו להישאר מעודכנים תמיד. כל שישי בבוקר יחכה לכם בתיבת המייל ניוזלטר חדש עם מידע שחשוב שתכירו. עוד סיבה ממש טובה להירשם לניוזלטר היא שאני מעדכן שם מידי פעם על כל מיני יוזמות ושיתופי פעולה שאני עובד עליהם הרבה לפני שהם עולים לקבוצה (ככה אני יכול לבדוק את התגובות לפני 🙂 ). בקיצור אל תפספסו.

עוד הערה קטנה, הסיכום השבועי ימשיך להיות באנגלית כי ככה יותר קל לכתוב אותו בצורה רציפה ללא ערבוב של האנגלית והעברית. נתחיל?

לכתבה המלאה >>

בשנים האחרונות אנו עדים לשיפור הניכר שהשיגו אלגוריתמים לומדים בלא מעט תחומים. אלגוריתמים אלו, כדי שבאמת יספקו תוצאות מרשימות, מצריכים כוח עיבוד רציני ומחייבים את העוסקים בנושא להרכיב מערכות מחשוב מתקדמות מאוד. מאחר ומדובר על נושא מורכב למדי, החלטתי לכתוב את המדריך הבא שיסייע לכם לבחור את הרכיבים המתאימים ביותר לצרכים שלכם. חשוב לי להדגיש כי ניתן להעניק מענה לסוגיה זו בכמה אופנים ומדריך זה יכסה זווית אחת בלבד.

מי אני?

אני ניר בן-צבי, חוקר deep learning וחובב חומרה עוד מהימים הזוהרים בהם הייתי מפרק ומרכיב מחשבים בזמן שחברים שיחקו כדורסל (גם את זה ניסיתי, חזרתי לחומרה די מהר). בשנים האחרונות יצא לי לייעץ לא מעט בנושא לחברים בכל מיני ארגונים, וזה הוביל להחלטה לרכז את מעט הידע שצברתי למדריך שמולכם.

הערה לגבי עדכון המדריך

בחלקים מסוימים במדריך בחרתי לציין אם החלק הרלוונטי מעודכן או לא. המדריך כולו עבר עדכון בינואר 2020, אבל הגרסה המקורית שלו בת למעלה משנתיים. זה די מדהים כמה שדברים מסוימים לא משתנים במיוחד. למשל, בין נובמבר 2018 לינואר 2020, Nvidia לא עדכנה את המאיצים הגרפיים שלה – לא את אלו המיועדים ל-Data Centers (סדרת Tesla) ולא את אלו המיועדים למשתמשים פרטיים (סדרת GeForce). אינטל, מנגד, הספיקה לרענן את המעבדים שלה פעם-וחצי. המהפכה שהיה ניתן לצפות לה עם הדור האחרון של המעבדים של AMD לא קרתה כלל.

אז למה שהמדריך הזה יישאר רלוונטי בכלל בעתיד? קודם כל, אני משתדל לעדכן אותו כשעולה צורך. אעשה זאת בהחלט כשייצא דור חדש של Nvidia. בנוסף, השתדלתי ברענון האחרון להוריד מהמדריך את החלקים שהיו ספציפיים-מדי לדור מסוים של רכיב חומרה. לדוגמא, אינטל מעדכנים את המעבדים שלהם כל הזמן, אבל אני לא בטוח שסדרה 10 שאמורה לצאת השנה תביא בשורה מיוחדת לעוסקים ב-deep learning על GPUs.

עוד הערה חשובה – הנושא של ״מחשב ל-Deep learning״ הרבה יותר מוכר ומובן היום בשוק העולמי והמקומי, יש הרבה יותר מידע זמין באינטרנט ובניגוד ללפני שנה-שנתיים רכישת מחשב מורכב נהיה דבר מעט יותר משתלם. 

הדור הבא של Nvidia כבר הוכרז וייקרא Ampere, ע״ש אנדרה מרי אמפר, מאבות המחקר בחשמל ומגנטיות של חומרים. אין תאריך מדויק להכרזה, ואם לשפוט לפי העבר Nvidia יתחילו ברכיבי סדרת Tesla, וכרטיסי ה-GeForce לבני תמותה כמונו יצאו רק הרבה חודשים לאחר מכן.

כמה מילים לגבי מחשבים ניידים

המדריך הזה לא מיועד לבחירת מחשבים ניידים לאימון מודלים, ודעתו של הכותב היא שאין כזה דבר יותר. בעבר היה הגיון מסוים ברכישת מחשב נייד (בעיקר מחשבים המיועדים לגיימרים) עם כרטיס מסך חזק שמסוגל להתמודד עם טעינה של מודלים מורכבים יחסית. המצב היום הוא שהארכיטקטורות המודרניות כל כך ״כבדות״ מבחינת משאבי חישוב דרושים (בעיקר GPU memory) שאני לא רואה הגיון ברכישת מחשב כזה. גם מחשבי הגיימינג החזקים ביותר – כאלו שאי אפשר לקרוא להם ״ניידים״ בשום צורה (והם נקראים בצדק DTR – Desktop Replacement) – יכולים במקרה הטוב להריץ מודלים כאלה על Minibatches קטנים ולא ייאפשרו אימון, אפילו לא fine-tune על דאטאסט קטן. אציין שוב (1) שזו דעתי ו-(2) שההיכרות שלי היא עם עולם הראייה הממוחשבת ועד כמה שאני יודע בתחומים אחרים שעושים שימוש ב-Deep learning אפשר בהחלט להסתפק ב-GPU memory צנוע לצרכי לימוד. בעידן בו גוגל מספקים T4 ו-P100 בחינם על בסיס Colab, אני לא רואה סיבה להשקיע במחשב חזק ויקר. כמובן שעדיין כדאי מאוד להשקיע במחשב חזק, עם די זיכרון (16 זה הסטנדרט) וליבות. 

ומה עם כרטיסי מסך ניידים?

אני מודה שאני לא מכיר מספיק את העולם הזה, ולא ראיתי כרטיסים כאלה בשימוש נרחב שאינו לגיימינג. בסופו של דבר עדין מדובר בכרטיס מסך בודד, שכנראה לא יהיה חזק מספיק בשביל שימושים רציניים (כל דבר שאינו משחקים לצרכי לימוד עצמי). 

אתחיל מלחלק את האפשרויות הקיימות בפנינו לארבע קטגוריות עיקריות:

מה במדריך?

  1. מחשב שולחני פשוט יחסית עם כרטיס גרפי בודד.
  2. מחשב הזהה למחשב מס׳ 1, הנבדל ממנו בכך שיש לו שני כרטיסים גרפיים (או הכנה לכרטיס גרפי נוסף בעתיד).
  3. מחשב לאימון ״כבד״ – כלומר, מחשב בעל ארבעה כרטיסים גרפיים ומעלה.
  4. מחשבים לאימון כבד אף יותר, כאשר 8 מאיצים גרפיים זה בד״כ המקסימום (ראו הערה בהמשך).

לכתבה המלאה >>

פוסט זה ירכז משרות בתחום ה-Machine Learning בישראל. ברשימה למטה ניתן למצוא חברות גדולות, סטארטאפים ומעבדות מחקר אקדמאיות המחפשות עובדים במגוון תחומים.

בימים אלו אני עובד על השקה של לוח משרות חדש ומתקדם, במידה ואתם מעוניינים להוסיף משרה אתם מוזמנים לפנות אלי במייל: uri@machinelearning.co.il

רוצים לקבל גישה ללוח משרות החדש לפני כולם? היכנסו לקישור הבא.

 

לכתבה המלאה >>

X