כתבות עם התגית computer vision

חלק א' – מבוא

אחד הנושאים הבולטים בתחום למידה עמוקה בשנה האחרונה הוא Multiple Modalities – שילוב דאטה ממספר דומיינים באותו מודל, כמו למשל מודל המסוגל לעבד יחד וידאו ואודיו, או לחילופין מודל היודע להפוך תמונה לטקסט ולהיפך. כמובן שתחום זה אינו חדש במחקר, אך לאחרונה יש בו חידושים טכנולוגיים פורצי דרך יחד עם תוצאות מדהימות במגוון רחב של משימות. מעבר לעובדה שיש יותר ויותר אפליקציות המשלבות דאטה ממספר דומיינים, מה שמגביר את ההתעניינות בתחום הן מבחינה מחקרית והן מבחינת פיתוח, נראה שיש לפופולריות הזו סיבה מהותית יותר. מודל המשלב בתוכו יכולת לעבד ולשלב דאטה מדומיינים שונים מצליח "להבין" יותר לעומק את המבנה הדאטה שהוא מקבל ועקב כך הביצועים שלו טובים יותר. מחקרים חדשים המתבססים על שילוב של דומיינים מראים תפיסה טבעית יותר של הקלט, מה שמאפשר למודל ללמוד בצורה יותר איכותית. בכתבה זו נסקור אחד הרעיונות המרכזיים לאימון מודלים המשלבים דאטה טקסטואלי וויזואלי. אמנם גישה זו הוצעה כבר בעבר אך היא שוכללה בצורה משמעותית בשנה האחרונה ולא מעט מאמרים עכשוויים מבוססים עליה. נעבור בקצרה על כמה עבודות מרכזיות המציעות שיטות לבניית ייצוג של דאטה מולטימודלי המורכב מטקסט ותמונות. לכתבה המלאה >>

האם כדאי להשתמש ב-PyTorch או ב-TensorFlow? זו אולי אחת השאלות הכי נפוצות בקרב קהילת ה-AI, והתשובה רחוקה מלהיות ברורה וחד משמעית.

כתבה זו סוקרת את שתי הספריות במגוון אספקטים, תוך שימת דגש על היתרונות והחסרונות של כל ספריה. בנוסף, הכתבה נותנת כלים למפתח המתלבט איך לבחור נכון את הספריה המתאימה עבורו.


PyTorch ו-TensorFlow הן הספריות הפופולריות ביותר היום הנוגעות ללמידה עמוקה, והשאלה איזה מהן עדיפה יותר רחוקה מלהיות פשוטה. הוויכוח על איזו ספריה היא הטובה ביותר מתקיים כמעט מרגע הולדתן, כאשר לכל ספריה יש את התומכים שלה. למעשה, שתי הספריות פותחו תוך שנים ספורות בלבד, וככל שהן משתכללות, כך הויכוח הולך ומחריף. עם זאת, הרבה מהויכוח נובע מדיס-אנפורמציה או מידע שכבר אינו רלוונטי, מה שהופך את הדיון לעיתים להיות מטעה. בעוד ש-TensorFlow נהנית ממוניטין של ספרייה שרלוונטית לתעשייה ואילו PyTorch מתאימה דווקא למחקר, טענות אלו כבר לא בהכרח מדויקות ל-2022 כפי שנראה בהמשך אלו, ואתם מוזמנים למסע משותף לעמוד יחד על ההבדלים בין שתי הספריות, והיתרונות והחסרונות של כל אחת מהן.

לכתבה המלאה >>

כנס  (IMVC (Israel Machine Vision conference מתקיים זו השנה ה-12, ולאורך השנים צבר לעצמו שם כאחד האירועים הבולטים ביותר לתחום הראייה הממוחשבת. גם השנה אנו מקיימים שיתוף פעולה עם הכנס שמקנה לחברי קהילת MDLI הנחה מיוחדת ברישום ל-IMVC באמצעות הקוד MDLI15.

במסגרת שיתוף הפעולה, ישבנו עם ד"ר חן שגיב וד"ר קובי כהן, מייסדי הכנס, כדי לשמוע מהם על ההיערכות לאירוע בסדר גודל כזה לצד הקורונה, לבדוק מה מצפה למשתתפים באירוע הקרוב, ומה הם חושבים על העתיד של עולם הראייה הממוחשבת.

לכתבה המלאה >>

סקירה זו היא חלק מפינה קבועה של סקירת מאמרים חשובים בתחום ה-ML/DL, בהם מוצגת בעברית גרסה פשוטה וברורה של מאמרים נבחרים. במידה ותרצו לקרוא את המאמרים הנוספים שסוכמו, אתם מוזמנים לבדוק את העמוד שמרכז אותם תחת השם deepnightlearners.


לילה טוב חברים, היום אנחנו שוב בפינתנו deepnightlearners עם סקירה של מאמר בתחום הלמידה העמוקה. היום בחרתי לסקור מאמר שאני שותף בכתיבה שלו, יחד עם שותפים מ-SIRC – Samsung Israel R&D Center:

Layer Folding: Neural Network Depth Reduction using Activation Linearization

מאת: Amir Ben Dror, Niv Zehngut, Avraham Raviv, Evgeny Artyomov, Ran Vitek, Roy Jevnisek.


פינת הסוקר:

    המלצת קריאה: מומלץ מאוד לכל מי שמתעסק ברשתות נוירונים מיועדות למכשירי קצה (מובייל, IoT וכדו').

    בהירות כתיבה: גבוהה.

    רמת היכרות עם כלים מתמטיים וטכניקות של ML/DL הנדרשים להבנת מאמר: נדרשת היכרות בסיסית עם רשתות קונבלוציה. המאמר קל להבנה וכמעט לא מכיל נוסחאות מתמטיות.

    יישומים פרקטיים אפשריים: יצירת רשתות פחות עמוקות המקנות שיפור ב-inference time וצריכת סוללה כמעט ללא פגיעה בדיוק הרשתות.


פרטי מאמר:

    לינק למאמר: זמין כאן

    לינק לקוד: זמין כאן (PyTorch)

    פורסם בתאריך: 17.06.21, בארקיב


רקע ותמצית המאמר: לכתבה המלאה >>

סקירה זו היא חלק מפינה קבועה בה אני סוקר מאמרים חשובים בתחום ה-ML/DL, וכותב גרסה פשוטה וברורה יותר שלהם בעברית. במידה ותרצו לקרוא את המאמרים הנוספים שסיכמתי, אתם מוזמנים לבדוק את העמוד שמרכז אותם תחת השם deepnightlearners.


לילה טוב חברים, היום אנחנו שוב בפינתנו deepnightlearners# עם סקירה של מאמר מבית אמזון בתחום הלמידה העמוקה. המאמר הנסקר היום: 

GAN-Control: Explicitly Controllable GANs

פינת הסוקר: 

המלצת קריאה ממייק: חובה לאוהבי גאנים.

בהירות כתיבה: טובה מאוד.

רמת היכרות עם כלים מתמטיים וטכניקות של ML/DL הנדרשים להבנת מאמר: נדרשת הבנה טובה בארכיטקטורות עכשוויות של הגאנים (StyleGAN2) וידע בסיסי בנושא אימון של הגאנים. בנוסף נדרשת הבנה בסיסית של עקרונות הלמידה המנוגדת.

יישומים פרקטיים אפשריים:  יצירה של תמונות פוטוריאליסטיות בעלות מכלול מוגדר של פיצ'רים ויזואליים כגון גיל, תנוחת ראש, צבע שיער וכדומה בכמה דומיינים כמו תמונות פנים מצוירות ותמונות פרצופים של חיות. 


פרטי מאמר: 

לינק למאמר: זמין כאן

לינק לקוד: לא שותף בארקיב

פורסם בתאריך: 07.01.21, בארקיב

הוצג בכנס: לא ידוע


תחומי מאמר:

  • גאנים (GANs).

כלים מתמטיים, טכניקות, מושגים וסימונים:

 

מבוא והסבר כללי על תחום המאמר: לכתבה המלאה >>

לאחר הרבה הכנות והפקת לקחים מהקורס הקודם, גיל, ניר, ערן ואני שמחים להודיע כי אנחנו פותחים מחזור נוסף של MDLI Course – קורס מבוא ל-Deep Learning של הקהילה. בבלוג הזה אנחנו נשתף אתכם במידע על הקורס השנה וכמובן נפרסם לינק להרשמה לקראת המחזור השלישי.

למי שלא מכיר: בשנתיים האחרונות החלטנו, ארבעת האדמינים בקבוצה, לקחת את הקורס המוכר של סטנפורד "CS231n: Convolutional Neural Networks for Visual Recognition" ולהעביר אותו בצורה פורנטלית ובעברית באופן התנדבותי לחלוטין. הקורס הועבר לקבוצה של 60 סטודנטים שהגיעו מידי שבוע במשך ארבעה חודשים לגוגל קמפוס כדי ללמוד על התחום. לאחר ארבעת החודשים הצמדנו לבוגרים מנטורים מהתעשייה לטובת פרויקטי גמר המציגים את הידע הנרכש בקורס עצמו.

שני המחזורים הקודמים היו הצלחה. אלו שצלחו את הקורס עד סופו רכשו סט כלים חדש וידע שעזר לחלקם למצוא עבודות חדשות, או לעשות שינוי קריירה בתוך הארגון בהם הם עובדים. השנה אנחנו מתכוונים להפוך את הקורס למקצועי עוד יותר וליישם את כל הלקחים שהפקנו מהמחזור הקודם. אנחנו נוסיף הדרכות על שירות הענן של גוגל, תרגולים סביב עבודות הבית (הודות למתן פרידמן -מצטיין המחזור הראשון) וחיבור חזק יותר לתעשייה בפרויקטי הגמר. כפועל יוצא מכך זה אומר שרף הסינון עולה והרצינות שאנחנו מצפים מהמחזור החדש עולה גם היא.

כמו כן, קחו בחשבון שהקורס הוא מאוד Hands On ומתמטי לכן נדרשים גם ידע מתמטי וגם ידע תכנותי ברמה גבוהה (אלגברה לינארית, חד"וא, הסתברות ופיתון). ידע זה קריטי להבנת הקורס ולהכנת מטלות הבית השונות לכן אנא הירשמו רק אם יש לכם שליטה מספקת בנושאים הנ"ל.

אנחנו מציינים את הנהלים כבר עכשיו, לפני ההרשמה עצמה, כדי שתוכלו לעבור על כל התנאים ולהבין שהם מתאימים לכם. אנחנו לא מתכוונים לעגל פינות והמשמעת הנוקשה נועדה כדי שכל אחד שנבחר יפיק את המירב מהקורס ויצדיק את העובדה שדווקא הוא נבחר על פני מועמד אחר. בדיוק כמו בשנה הקודמת, גם הפעם אנחנו נקפיד על ייצוג שווה בין נשים וגברים בקורס, אך אין זה אומר שנקודה זו משפיעה על הסינון עצמו או על הרף הנדרש.

נהלים חשובים של הקורס:

לכתבה המלאה >>

כפי שהובטח, אני עושה פיילוט ראשוני ומארגן גרסה מקומית של כנס CVPR בו יציגו דוברים ישראליים את העבודות אותן הם הולכים להציג בכנס CVPR עצמו. נתחיל ונציין כי אין קשר רשמי לכנס CVPR העולמית וכי מדובר על יוזמה קהילתית מקומית שמטרתה היא לאפשר לאלו שלא ייקחו חלק בכנס ליהנות מתכנים והרצאות ברמה המקצועית הגבוהה ביותר. האירוע יתקיים בתאריך ה02/06/2019, בשעה 18:00, בגוגל קמפוס ויכלול כ-14 הרצאות בנות 12 דקות בהן כל מרצה יציג את הנושאים העיקריים בעבודה שלו. כמו כן, לאחר האירוע אשלח את כל החומרים בצורה מסודרת בניוזלטר של הקהילה וגם אעדכן את העמוד הזה (הירשמו לניוזלטר כדי להישאר מעודכנים). ההרשמה לאירוע מתבצעת דרך הטופס הזה.

רשימת דוברים (מתעדכן):

לכתבה המלאה >>

חברת לייטריקס הירושלמית היא אחת מחברות האפליקציות המצליחות ביותר בארץ, עם עשרות מליוני הורדות מרחבי העולם. למי שלא מכיר, לייטריקס היא החברה המפתחת שלל אפליקציות פופולריות וזוכות פרסים לעיבוד תמונות ווידאו ועריכת תוכן במובייל. החברה בעיקר מוכרת בזכות לאפליקציית Facetune, שהפכה ללהיט ברחבי העולם המאפשרת יכולות עריכה מתקדמות. כעת מודיעה החברה על השקת תוכנית מלגות חדשה שתאפשר לסטודנטים בתחומי מדעי הנתונים מהאוניברסיטה העברית לקבל תמיכה כספית במהלך התואר.

במסגרת התכנית תעניק לייטריקס מלגות לשנה הראשונה ללימודים במסגרת תואר שני בחוג לסטטיסטיקה באוניברסיטה העברית בירושלים. הסטודנטים שיזכו במלגה יקבלו מענק של 13,800 ש"ח לכיסוי הוצאות שכר הלימוד לשנת הלימודים הנוכחית , וכן 5,000 ש"ח לחודש למשך 12 חודשים בשנת הלימודים 2019-2020.

כדי ללמוד על תוכנית המלגות ועל הפעילות של החברה בתחומי למידת המכונה, קיימתי ראיון קצר עם יניב טנצר המשמש כראש חטיבת ה- Data science בלייטריקס. כפי שחלקכם בוודאי יודעים, לייטריקס פועלת רבות בתחום ואלגוריתמים לומדים הם חלק מאוד משמעותי בפעילות החברה. "בגדול קיימות בחברה שתי חטיבות שמתעסקות בלמידת מכונה אמנם מהיבטים שונים: חטיבת המרקטינג דאטא סיינס וחטיבת העיבוד תמונה. חטיבת המרקטינג דאטא סיינס, אותה אני מוביל, מתעסקת במגוון בעיות מרקטינג מזווית של למידת מכונה. לדוגמא: בניית מודלים לחיזוי הכנסות מקמפיינים שאנחנו מריצים ברשתות החברתיות, שמשרת את האנליסטים בחברה. דוגמא נוספת היא בניית מודלים לחיזוי מבין המשתמשים הקיימים, מי סביר שירכוש מנוי, מה שמאפשר לנו למקד את השיווק. זווית נוספת היא תכנון ניסויים וניתוח תוצאות. בשנה האחרונה השמשנו מערכת Multi – Arm – Bandit. חטיבת העיבוד תמונה מתעסקת בבעיות שונות מתחום העיבוד תמונה כמו סגמנטציה/ זיהוי אובייקטים ועוד." הסביר טנצר. מלבד זאת, טנצר אף הרחיב וסיפר קצר על הטכנולוגיות והמודלים איתם עובדים בחברה: "אנחנו עושים שימוש במגוון מודלים/כלים/טכנולוגיות – החל ממודלים סטנדרטים לקלאסיפיקציה בינארית כמו רגרסיה לוגיסטית ועד מודלי אנליזת הישרדות, מודלי סדרות זמן, רשתות עמוקות ועוד". מודלים אלו, ככל הנראה יהיו חלק מעבודתם של הסטודנטים במידה וירצו להצטרף לחברה במקביל או בסיום לימודיהם.

לכתבה המלאה >>

בשנים האחרונות קשה שלא לשם לב להתקדמות העצומה שנרשמה בתחום הראייה הממוחשבת. יכולות או טכנולוגיות שנחשבו מדע בדיוני עד לפני כמה שנים, כעת הופכות לנגישות, קלות להטמעה וחלקן אפילו הפכו להיות מוצרי מדף מוכנים. עם זאת, ישנם מספר עצום של אתגרים ובעיות לא פתורות בתחום זה, ובמקביל לכך נוצרים תחומי מחקר חדשים המציגים שימושים נרחבים ופורצי דרך בתחום. מעבר לכך, אנו עדים לאלגוריתמים חדשים המסוגלים להבין לעומק תמונות או קטעי וידאו ואף ליצור כאלה יש מאין – נקודה היוצרת לא מעט גם אתגרים חברתיים ואתים.

כנס  (IMVC (Israel Machine Vision conference  מתקיים זו השנה העשירית ודן בסוגיות אלה ורבות אחרות, וכן כדי להכיר את הפיתוחים המתקדמים ביותר בשוק.  הכנס יכלול לא מעט תכנים והרצאות הקשורים לעולמות התוכן של Machine Learning ו-Deep Learning כך שיש לו חשיבות עצומה בקרב הקהילה המקומית. יתרה מכך, תחום הלמידה החישובית אף קיבל חשיבות רבה עם השנים והפך להיות מאוד דומיננטי בכנס כולו כפי שנלמד בהמשך.

כדי ללמוד על הכנס ועל התכנים השונים שיוצגו בו שוחחתי עם ד"ר חן שגיב וד"ר קובי כהן, היזמים מאחורי כנס IMVC, אשר הסבירו לי על כיצד הכנס היה לפני עשר שנים, מה צפוי לנו לראות בכנס השנה ולקינוח גם שיתפו אותי במחשבות שלהם לגבי העתיד של התחום כולו. דרך אגב, לפני שאנו צוללים פנימה כדי שתכירו כי השנה נוצר שיתוף פעולה בין קהילת Machine & Deep learning Israel לבין IMVC וארגנתי לחברי הקהילה הנחה משמעותית של 20% בשימוש בקופון MDL20.

IMVC 2019

כפי שציינתי תחילה, כנס IMVC 2019, אשר מתקיים השנה ב-18 במרץ, התקיים לראשונה ב-28 בינואר 2010 בעקבות זיהוי צורך של חן וקובי באירוע טכנולוגי מרוכז שיעניק במה לפיתוחים הנעשים בתעשייה ולא רק לאלו שנעשים באקדמיה כפי שהיה עד כה בכנסים מקבילים. הכנס הראשון היה הצלחה משמעותית וכפועל יוצא מכך, הפך להיות מסורת שנתית ומקום מפגש של כל השחקנים השונים בתחום הראייה הממוחשבת בארץ. הכנס אז מאגד  מספר רב של נושאים חמים בתחום הנ"ל ואף כולל אג'נדה מרתקת במיוחד.

ואם באג'נדה עסקינן, בתחילת 2010 כמעט ולא היה ניתן למצוא הרצאות בתחום Machine Learning בכנס וישנה רק הרצאה אחת אמיר נבות, אז מחברת רפאל, אשר עסק בנושא בהרצאתו: "Light-Arms Fire Detection using Machine Learning Technique". כפי שחן הסבירה לנו, אז הנושאים שהיו על הפרק היו מעט שונים: "בשנים הראשונות הכנס היה ממוקד בשיטות עיבוד תמונה וראיה ממוחשבת ואף כלל גם נושאים מעולם עיבוד האותות". היום קשה לנו לדמיין כנס Vision ללא נוכחות נכבדה של אלגוריתמים מעולמות ה-Machine/Deep Learning ואט אט עם השנים אכן התחיל אותו שינוי משמעותי בקרב הקהילה המדעית והמקצועית. לכתבה המלאה >>

כמידי שבוע אני מאגד לכם את כל הפוסטים הדיונים החשובים שעלו בקבוצה. השבוע היו לא מעט דיונים מרתקים על מגוון רחב של נושאים שכדאי לכם לבדוק.  כפי שאתם בוודאי יודעים, הרשימה הזו נשלחת גם בניוזלטר שלנו כמידי שבוע (הירשמו כאן!). את הניוזלטר המלא ניתן למצוא כאן (השבוע: סדנא שלי על AI לאנשים לא טכנולוגיים וכמה משרות חדשות מאוד מרתקות).

We had a great week last week (That's why it took me so long to write it). Here you can find all the interesting posts and discussions from the community:

1. Rani Horev shared with us a great summary he wrote for this very interesting article which came recently. Don't miss it.

2. Roey Mechrez and a couple of friends are now running their version of the community course and offer all the northern people a chance to learn the basics of DL for free! check it ASAP. Roey also shared with us this great work called "Photo Wake-Up: 3D Character Animation from a Single Photo ". It's truly magical.

3. Yaron Gurovitch and several other researchers published their work at the Nature magazine! The article is about "Identifying facial phenotypes of genetic disorders using deep learning". If you need to read only one link make it this one.

לכתבה המלאה >>

X