Deep Dive: Outbrain

לפני מספר שבועות קיימנו את כנס ה-AutoML הראשון שלנו. ביום שאחרי, רצינו לתפוס לשיחה את אנדרז' טורי, Head of recommendations ב-Outbrain, כדי לשמוע קצת יותר על הפעילות של החברה – שהייתה שותפה שלנו לכנס – ולבדוק מה חושבים ב-Outbrain על העתיד של AutoML.
קצת על Outbrain
Outbrain היא שם ותיק בנוף ההייטק הישראלי, אך לטובת מי שלא מכיר כמה מילים על החברה. Outbrain היא למעשה פלטפורמת המלצות לאינטרנט הפתוח, ופועלת בשיתוף עם אתרי האינטרנט המובילים בארץ (N12, מאקו, וואלה, הארץ ודה מרקר, מעריב) ובעולם (CNN ,MSN, The Washington Post,Der Spiegel, Le Monde). החברה הוקמה ב-2006 ע"י ירון גלאי ואורי להב ופועלת מהמטה שלה בניו יורק ומ-18 משרדים נוספים בעולם, כולל אנגליה, צרפת, ישראל, אוסטרליה, סינגפור ויפן. מרכז הפיתוח של החברה נמצא בישראל. בכל חודש Outbrain מציגה מעל 240 מיליארד המלצות תוכן ומגיעה למעלה למיליארד משתמשים ברחבי העולם.
במישור הטכני, למידת מכונה נמצאת בשימוש נרחב במערכת ההמלצה של Outbrain. למשל, באלגוריתם הדירוג נעשה שימוש ב-ML לצורך CTR prediction, כדי לחזות את הרלוונטיות של תוכן מסוים עבור המשתמש. דוגמה נוספת, היא השימוש ב-ML כדי לחזות את סיכוי ההמרה של המשתמש (Conversion prediction) ולייצר ערך למפרסמים.
ומה לגבי AutoML?
המושג AutoML הוא מושג די חדש, וכמו מושגים רבים בתחום אפשר למצוא לו יותר מהגדרה אחת. שאלנו את אנדרז' על הנושא, ולשיטתו יש למעשה שני סוגים של AutoML, או שני שימושים עיקריים עבור הטכנולוגיה הזו.
"שימוש ראשון, המקובל בדרך כלל אצל ספקיות הענן הגדולות." מספר אנדרז'. "בעצם 'זורקים' את כל הדאטה פנימה ומקבלים את החיזוי. זה פתרון מקצה לקצה, שיוצר מודל חיזוי מהנתונים, שעובד בפרודקשיין בקנה מידה רחב."
ומה לגבי השני? "הכוונה כאן היא להטמעה של AutoML על ידי חברות גדולות לתוך סט הכלים הפנימי של הארגון. זה משהו שהרבה חברות גדולות עושות – משתמשות ב-AutoML כדי לקצר את תהליכי הפיתוח של מערכות למידת מכונה פנימיות שלהן, כשמדובר בכלים המותאמים לעולם הבעיה של החברה או בכלי MLOps שמאפשרים ניהול מהיר של מודלים." אנדרז' סבור שהסוג השני הוא חבוי יותר והמעניין יותר מהשניים. "ישנה הזדמנות אדירה לייצר ערך רב לעסק, לשפר ביצועים באיכות המוצרים והמדדים העסקיים ולקדם מחקר ופיתוח חדשניים באמצעות AutoML מהסוג הזה," משתף אנדרז'.
התפיסה הזו באה לידי ביטוי ב-Outbrain, שם רואים ב-AutoML כמכפיל כוח משמעותי לעסק. "לכל שיפור בדיוק המודל, אפילו שיפורים קטנים מאוד, יש השפעה ישירה על הביצועים העסקיים של החברה." מציין אנדרז'. "כדי להשיג את השיפורים הללו בצורה יעילה, אוטומציה המאפשרת בדיקה שיטתית של המון אפשרויות היא מכפיל כח רציני. דוגמה קלאסית אחת שהודגמה בהרצאה, היא חיפוש אינטרקציות מועילות מסדר גבוהה במודלים לחיזוי CTR".
העתיד של AutoML
ישנה אופטימיות רבה לגבי AutoML, ולצד זאת הטכנולוגיה עדיין לא אומצה באופן נרחב על ידי כלל התעשייה. לדעתו של אנדרז', אימוץ הטכנולוגיה תלוי במידה רבה בסוג החברה.
"אם מדובר בחברה בראשית דרכה בתחום ה-DS וה-ML, אז אין ספק ששימוש במוצרי AutoML מבוססי ענן של חברות כמו מייקרוסופט, גוגל ואמזון יספק לה תוצאות הרבה יותר מהירות וזולות מאשר לבנות משהו בעצמה מאפס," אומר אנדרז'. "לעומת זאת, חברות גדולות ומבוססות יותר שכבר יש להן תשתית פיתוח ל-ML יתקשו בדרך כלל לעשות את המעבר למתודות של AutoML ואוטומציה."
מעבר לכך, אנדרז' מציין שחלק מהקושי קשור באופן בו אנשים מזהים את עצמם בחברה – מדעני נתונים שמתעסקים בדאטה. "מאוד מאתגר ברמה הניהולית לקחת צוותים של מדעני נתונים שמורגלים לעיסוק בדאטה ושיטות מידול, ולהפוך אותם לצוותים שבונים כלי AutoML, מעין כלי-מטא לתהליך."
יחד עם זאת, ב-Outbrain נשמעים מאוד אופטימיים לגבי העתיד של AutoML. כששאלנו את אנדרז' האם הוא סבור שבעתיד משתמשים יוכלו להשתמש במודלים אוטומטיים באותה הקלות בה הם יכולים לבנות אתר באמצעות פלטפורמות כמו WIX, התשובה שלו הייתה חד משמעית. "כן! אתם בטח רוצים תשובה ארוכה יותר, אבל זה באמת פשוט."
אנדרז' אף רואה ב-AutoML כעתיד של תחום ה-ML כולו. "בעתיד AutoML ו-ML יהיו מילים נרדפות. באופן טבעי ישנן בעיות שהולכות להיות רלוונטיות גם בעתיד – מה עושים עם הטיות, איך מבטיחים רובסטיות, חשיבה על פיצ'רים חדשים, data drifts. אבל הפתרון לכל הבעיות האלו יעשה בתוך מסגרת הליבה של AutoML".
כנס ה-AutoML
אם אתם מעוניינים לשמוע עוד על הפעילות של Outbrain בתחום ה-AutoML, אתם מוזמנים לצפות בהקלטות של ההרצאות שלהם מהאירוע שקיימנו:להרצאה של אנדרז' טורי לחצו כאן.
להרצאה של אסף קליין והילה ויסמן-זהר לחצו כאן.
לכל המצגות לחצו כאן.