סיכום אירוע Google I/O 2024 – כל ההכרזות (והפרשנות) במקום אחד

אורי אליאבייב, 15/05/2024

קטגוריה: כללי

אירוע המפתחים השנתי של גוגל (Google I/O) התקיים לפני זמן קצר והוא היה עמוס במגוון רחב של הכרזות שעסקו, איך לא, בתחום ה-AI. היה לנו שם הכל: החל ממודלים חדשים ועד פיצ'רים מתקדמים שיכנסו בכל השירותים שאנחנו מכירים ומשתמשים. בכתבה הזו אני אעשה קצת סדר בכל ההכרזות (היו הרבה) ואתן גם את הפרשנות שלי לאירוע כולו ואענה על שאלה שמטרידה רבים: האם גוגל תצליח לשמור על הרלוונטיות שלה בתחום ה-AI?

הכרזות

לפני שאנחנו צוללים פנימה לפרשנות, בואו נבחן מה גוגל הכריזה ואיך זה בא לידי ביטוי במוצרים שלהם. אני אדגיש כי אני אעשה הפרדה מלאכותית בין הכרזות שהן יותר "מאחורי הקלעים" – בעיקר מודלי AI וכו' לבין הכרזות שהן יותר פונות לצרכן הממוצע ויגיעו מאוחר יותר השנה כפיצ'רים במוצרי גוגל. למרבה הצער, בחלק גדול של ההכרזות אין יותר מידי פרטים ולכן לא אוכל להרחיב יותר מידי על כל שירות. נתחיל:

מודלים ופרויקטי AI

מודל ה-Gemini 1.5 Pro קיבל שדרוג משמעותי ועכשיו מגיע עם context window של 2 מיליון פרמטרים. חשוב להדגיש כי גוגל כבר עכשיו השיאנית של הפרמטר הזה וכעת היא ממשיכה להוביל בו ולדחוף את הרף עוד יותר למעלה. בפועל זה יאפשר לכם לטעון למודל טקסטים ארוכים יותר, סרטונים ארוכים יותר וכו'. זו באמת בשורה של ממש וגוגל מצליחה לפתוח פער אל מול המתחרים. ההכרזה השנייה סביב המודל שלה גוגל היא Gemini 1.5 Flash, בפועל מדובר על מודל דומה מאוד אבל כזה שמאופטם לעבוד בצורה מהירה ויעילה. המודל יגיע עם context window של מיליון פרמטרים. אנחנו רואים את הקו הזה ממשיך אצל גוגל כמו אצל חברות אחרות, בהן לצד המודל החזק ביותר, משיקים גם מודל מהיר וקליל למי שצריך תשובות מהירות במיוחד.

לצד משפחת Gemini, גוגל עדכנה כי גם משפחת המודלים בקוד פתוח שלה, Gemma, יזכו לעדכון בקרוב וציינה כי בחודשים הקרובים היא תציג את הדור השני של המודלים. לצידם, גוגל הודיעה כי תשיק מודל ייחודי עם דגש על תחום הראייה הממוחשבת בשם PaliGemma. באופן הזה אנחנו רואים את המחויבות של גוגל להמשיך ולתמוך בקהילת הקוד הפתוח ולשחרר מודלים נוספים לציבור. המודלים הקודמים לא הצליחו להשאיר חותם משמעותי מידי, אך כל תוספת בתחום היא מבורכת.

אך כאן גוגל לא סיימה והמשיכה לעדכון במספר פרויקטים חדשים. הראשון היה המודל Imagen 3 – מודל גינרנוט התמונות של גוגל, שעכשיו אמור להיות מדויק יותר ועם יכולות כתיבת טקסט ארוך משופרת. גוגל גם חשפה מודל חדש לחלוטין בשם Veo שיכול ליצור סרטונים של דקה ברזולוציה של 1080p, באופן שדומה מאוד לפתרון של OpenAI בשם Sora. עוד מוקדם לדעת מתי שני המודלים האלה יראו אור, אבל נראה כי הם נמצאים בשלבי פיתוח מתקדמים מאוד.

יכולות AI במוצרים

לאחר ההכרזות על מודלים חדשים, גוגל חשפה כמה פיצ'רים חדשים ביכולות של האפליקציה של Gemini וכמה יכולות חדשות באפליקציות האירגוניות של החברה. ההדגמה המרשימה ביותר הייתה של פרויקט Astra בו הציגה החברה, סוכן חכם שיודע לנתח בזמן אמת את האוביקטים שמוצגים לו ובסטרים קבוע ורצוף של שיחה, יכול להתייחס לאלמנטים שונים בה וגם לזכור קטעים שכבר היו בסשן הספציפי. ללא ספק, אחת מההדגמות המדהימות ביותר באותו הערב.

צוץ תראה, מודל מולטי מודלטי בזמן אמת שמבין מה קורה מסביבו ועם זיכרון משלנו! pic.twitter.com/De17rvzoDA

— Uri Eliabayev (@urieli17) May 14, 2024

האירוע עצמו כלל עוד הרבה הכרזות קטנות יותר שאמורות לאפשר לכם להכניס את המודלים המתקדמים של גוגל כחלק אינטגרלי מהעבודה שלכם או מהשימוש בסמארטפון. מגוון רחב של פיצ'רים אפשרו פשוט לגרום ל-AI של גוגל להיות נוכח בכל דקה ודקה מזמנכם. החל מ "AI teammates" שתוכלו להוסיף לארגון והם יעזרו לכם במשימות שונות ועד לאפליקציה של Gemini של גוגל לאנדרואיד שתוכל להבין מה קורה במסך שלכם ולתת לך תובנות שקשורות למה שאתם עושים עכשיו.

פרשנות

אחרי שסיימנו עם הדיווח ה"יבש", הגיע הזמן לדבר קצת על הרבדים העמוקים יותר של האירוע ועל מה ניסתה גוגל להציג לנו באותו ערב. יצאתי מהאירוע של גוגל עם רגשות מעורבים לגבי הפיתוחים שלה והבשורה שלה בתחום ה-AI. מצד אחד, היא הציגה פריצות דרך משמעותיות שגורמות לכולנו להבין למה היא שחקנית כל כך חשובה בתחום. ה- context window של 2 מיליון פרמטרים, פרויקט Astra, מודל Veo ועוד פיתוחים רבים הם במאת חוד החנית של המחקר בתחום. הבעיה באירוע הייתה שהוא הרגיש עמוס מידי. זה נראה כאילו גוגל הרגישה שהיא חייבת להציג כמה שיותר דברים, בכמה שיותר מחלקות ועם כמה שיותר AI.

הראייה הכי טובה שלהם היא המודל Gemini Nano, מודל שהוצג בשנה שעברה שכל הייחודיות שלו היא שמדובר על מודל קטן שרץ לוקלית על המכשיר. מודל חזק ומהיר שלא מצריך חיבור לרשת ויכול לרוץ בצורה מאובטחת אצלכם. בשורה שכזו הייתה מקבלת את הכותרת הראשית באירוע הכרזה של אפל ולא נדחפת לרבע האחרון של האירוע כמו במקרה של גוגל. שלא נדבר על ההדגמות המסורבלות והמקרי הבוחן הלא תמיד ברורים שגוגל הציגה כדי להסביר לנו על יכולות ה-AI שלה. בחלק מהדמויים הלכתי לאיבוד ולא בהכרח הבנתי מה רצו להדגים או איך זה מתחבר לתמונה הגדולה יותר. היה טוב אם גוגל הייתה מצמצמת את האירוע, מרכזת לפחות 10 הכרזות קריטיות ועליהן שמה את הפוקוס. תפסת מרובה לא תפסת קלאסי.

ועוד דבר אחד: אחת המילים שחזרו הכי הרבה באירוע (121 פעמים) היא AI. זה בסדר והגיוני. אבל אני חושב שהצמד מילים הבא בתור הוא "Later this year". כלומר, גוגל חשפה כל כך הרבה דברים שאנחנו פשוט לא יודעים מתי הם יגיעו. הם יכולים להגיע עוד חודש אבל גם עוד חצי שנה או אף יותר. הם יכולים גם לא להגיע אף פעם כמו שלמדנו לא מעט פעמים מענקית החיפוש. גוגל שמה לנו ציפיות כל כך גבוהות בהכרזה אבל בפועל, עד שהמשתמש זוכה ממש להתנסות עם הכלים האלה עובר כל כך הרבה זמן. אני רק עכשיו מתחיל להשתמש במודלים שהוצגו בכנס המפתחים הקודם.

וואו, הנה הדמו שהכי אהבתי מהאירוע של גוגל: pic.twitter.com/pHqrN32vk4

— Uri Eliabayev (@urieli17) May 15, 2024

הבעיה הזו חמורה שבעתיים כי גוגל כבר רגישה לעשות את זה שנים. עשיתי היום בבוקר ניסוי קטן: העליתי וידאו של גוגל מכנס המפתחים שלה בה היא מציגה שיחה קוהרנטית בין עוזר AI חכם לבין מסעדה, בה העוזר AI צריך להזמין מקום. הפיד שלי ישר התמלא בהרבה תגובות נפעמות והתרשמות של ממש מהיכולות של גוגל. הבעיה? זה וידאו מ2018. זה שירות Duplex של גוגל שהוצג לפני שש שנים ולצערי לא הצליח להמריא מאז. וזו רק הדגמה אחת, הייתי יכול לשזור בציוץ המקורי עוד הרבה דוגמאות נוספות מאירועי Google I/O הקודמים ולא בהכרח הייתם יודעים אם זה חדש או משהו שהוכרז לפני כמה שנים.

סיכום

גוגל נמצאת במצב לימבו מאוד לא ברור: מצד אחד היא מצליחה להגיע לתוצאות מרשימות בתחום ה-AI. הפיתוחים שהיא מוציאה תחתיה מצליחים להגיע להישגים מרשימים. אפילו ציינתי שהמודל שלהם, AlphaFold 3, כנראה יזכה את כל הצוות שם בנובל מרוב שהוא חשוב כל כך לאנושות. מנגד, אנחנו רואים את גוגל מתקשה להדביק את התחרות ביכולת שלה להשיק מוצרים מהר ולעטוף אותם לכדי פיצ'רים קונקרטיים ופועלים במוצריה השונים.

אם גוגל רוצה לשמור על ההובלה שלה בתחום, היא חייבת להתפקס ולהחליט כיצד היא פועלת בשנים הקרובות. אני רואה כבר שחברות רבות בוחרות בפתרונות AI של המתחרות ולא בהכרח של גוגל. או מנגד, פיצ'רים שכבר זמינים זמן רב אצל שחקניות אחרות, הוכרזו רק לאחרונה אצל גוגל ועוד טרם ידוע מתי יגיעו כמו שצריך. אני מקווה שכנס המפתחים הבא של החברה, יהיה ממוקד ופרקטי יותר. בלי "עוד כמה חודשים" או בלי "בהמשך השנה" – בעולם של ה-AI זה אומר שכבר פספסת את הרכבת.

הפוסט נכתב על ידי

אורי אליאבייב

אורי אליאבייב הוא מייסד קהילת MDLI ויועץ בתחום הבינה המלאכותית אשר מסייע לגופים רבים לאמץ אסטרגיית AI. לצד זאת אורי הוא מרצה מנוסה המעביר הרצאות וסדנאות בהן הוא מנגיש את נושא ה-AI לקהל הרחב.

עוד בנושא:

AI Edge: תובנות מעמיקות משיחה עם האראלד קרוגר מ-SiMa.AI על עתיד ה-AI בקצה

כללי

סיכום אירוע Google I/O 2024 – כל ההכרזות (והפרשנות) במקום אחד

הכרזות

מודלים ופרויקטי AI

יכולות AI במוצרים

פרשנות

סיכום

AI Edge: תובנות מעמיקות משיחה עם האראלד קרוגר מ-SiMa.AI על עתיד ה-AI בקצה

סקירה: Jetson Orin Nano – מחשב העל הקטן של אנוודיה

לקראת GTC 2025- אלו ההרצאות שלא תרצו לפספס!