close menu

סיכום אירוע האביב של OpenAI – כל ההכרזות (והפרשנות) במקום אחד

חברת OpenAI קיימה לפני זמן קצר את אירוע Spring Update שלה בה חשפה כמה שדרוגים חשובים שיגיעו לממשק המשתמש שלה, לצד מודל חדש בשם GPT4o שיגיע לקהל הרחב. אני ארכז לכם את כל ההכרזות החשובות שיצאו מהאירוע הזה וכמובן, פרשנות מעמיקה למהלכים של OpenAI ואיך זה מתכתב עם התחרות שיש בשוק.

ChatGPT למחשב

ההכרזה הראשונה של האירוע הייתה אפליקצית ChatGPT למחשב. השירות, שעד כה היה זמין בגרסת הדפדפן בלבד, מגיע למחשב כאפליקציה שאפשר להריץ ללא תלות בדפדפן. על פניו לא מדובר על בשורה של ממש, אך בהמשך האירוע הם הסבירו מדוע מדובר על פיצ'ר חשוב מאוד. אם עד כה ChatGPT לא יכל באמת להבין מה אנחנו עושים בזמן שאנחנו עובדים במחשב, כעת ניתן לשתף איתו מסך ולגרום לו "לראות" מה שאנחנו רואים. באופן הזה, אתם יכולים להציג לו גרף שאתם עובדים עליו ולבקש ממנו הסברים עליו, או להציג לו מייל שאתם מתלבטים איך לעבוד להשיב לו והוא כבר יעזור לכם. היכולת הזו הולכת יד ביד עם השיפור ביכולת לנהל שיחה קולית, מה שביחד מאפשר לכם לקיים פשוט שיחה קלילה ורציפה על כל מה שאתם עושים במחשב.

מה שמיוחד בפיצ'ר הזה הוא שיאפשר לכם לשלב את ChatGPT באופן אינהרנטי בעשייה שלכם. לא צריך יותר לעשות העתק הדבק, לא צריך לצאת לדפדפן ואז לחזור שוב לתוכנה שאתם עובדים איתה. לכאורה, מעכשיו תוכלו פשוט לגרום ל-ChatGPT לקחת חלק פעיל בשגרה שלכם ולהשתמש בו בכל סיטואציה באשר היא. אם הפיצ'ר הזה אכן עובד כמו שהוא מתיימר, יש פה בשורה של ממש ואלמנט שעלול להקפיץ את קצב השימוש בשירות ולפתוח צוהר לשימושים חדשים. כמובן גם OpenAI תהנה מסטרים בלתי נגמר של דאטה איכותי, בו היא לומדת איך אתם עובדים, מה סדר הפעולות שלכם והכי חשוב: איך דברים נראים באמת שאתם מנסים לפתור בעיה.

GPT4o

ההכרזה השנייה להערב, והחשובה ביותר, היא המודל החדש בשם GPT4o. אז מה זה המודל הזה? בפועל, מדובר על המודל הטוב והמוכר GPT4 אבל עכשיו בגרסה שפתוחה לקהל הרחב בחינם. עד כה המשתמשים החינם יכלו להשתמש רק ב ChatGPT 3.5 ועכשיו כולם יקבלו מודל חדש וחזק יותר. תוכלו לנתח קבצים, להינות מיכולות הנמקה מתקדמות, לשלוח תמונות לניתוח ואפילו להשתמש בפיצ'ר שהכורז ממש לאחרונה המאפשר "זיכרון" בשיחה. ועוד משהו חשוב: עכשיו ה-GPT store פתוחה לכולם וכל משתמש יוכל לגשת לכל הGPT שנבנו על ידי מפתחים חיצוניים.

לההכרזה הזו יש כמה רבדים עמוקים ואנסה לעשות בהם סדר. קודם כל מדובר על קפיצת מדרגה מבחינת היכולת של OpenAI להישאר תחרותית אל מול התחרות העולה. מתן גישה לאחד המודלים החזקים ביותר שומר על הרלוונטיות שלה ומאפשר לכל משתמש לקבל משהו שעד כה היה תחת חומת תשלום. מעבר לכך, מדובר על פייפלין חדש של דאטה שהם צריכים כדי להמשיך לשפר את המודלים שלהם. אם עד כה המשתמשי החינמים שפכו למאגר המידע רק טקסט, עכשיו הם ישפכו כל כך הרבה מידע נוסף ומגוון (קבצים, אודיו, תמונות ועוד) מה שיעניק ל-OpenAI בוסט רציני לקראת המודל הבא שלהם.

וישנו עוד רובד נוסף – היכולת להנגיש מודל שכזה מבלי לשבור את הכיס. זה לא סוד שOpenAI שופכת הרבה כסף כדי לגרום למודלים האלה לעבוד ולהיות זמינים לכלל. גם ה-GPT4 שהיה זמין עד כה בגרסה בתשלום היה מוגבל בכמות ההודעות. עצם העובדה שהם משחררים מודל שכזה בצורה חופשית אומר שהם הצליחו להתגבר על לא מעט אתגרים הנדסיים קריטים מאפשר לכל זה להיות הגיוני בכלל ברמה הכלכלית. הספוקלנטים יגידו שזה קשור למודל המסתורי GPT2 שהגיח לחיים שלנו לפני כמה שבועות, אשר הציג יכולות מתקדמות. אנחנו יכולים לנחש כי OpenAI הצליחה להגיע למודל חזק מאוד, אבל קטן בהרבה מה-GPT4 המקורי. אם זה אכן נכון מדובר פה על הישג מטורף שלהם. לגרום למודל קל ורזה להגיע ליכולות שעד לפני שנה וקצת נחשבו דמיוניות זה מקור גאוה עצום עבורם.

אני כנראה אכתוב עוד הרבה על המודל הזה ברגע שהוא יגיע לכולם (אמור לצאת בשבועות הקרובים) אבל נראה שGPT4o ישאיר חותם ויאלץ את כל המתחרות להתיישר בהתאם ולהציע מודלים חזקים (ומולטימודאלים) באופן זול ונגיש. לשמחתנו, המודל יהיה זמין גם עבור מתפתחים ב-API מה שאומר שמעכשיו יהיה אפשר לבנות דברים מרתקים עם כל היכולות האלה – וכל זה במחיר נמוך יותר המחיר הקיים. הולך להיות מעניין.

יכולות שיחה מתקדמות

ההכרזה השלישית, שנסבה בעיקר סביב הדמו, היא היכולות לקיים שיחה קולחת ורציפה עם המשתמש ולדבר בטון מאוד אנושי. אני ממליץ לכם פשוט לצפות בדמו, אבל בגדול דמיינו שיחה שדומה מאוד לזו שהייתם מקיימים עם בן אדם. אתם יכולים להפריע באמצע לבקש מה שבא לכם בשפה חופשית ופשוט לדבר. אם זה לא מספיק, תוכלו לשתף מסך ולהראות לו מה שאתם רואים והוא ידע להגיב בהתאם.

מה שמרשים היה בההדגמה היו יכולות ההנמקה והפירוט שלב אחר שלב בכל סוגיה ושאלה. בדמו הוצגה היכולת לפתור משוואות וה-ChatGPT שמריץ את GPT4o ידע להסביר את עצמו בצורה ברורה וקוהרנטית. מי שמכיר את מאחורי הקלעים של התחום, יודע כמה היכולות הזו קריטית ומעידה על הבגרות של המודל. אני מניח שהקהילה המדעית תיקח את היכולות הזו לקצה ותבחן אותה בהרבה מקרי קצה וקושיות שונות.

הדמו הציג גם תרגום בלייב בין שפות (כולל דיבור על ChatGPT באיטלקית), ניתוח סלפי והבנה של מצב הרוח והרגשות של הדובר ועוד אתגרים שונים המשלבים טקסט, תמונה ואודיו. הוואו אפקט האמיתי בדמו היה נעוץ בעובדה שהכל היה בזמן אמת. בלי דיליי, בלי השתהויות. הכל רציף ומהיר בלי עצירה אחת. לפעמים זה היה מהיר מידי והמודל פשוט התפרץ לשיחה כי חשב שהוא הבין מה רצו ממני. זה היה מאוד משעשע. היכולת לגרום לכל הטוב הזה לרוץ בזמן אמת ולסמלץ שיחה אמיתית היה גולת הכותרת של הדמו. עד לא מזמן כעסנו על חברה אחרת שלכאורה הראתה יכולות כאלה ובפועל מדובר היה על סרטון ערוך, והנה עכשיו אנחנו רואים זה במו עיניינו בלייב.

סיכום

לסיכום, היה אירוע קצר וקולע של OpenAI. לא היו הכרזות על מנוע חיפוש חדש או על GPT5. נטו עדכון מודל וסט יכולות חדשות. אם המודל החדש והחינמי אכן טוב כמו שהם הדגימו, מדובר על נקודה מכרעת בציר הזמן של ה-AI. מתן גישה לכלי הזה באופן חופשי הן למשתמשים והן למפתחים יכול להצעיד אותנו לאימוץ נרחב יותר של הטכנולוגיה ולצד זאת שורת פיתוחים שטרם ראינו. עכשיו נותר לראות כיצד המתחרות יגיבו והאם יצליחו להדביק את הפער אל מול ההכרזה הגדולה של OpenAI.

 

עוד בנושא: