מתלבטים לגבי ניסוחים באנגלית? התוסף הזה של AI21 Labs יפתור לכם את הבעיות

מאת אורי אליאבייב, 17 בנובמבר 2020

הירשמו לערוץ יוטיוב שלנו!

כל הסרטונים מאירועי הקהילה

תחום עיבוד השפה הטבעית (NLP), על אף היותו ותיק מאוד, יצר הרבה כותרות בשנה האחרונה הודות לפריצות דרך של צוותי מחקר רבים בעולם. פריצות דרך אלה יצרו מודלים מדויקים אשר מצליחים להצטיין בצורה מרשימה למדי במגוון רחב של משימות ומבחנים. על אף כל ההתקדמות הרבה שנעשתה בתחום, ישנו קושי מהותי לקחת את הפיתוחים שנעשו במעבדה ולהמירם למוצרים מוגמרים שיכולים לשרת את הקהל הרחב. זו בעיה נפוצה בעולם ה-ML, אך בתחום חמקמק כמו השפה האנושית נראה כי מדובר על משימה קשה אף יותר. עם כל זאת, לפני כמה שבועות השיקה חברת AI21 Labs הישראלית מוצר חדש בשם "Wordtune" אשר נראה כי מצליח לשלב בין שני העולמות: מודלי שפה איכותיים לצד מוצר צרכני ברמה גבוהה.

מדובר בתוסף לדפדפן אשר מסייע לכם לשפר את האנגלית. חשוב להדגיש: המטרה העיקרית שלו היא לא לתקן שגיאות כתיב או לזהות טעויות הקלדה – מטרתו היא לסייע למשתמש לכתוב טקסט ברמה גבוהה יותר. דמיינו שיש לכם עורך צמוד שאתם יכולים להתייעץ איתו בסוגיות שונות: כיצד לכתוב את הטקסט בצורה רשמית יותר, איך להשתמש בביטוי מסוים, איך לקצר משפט ארוך כדי שיהיה נהיר יותר וכו'. כל אחד מאותם פיצ'רים הוא משימה לא פשוטה בתחום ה-NLP, כזאת שנחקרת על ידי חוקרים רבים מגופי מחקר שונים. בשבועות האחרונים, גם לפני ההשקה הרשמית, יצא לי להשתמש ב-Wordtune במגוון רחב של מקרים (כתיבת מיילים, ניוזלטרים, הצעות מחיר ועוד) ואני חייב לציין שהכלי הזה השאיר אצלי חותם לא קטן.

לאחר ההתקנה הפשוטה מהחנות של כרום, Wordtune בעצם מתלבש על כל תיבת טקסט עליה אתם עובדים – מפוסט פשוט בפייסבוק ועד מייל רשמי מהעבודה. ברגע שאתם מתחילים לכתוב באנגלית, התוסף נכנס לפעולה ומסמן עבורכם מילים שהוא יכול למצוא להן תחליפים מתאימים. זה הפיצ'ר הכי פשוט שלו – הפיצ'רים המתקדמים יותר, ויש לא מעט כאלה, עוסקים ביכולות של Wordtune לעזור לכם להתנסח בצורה טובה יותר. אחד מאותם פיצ'רים הוא היכולת לכתוב את אותו משפט בדיוק בצורה רשמית או קלילה, כאשר כל מה שצריך לעשות הוא לסמן את המשפט ולתת ל-Wordtune לחשוב על ניסוחים אחרים. לאחר כמה שניות תופיע תיבה קטנה לצד המשפט עם ניסוחים שונים, כאשר כל שינוי משמעותי ייצבע בסגול וידגיש בפניכם את ההמלצה של Wordtune.

הפיצ'ר הזה נשמע אולי חביב ותו לא, אך מצאתי את עצמי מתמכר אליו. בכל מייל שהיה לי חשוב באמת, העברתי את המשפטים העיקריים דרך Wordtune – והתוצאות היו מאוד מרשימות. מה שייחודי ב-Wordtune הוא הדרך שבה הוא עוזר לך להתנסח. בשונה מפתרונות אחרים בתחום, Wordtune לא משנה את כל המהות של המשפט וגורם לו להישמע בטון אחר, אלא פשוט לוקח את מה שניסית להגיד וכותב אותו באופן ברור וקוהרנטי יותר. בלא מעט מהמקרים, אחרי בחירה בניסוח של Wordtune, חשבתי לעצמי שזה בדיוק מה שרציתי להגיד אבל לא באמת הצלחתי לבטא בצורה טובה.

את התחושה הנ"ל כנראה שחווה כל אדם שאנגלית היא לא שפת האם שלו. הכלי של Wordtune אולי לא יעזור לכם לכתוב מאפס או אם אין לכם הבנה באנגלית כלל, אבל הוא כן יצליח לעזור לכם להתנסח בצורה מאוד טובה בהנחה שיש לכם אנגלית ברמה טובה. מעל כל זה, הניסוחים של Wordtune נשמעים טבעיים יותר ופחות כמו תרגום סימולטני. בעקבות ניתוח כמויות גדולות של טקסטים, Wordtune יכול להבין מה הדרך הנפוצה להעביר את המסר שאתם רוצים וכך להציע לכם מספר דרכים תקינות ונפוצות לעשות זאת.

עוד פיצ'ר שיכול לסייע מאוד למי שדובר אנגלית ברמה גבוהה אבל לא ברמת שפת אם, הוא הפיצ'ר שבודק את התקינות של ביטויים במשפט. פעמים רבות אנחנו עושים שימוש בביטויים או פתגמים שאנחנו מכירים בשפה שלנו אך לא בטוחים אם הם קיימים באנגלית. אם עד כה היינו צריכים לבדוק בגוגל ולנסות להיזכר בניסוח של הביטוי באנגלית, הרי שעם Wordtune כל שצריך לעשות הוא לסמן את הביטוי (שפעמים רבות יסומן לבד בזכות המודל של AI21), והוא ידע כבר להגיד לכם אם הוא תקין או לא. מה שיפה בתהליך האימות הוא שאתם תוכלו לראות דוגמאות לשימוש בביטוי מאתרי חדשות מכל העולם, מה שיעניק לכם יותר ביטחון לגבי אופי השימוש הנכון בו.

אלה שני הפיצ'רים העיקריים שאני אהבתי, אך Wordtune כולל עוד יכולות רבות ואני מניח כי פיצ'רים נוספים ייחשפו בשבועות הקרובים. מעטים המוצרים שבאמת מצליחים להפוך להיות חלק אינטגרלי מתהליך הכתיבה שלי, ו-Wordtune הצליח לעשות את זה בצורה חלקה למדי.

להביא ערך מסחרי

כדי להבין כיצד חברה ישראלית יחסית קטנה הצליחה ליצור מוצר כזה, צריך להסתכל על מי שייסד אותה ומי דמויות המפתח בה. החברה הוקמה בשנת 2017 על ידי פרופסור יואב שוהם ואורי גושן – כל אחד מהם הגיע עם ניסיון רב בתחום ולפחות אקזיט אחד באמתחתו. לצד זאת, בין המשקיעים בחברה אפשר למצוא דמויות מוכרות למדי כמו פרופסור אמנון שעשוע (מייסד-שותף ויו"ר) וקרן פיטנגו. כדי ללמוד קצת יותר על Wordtune ולהבין את האתגרים איתם הם התמודדו, קיימתי ראיון עם גושן, מנכ"ל AI21 Labs.

תחום ניתוח השפה צבר הרבה כותרות לאחרונה, אך עם זאת מעטים הצליחו לקחת את המודלים מהמעבדה ולהפוך אותם למוצרים של ממש. נראה שהצלחתם לפצח זאת – מה לפי דעתך מייחד אתכם בהקשר הזה מהמתחרים?

"כשהקמנו את החברה, הצבנו לעצמנו את היעד לפתח טכנולוגיה עמוקה לפחות כמו במעבדות המובילות בעולם, אבל גם להביא ערך מסחרי משמעותי. בנינו צוות שמשלב בין מדע עמוק והבנה מוצרית. השילוב הזה מאפשר לנו לזהות בעיות יסודיות של מודלי המעבדה ולפתח מודלים חדשניים מותאמים יותר למשימות מוכוונות מוצר שימושי. הקבוצה שבנינו כוללת מצד אחד עומק ברמה של המעבדות המובילות בעולם, ומצד שני גמישות, זריזות ומיקוד של סטארט אפ. סטנפורד ו-8200 בקבוצה אחת".

איך סטארטאפ קטן יחסית יכול להתחרות במשאבים של ענקיות הטכנולוגיה, וכיצד הצלחתם לשלב מודלים שלכם במוצר הסופי?

"התפיסה שלנו אומרת שהגודל כן קובע אבל הוא לא חזות הכל. החברה הוקמה על בסיס הרעיון שהשלב הבא של AI הוא שילוב של סמנטיקה וייצוג ידע מפורש עם טכניקות לימוד מכונה. מעבר לכך שהגישה מאפשרת יכולות חדשות ומשפרת את אמינותם של המודלים בביצוע משימות, כתופעת לוואי ניתן לבצע פעולות חישוביות בצורה יעילה יותר ובכך להקטין את הצורך במשאבים אינסופיים. כמובן שבסוף עדיין נדרשנו להשקיע משאבים לא מבוטלים בבניית המודלים, ולמזלנו יש לנו את האמצעים לכך".

שפה היא דבר חי אשר משתנה בצורה רציפה – כיצד אתם מתמודדים עם זה והאם ישנה למידה מתמשכת, הן ברמת המשתמש הבודד והן ברמת המערכת כולה?

"יש כאן שתי סוגיות קשורות אך נפרדות. הראשונה היא עדכון מודלי השפה: מעבר לכך שיש לבצע אימון מתמשך וגם אותו לבצע בצורה יעילה, אנחנו מצפים מהמודלים להכליל בצורה טובה מה שיאפשר להם להבין קונספט גם אם הוא לא נצפה בתהליך האימון. קח למשל את המילה 'קורונה'. היית מצפה שמערכת טובה תבין שקורונה זו מחלה גם אם זאת הפעם הראשונה שהיא נתקלת במילה הזו. אחד המודלים שפרסמנו (SenseBERT, א"א) תוכנן בדיוק בשביל זה. זהו מודל שפה שמטרתו היא לא רק לחזות מילה מוסתרת בטקסט נתון, אלה גם לחזות את המובן (Sense) של המילה. הסגויה השניה היא התאמה אישית ברמת המשתמש: כרגע היא לא קיימת במערכת שלנו, ומעבר לזה שיש לנו תוכניות בנושא אני לא יכול להרחיב".

"מדובר על אוסף מודלים אשר מספקים מענה לצרכים שונים, ושכבת אינטיליגנציה מעל המאפשרת לפסול ולמיין תוצאות בצורה חכמה. אותה שכבה היא אחד הגורמים שעושים את ההבדל בין דמו לבין מוצר שימושי ומועיל".

מה החזון שלכם? היכן אתם רואים את המוצר בשנים הקרובות והאם נראה מוצרים נוספים שלכם בתחום השפה בעתיד הקרוב?

"החזון שלנו הוא לשנות את הדרך שבה אנחנו קוראים וכותבים, לא פחות. בוא ניקח כתיבה למשל – היום אנחנו עדיין מממשים את החזון של מנהל מוצר ממיקרוסופט משנות ה-80. זהו תיאור מוגזם כמובן, אנחנו רואים ניצנים של בינה מלאכותית בתהליך כמו תיקוני איות ודקדוק, וגם השלמות אוטומטיות, אבל כל אלה לא באמת משנים בצורה יסודית את הדרך שבה אנחנו כותבים. אנחנו מאמינים שיש הזדמנות לשלב בינה מלאכותית בצורה עמוקה, כזאת שתהפוך את המכונה לשותפה בתהליך (co-writer) לעומת עוזר עריכה (copy-editor) שבעיקר מתקן שגיאות ומבצע עריכות מקומיות. Wordtune הוא המוצר הראשון שהשקנו, והוא בהחלט אבן דרך ראשונה בדרך להגשמת החזון הענק הזה".

הצטרפו לערוץ הטלגרם שלנו!

כל ההודעות שאתם לא רוצים לפספס

X