גוגל השיקה את גרסאות הבטא של Cloud Natural Language API ו-Cloud Speech API

מאת אורי אליאבייב, 21 ביולי 2016

גוגל השיקה אתמול בערב (ד') שני שירותים חדשים, Cloud Natural Language API ו-Cloud Speech API, אשר יצטרפו לארסנל הכלים שמציעה החברה כחלק מ-Google Cloud Platform. כפי שניתן להבין משמם, שני ה-API-ים החדשים סובבים בעיקר סביב אלמנטים בתחום השפה ועתידים לסייע לחברות ליצור אינטראקציות מבוססות שיחה בצורה טובה יותר.

Cloud Natural Language API

הכלי החדש, ואולי המסקרן ביותר מבין השניים, הוא Cloud Natural Language API המאפשר למפתחים להבין בצורה עמוקה יותר את הטקסט אותו הם בוחנים ואף לגזור את המשמעויות הנסתרות העולות ממנו. גוגל ציידה את ה-API החדש בכמה יכולות מעניינות במיוחד שיכולות כבר עכשיו להועיל ללא מעט עסקים וחברות טכנולוגיה שונות.

Sentiment Analysis: הבנה כללית של המשמעות הנרחבת של הטקסט שהוזן. אפשרות זו תעניק למפתחים הבנה מהירה, אך יחסית שטחית, של הנושאים הכללים בפסקה כזו או אחרת. מידע זה יכול לעזור להם בסיווג הטקסט והקצאתו לגורמים רלוונטיים (טיפול בפניות, לידים בתחום המכירות ועוד). יתרה מכך, כפי שניתן לראות בהדגמה המצורפת, Sentiment Analysis אף תעניק ציון למידת החיוביות או השליליות של הטקסט מה שיאפשר קבלת החלטות מהירה יותר על ידי הגוף האמון על ניתוח הטקסט.

Cloud Natural Language API 1

Entity Recognition: פירוק הטקסט לישויות נפרדות, אותן ניתן לקטלג לפי קטגוריות שונות כגון אדם, ארגון, מיקום, אירוע, מוצר, מדיה ועוד. אין צורך להסביר עד כמה חלק זה משמעותי ובעל אינספור מימושים אפשריים. מעבר לכך, חלק זה יכול לחולל מהפכה של ממש בתחום אחר שצובר תאוצה לאחרונה: בוטים. היכולת לפרק משפטים שלמים לכדי ישויות נפרדות תהווה זריקת מרץ למפתחים בתחום אשר עכשיו יכולים להבין בצורה עמוקה יותר את הדו שיח שמתנהל בין המשתמש לבוט.

Cloud Natural Language API
Syntax Analysis: זיהוי חלקי המשפט וניתוח מורכב של היחסים ביניהם לטובת פירוש והבנה של הטקסט. החלק האחרון מחזיר אותנו שנים אחורה לבגרות בלשון בו היינו צריכים לפרק את המשפט כולו ולהבין את התפקיד של כל מילה ומילה בו. כעת, גוגל מאפשרת לעשות את זה בצורה אוטומטית וברמה מרשימה למדי. היכולת החדשה תאפשר לקבל תמונה מקיפה ומלאה של הטקסט והמסרים שמועברים בו, וכפועל יוצא מכך לבצע החלטות עסקיות שונות על סמך המידע המפולטר.

Cloud Natural Language API 2

נכון לכתיבת שורות אלה, Cloud Natural Language API תומך בשלוש שפות בלבד: אנגלית, ספרדית ויפנית. כמו כן, חשוב לזכור כי גוגל ציינה כי ה-API נמצא עודנו בשלב בטא כך שעליכם לצפות שלא הכל יעבוד חלק. והמחיר? בטבלה המצורפת:

image-3

לקריאה נוספת: עד כמה Machine Learning הוא חלק בלתי נפרד מגוגל? 

Cloud Speech API

הכלי השני שהשיקה גוגל בגרסת בטא פתוחה לשימוש הוא Cloud Speech API, בעזרתו יוכלו ארגונים ומפתחי אפליקציות להמיר דיבור לטקסט ביותר משמונים שפות. Cloud Speech API מתבסס על טכנולוגיית זיהוי הדיבור של גוגל, המוכרת למיליוני המשתמשים ב-Google Search ו-Google Now ברחבי העולם. גם במקרה זה גוגל כללה ב-API כמה יכולות מעניינות למדי:

Word hints: אפשרות להוסיף ל-API מילים או ביטויים תלויי הקשר, במטרה לשפר את יכולות הזיהוי. יכולת זו שימושית במיוחד לתרחישי פקודות (למשל טלוויזיה חכמה המקבלת פקודה קולית של "תריץ קדימה" או "תריץ אחורה") ולהוספת מילים חדשות למילון (כמו שמות פרטיים שנפוצים רק בשפה או במדינה אחת). יכולת חדשה זו תאפשר למערכות העושות שימוש ב-Speech API להיות מודולריות יותר ולהתאים את עצמן לשוק ולשפה בהן הן פועלות.

speech API

Noise Robustness: התמודדות עם אודיו מורעש ללא הצורך בהיערכויות נוספות. כולנו מבינים כי מרבית המשתמשים לא נמצאים תמיד בסביבה שקטה ובמקרה זה גוגל מבטיחה כי השירות החדש שלה ידע להתמודד גם עם רעשי רקע.

Streaming Recognition: ביצוע תמלול של הטקסט בזמן אמת כאשר המשתמש עוד מדבר. אפשרות זו מוכרת לנו היטב משירות ה-Google Now ומעתה היא זמינה לכלל המפתחים. יכולת זו תעניק אינדיקציה טובה יותר למשתמש האם קולו הובן כראוי ואף תקצר את משך הפעולה מאחר והתמלול מתבצע בזמן אמת ולא רק לאחר סוף הדיבור.

כמובן שמיותר לציין עד כמה הכלים החדשים מתבססים באופן נרחב ועמוק על Machine Learning ו-Deep Learning – עובדה שמצוינת לאורך כל ההכרזה של גוגל. לקינוח, אי אפשר לדבר על ניתוח טקסט מבלי להציג את הפיתוח הדומה שהציגה פייסבוק לפני מספר שבועות: Deeptext. נכון, לא מדובר על שירות ענן הפתוח לכולם, אך ניכר כי ישנה תחרות חימוש מאוד רצינית בין החברות בתחום ולא רחוק היום בו גם פייסבוק תפתח את השירות שלה לקהל הרחב.

כדי ללמוד עוד על השירותים שנחשפו אתמול, בקרו בקישורים של Cloud Speech API ושל Cloud Natural Language באתר גוגל.

רוצים עוד מאיפה שזה הגיע? הצטרפו לניוזלטר שלנו דרך הקישור הבא.