כתבות מאת אורי אליאבייב

הכתבה בשיתוף Toloka

קשה שלא להבחין בגידול המשמעותי של צוותי המחקר בתחום ה-ML בשנים האחרונות. צוותים אלו עושים שימוש רחב בדאטה שיש בארגון כדי לפתח מודלים שייסיעו בצמיחה ובגדילה של אותו ארגון. אלמנט מאוד משמעותי בעבודה עם דאטה הוא הצורך לתייג אותו ולהכין אותו כשורה לאימון המודל. כפועל יוצא מכך, תהליך ארגון ותיוג הדאטה בארגונים השונים מקבל חשיבות רבה בתקופה האחרונה. חברות מבינות את הצורך בלהעניק מקום של כבוד לשלב הזה בכל תהליך אימון המודלים – מה שלא תמיד היה נהוג בעבר.

כדי ללמוד על הנושא הזה יותר ולהבין כיצד חברות ניגשות לסוגיה הזו, החלטנו לקיים ראיון עם אולגה מגורסקאיה (Olga Megorskaya), המנכ"לית של חברת Toloka AI – אחת מחברות תיוג הדאטה הצומחות בתחום. בראיון גם נכיר גם את הגישה של Toloka לכל תהליך תיוג הדאטה ואפילו נראה איך העשייה שלהם שזורה בלא מעט פיתוחים, גם בתחום ה-ML, ואיך הם מצליחים לעבוד צמוד גם עם התעשייה וגם עם האקדמיה.

אז עבור מי שלא מכיר, Toloka בעצם פועלת בשני מישורים: הראשון, הוא פיתוח מערכת שלמה המאפשרת לבצע את כל פעולות התיוג והכנת הדאטה במקום אחד. Toloka פיתחה מערכת שמאפשרת תיוג בסקייל גדול מאוד ועם כלים נוספים להערכת איכות הדאטה. 

המישור השני, והמעניין לא פחות, הוא הרשת הענפה של מתייגים הפרושים בכל העולם שיודעים לתת מענה לצרכי תיוג שונים ומגוונים. Toloka מציינת כי יש ברשותה מילוני מתייגים רשומים, כאשר כ-200 אלף מתוכם פעילים ברמה החודשית. השילוב בין מערכת תיוג משומנת היטב וגישה למאות אלפי אנשים בכל רגע נתון, מאפשר להם לקחת פרויקטים בקנה מידה גדל אבל גם לקבל תמונה מאוד מעניינת על השוק בארץ ובעולם.

גישות שונות לתיוג

לכתבה המלאה >>

הכתבה בשיתוף Y-Data

כמידי שנה אנחנו עושים שיתוף פעולה רחב עם Y-DATA, השנה נעסוק בכתבה בשינויים בקורס ונחשוף את מסלול ה-B2B החדש שפונה למעסיקים שרוצים להעניק כישורים נוספים לעובדים שלהם. כבכל שנה, גם הפעם אנחנו מעניקים לכם קוד הנחה ייעודי שיספק לכם 1,000 שקל הנחה ברישום הקורס – הקוד הוא: MDLI22. ניתן להשיג מידע נוסף ולהירשם דרך הלינק הזה (ההרשמה מסתיימת ב-31.7.2022).

עבור אלו שלא מכירים את Y-DATA, נפרט קצת על התוכנית ומה הייחודיות שלה. Y-DATA היא תוכנית לימודים מעמיקה בת 8 חודשים שמקנה למשתתפיה ידע וכישורים מקצועיים בתחום מדעי נתונים המאפשרים להם להשתלב בשוק ההייטק הישראלי. התוכנית פונה לשלוש אוכלוסיות עיקריות: – מהנדסי תוכנה או אנליסטים עם רקע טוב בתכנות, בוגרי תארים מתקדמים באקדמיה שהחליטו לעבור לתעשיה ובוגרים טריים של תואר ראשון בהנדסה או מדעי מחשב.

התוכנית פועלת מ2018 והכשירה כבר מעל 200 בוגרים, בינהם מספר רב של מקרי הצלחה וY-DATA מדווחים על כך ש-90 אחוז מהבוגרים שלהם משתלבים בחברות מובילות בתעשייה. אם אתם רוצים מידע נוסף על הקורס שלהם, אני ממליץ לכם לבדוק את כתבות העומק שהכנו עליהם בשלוש שנים האחרונות (כאן, כאן וכאן).

מסלול B2B עבור עובדים בחברות לכתבה המלאה >>

בשבוע האחרון הרשת געשה ורעשה סביב פרסומו של בלייק למויין, מהנדס תוכנה בגוגל, אשר טען כי מודל השפה המתקדם של החברה (LaMDA) פיתח רגשות ומודעות עצמית. הפרסום הוביל להשעייתו מהחברה, ולסקנדל לא קטן.

למויין היה אמון על בדיקת תקינותו של בוט מבוסס LaMDA. הדבר נעשה באמצעות שיח חופשי, שכלל שאלות מאתגרות במיוחד במטרה להבין את גבולות קצה ההבנה שלו. הבדיקות הללו מבקשות לוודא שגוגל אינה משחררת לחופשי מודל שפה שמהדהד שיח לא אתי, גם במקרה שזה מופיע במאגרי המידע שלו. באופן זה אפשר לוודא שהוא לא אנטישמי, מיזוגני או כל דבר אחר שיכול להעסיק שעות נוספות את מחלקת ה-PR של גוגל (כפי שקרה בעבר למיקרוסופט, לצערה הרב).

לכתבה המלאה >>

אנחנו שמחים להזמין אתכם לפרק ה-11 של ExplAInable במתכונת החדשה שלו. הפודקאסט יעסוק במגוון רחב של נושאים בתחום ה-ML ובכל פרק נסקור נושא אחד ספציפי. את הפודקאסט מגישים אורי גורן ותמיר נווה – שנינו יועצים בתחום ה-ML אשר מגיעים מרקעים מגוונים ומעניינים. אם אתם רוצים לשמוע עוד קצת עלינו ועל הפודקאסט החדש, אתם יכולים להאזין לפרק 0 שהכנו שמסביר קצת עלינו ועל מאחורי הקלעים של היוזמה הזו.

אנחנו בימים אלו מתחילים להעלות את הפרקים לכל הפלטפורמות השונות ובינתיים אתם יכולים להגיע אלינו דרך RSSספוטיפיאפל וגם ישירות דרך Podbeanאל תשכחו להירשם כמנויים כדי לא לפספס אף פרק שלנו.
לכתבה המלאה >>

אנחנו שמחים להזמין אתכם לפרק העשירי של ExplAInable במתכונת החדשה שלו. הפודקאסט יעסוק במגוון רחב של נושאים בתחום ה-ML ובכל פרק נסקור נושא אחד ספציפי. את הפודקאסט מגישים אורי גורן ותמיר נווה – שנינו יועצים בתחום ה-ML אשר מגיעים מרקעים מגוונים ומעניינים. אם אתם רוצים לשמוע עוד קצת עלינו ועל הפודקאסט החדש, אתם יכולים להאזין לפרק 0 שהכנו שמסביר קצת עלינו ועל מאחורי הקלעים של היוזמה הזו.

אנחנו בימים אלו מתחילים להעלות את הפרקים לכל הפלטפורמות השונות ובינתיים אתם יכולים להגיע אלינו דרך RSSספוטיפיאפל וגם ישירות דרך Podbeanאל תשכחו להירשם כמנויים כדי לא לפספס אף פרק שלנו.

לכתבה המלאה >>

אנחנו שמחים להזמין אתכם לפרק התשיעי של ExplAInable במתכונת החדשה שלו. הפודקאסט יעסוק במגוון רחב של נושאים בתחום ה-ML ובכל פרק נסקור נושא אחד ספציפי. את הפודקאסט מגישים אורי גורן ותמיר נווה – שנינו יועצים בתחום ה-ML אשר מגיעים מרקעים מגוונים ומעניינים. אם אתם רוצים לשמוע עוד קצת עלינו ועל הפודקאסט החדש, אתם יכולים להאזין לפרק 0 שהכנו שמסביר קצת עלינו ועל מאחורי הקלעים של היוזמה הזו.

אנחנו בימים אלו מתחילים להעלות את הפרקים לכל הפלטפורמות השונות ובינתיים אתם יכולים להגיע אלינו דרך RSSספוטיפיאפל וגם ישירות דרך Podbean. אל תשכחו להירשם כמנויים כדי לא לפספס אף פרק שלנו. לכתבה המלאה >>

אני שמח להזמין אתכם לאירוע השלישי שלנו בסדרת Applied ML seminars שנעשים בשיתוף עם Applied Materials. בכל אירוע מסוג זה, ניקח נושא אחד שמעניין את הקהילה ונדבר עליו בהרחבה מכמה זוויות שונות. באירוע הזה נדבר על מקרה שמאוד נפוץ בקרב חברי הקהילה: מה עושים אם יש לנו טעויות בתיוגים, דאטה מועט או אפילו סתם דאטה לא מאוזן בצורה משמעותית. אלו בעיות שכל אחד נתקל בהם במהלך העבודה שלו ובאירוע זה יהיו לנו שלושה דוברים שידברו על האתגרים האלו בבעיות סגמנטציה (כמובן שניתן ללמוד מזה על עולמות תוכן נוספים).

האירוע יתקיים באופן וירטואלי ב-1.3 בשעה 18:00 ויכלול שלושה דוברים מחברות שונות.

ההקלטה המלאה של האירוע:

לכתבה המלאה >>

אנחנו שמחים להזמין אתכם לפרק התשיעי של ExplAInable במתכונת החדשה שלו. הפודקאסט יעסוק במגוון רחב של נושאים בתחום ה-ML ובכל פרק נסקור נושא אחד ספציפי. את הפודקאסט מגישים אורי גורן ותמיר נווה – שנינו יועצים בתחום ה-ML אשר מגיעים מרקעים מגוונים ומעניינים. אם אתם רוצים לשמוע עוד קצת עלינו ועל הפודקאסט החדש, אתם יכולים להאזין לפרק 0 שהכנו שמסביר קצת עלינו ועל מאחורי הקלעים של היוזמה הזו.

אנחנו בימים אלו מתחילים להעלות את הפרקים לכל הפלטפורמות השונות ובינתיים אתם יכולים להגיע אלינו דרך RSSספוטיפיאפל וגם ישירות דרך Podbean. אל תשכחו להירשם כמנויים כדי לא לפספס אף פרק שלנו.

לכתבה המלאה >>

אנחנו שמחים להזמין אתכם לפרק השמיני של ExplAInable במתכונת החדשה שלו. הפודקאסט יעסוק במגוון רחב של נושאים בתחום ה-ML ובכל פרק נסקור נושא אחד ספציפי. את הפודקאסט מגישים אורי גורן ותמיר נווה – שנינו יועצים בתחום ה-ML אשר מגיעים מרקעים מגוונים ומעניינים. אם אתם רוצים לשמוע עוד קצת עלינו ועל הפודקאסט החדש, אתם יכולים להאזין לפרק 0 שהכנו שמסביר קצת עלינו ועל מאחורי הקלעים של היוזמה הזו.

אנחנו בימים אלו מתחילים להעלות את הפרקים לכל הפלטפורמות השונות ובינתיים אתם יכולים להגיע אלינו דרך RSSספוטיפיאפל וגם ישירות דרך Podbean. אל תשכחו להירשם כמנויים כדי לא לפספס אף פרק שלנו. לכתבה המלאה >>

אנחנו שמחים להזמין אתכם לפרק השביעי של ExplAInable במתכונת החדשה שלו. הפודקאסט יעסוק במגוון רחב של נושאים בתחום ה-ML ובכל פרק נסקור נושא אחד ספציפי. את הפודקאסט מגישים אורי גורן ותמיר נווה – שנינו יועצים בתחום ה-ML אשר מגיעים מרקעים מגוונים ומעניינים. אם אתם רוצים לשמוע עוד קצת עלינו ועל הפודקאסט החדש, אתם יכולים להאזין לפרק 0 שהכנו שמסביר קצת עלינו ועל מאחורי הקלעים של היוזמה הזו.

אנחנו בימים אלו מתחילים להעלות את הפרקים לכל הפלטפורמות השונות ובינתיים אתם יכולים להגיע אלינו דרך RSSספוטיפיאפל וגם ישירות דרך Podbean. אל תשכחו להירשם כמנויים כדי לא לפספס אף פרק שלנו.

על מה דברנו בפרק הזה?

לכתבה המלאה >>

X