רשתות נוירונים, Deep learning וכל מה שבניהם

מאת אורי אליאבייב, 8 במאי 2016

בפוסט הקודם הסברנו בקצרה מה זה Machine Learning ופירקנו לגורמים את ההגדרה של המושג כולו. הפעם אנחנו נעסוק בנושא חשוב לא פחות שזוכה ללא מעט כותרות בתקופה האחרונה: Deep Learning. תחום מסעיר זה אחראי על מספר רב של פריצות דרך שהצליחו לחולל שינויים של ממש בכמה מהמוצרים והטכנולוגיות שאנו משתמשים בהם כיום. אז על מה כל הרעש? בכתבה הבאה.

Deep learning (למידה עמוקה) הוא תת תחום של Machine learning העושה שימוש ברשתות נוירונים מלאכותיות לשם ביצוע משימות. בסיסו של תחום זה טמון בשאיפה לחקות את הדרך בה המוח האנושי פועל ולרתום את היעילות של מבנה הנוירונים לשם התמודדות עם אתגרים חישוביים מורכבים.

בפועל, מדובר על מודל מתמטי חישובי המורכב ממספר "נוירונים" המסודרים בשכבות, כאשר כל נוירון יכול לתקשר עם מספר נוירונים אחרים במערכת. כל נוירון מסוגל לבצע פעולות חישוביות פשוטות, ובתורו להעביר את המידע שהסיק לשאר הנוירנים. באופן זה, עם ההתקדמות של המידע בשכבות, המערכת הופכת את המידע הגולמי למידע בעל ערך. כפועל יוצא מכך, המערכת לומדת לקבל החלטות מדויקות יותר.

רשת נוירונים

מקור: cs231n

נדגים את הרעיון באמצעות דוגמא מתחום זיהוי אוביקטים בתמונה. הנוירונים הראשונים ברשת ידעו לזהות קווים ישרים, הבאים בתור ידעו לזהות פינות או תבניות פשוטות, אלו שאחריהם ידעו כבר לזהות את קווי המתאר של האיברים השונים ולבסוף הנוירונים האחרונים ידעו לזהות אם מדובר באדם או לא.

חשוב להדגיש כי בכדי להפיק ערך מאותה רשת נוירונים, יש לחשוף בפניה כמות רבה של מידע מקוטלג ולאמן אותה באופן חוזר ונשנה. בכל שלב באימון המערכת תצטרך להשוות את תוצאותיה למידע הקיים ולבחון אם אכן צדקה בקביעתה. במידה ולא, הרשת תשנה מעט את הפרמטרים בנוירונים הרלוונטיים וכך חוזר חלילה עד קבלת רמת דיוק מספקת.

נחדד כי לא מדובר על פיתוח חדש מהשנים האחרונות או פריצת דרך שהתרחשה לפני זמן קצר. מודלים קודמים של רשתות נוירונים קיימים מזה עשרות שנים, אך הם לא הצליחו להיות יעילים במיוחד. כיום, הודות לכוח העיבוד העצום וכמויות האדירות של המידע הזמין לכל, זוכה התחום לעדנה מחודשת ונחשף במלא כוחו.

Deep learning השפיע בצורה נרחבת על מספר רב של שירותים וטכנולוגיות ואחראי על לא מעט קפיצות דרך משמעותיות. נקדיש לנושא זה כתבה שלמה בהמשך, אך מספיק להתבונן בחלק מהמוצרים בהם אנו עושים שימוש היום כדי לראות כיצד מאחורי הקלעים רשתות נוירונים מחוללות מהפכה של ממש.

קישורים חיצוניים

מי שרוצה להעמיק וללמוד את התחום אני מאוד ממליץ לקרוא את הספר שפרסם MIT על הנושא. יש בו את רוב מה שצריך לדעת, כולל המתמטיקה, כדי לעסוק בתחום. ניתן להשיג אותו כאן.

מי שמעוניין להיכנס לתחום בצורה קצת יותר עדינה, יכול לצפות בסדרת הסרטונים המצוינת שמסבירה בצורה טובה מאוד את כל מה שצריך לדעת על Deep learning.

  • Muli Yulzary

    האם תעסוק באלגוריתמי למידה שאינם Neural nets?

    • Uri Eliabayev

      אני באופן אישי לא.
      עם זאת, אם יהיה ביקוש לנושא אני בטוח שיש יותר מאדם חדש בקהילה שלנו שבקיא בנושא ושישמח לכתוב על כך.

  • Nili Mandelblit

    הי, האם תוכל להסביר את רעיון ה GAN: Generative Adversary Networks?