למידה אנושית: חמישה ספרים מומלצים בנושא Machine learning ו-Deep learning
לפני מספר שבועות פרסמתי מאמר שמרכז את כל הקורסים המובילים בנושאי Machine learning ו-Deep learning שהתבסס על המלצות חברי הקהילה הישראלית. בעקבות ההצלחה של המאמר הקודם, החלטתי לרכז את כל הספרים הממולצים ביותר בתחום ולאגד אותם לכדי רשימה אחת מסודרת. חשוב להדגיש כי גם הפעם סדר הופעת הספרים נגזר באופן ישיר מהצבעות חברי הקהילה. עבור כל ספר אני מצרף קישור לרכישה באמזון ולצד זאת גרסה דיגיטלית לשימוש אישי.
1. Understanding Machine Learning: From Theory to Algorithms
הספר הראשון שזכה למרבית הקולות הוא Understanding Machine Learning: From Theory to Algorithms. הספר נכתב על ידי פרופסור שי שליו-שוורץ מהאוניברסיטה העברית בירושלים ופרופסור שי בן-דוד מאוניברסיטת ווטרלו שבקנדה. הספר יצא לאור בשנת 2014 על ידי אוניברסיטת קיימברידג' (Cambridge University Press). על פי תיאור הספר מטרתו היא להציג לקורא את תחום ה-Machine learning ואת האלגוריתמים הנפוצים בנושא. ניתן להתרשם מהתיאור המלא של הספר:
Machine learning is one of the fastest growing areas of computer science, with far-reaching applications. The aim of this textbook is to introduce machine learning, and the algorithmic paradigms it offers, in a principled way. The book provides an extensive theoretical account of the fundamental ideas underlying machine learning and the mathematical derivations that transform these principles into practical algorithms. Following a presentation of the basics of the field, the book covers a wide array of central topics that have not been addressed by previous textbooks. These include a discussion of the computational complexity of learning and the concepts of convexity and stability; important algorithmic paradigms including stochastic gradient descent, neural networks, and structured output learning; and emerging theoretical concepts such as the PAC-Bayes approach and compression-based bounds. Designed for an advanced undergraduate or beginning graduate course, the text makes the fundamentals and algorithms of machine learning accessible to students and nonexpert readers in statistics, computer science, mathematics, and engineering
לרכישה מאמזון עותק פיזי/קינדל – לחצו כאן.
2. Deep learning
הספר "Deep learning" יצא לאור על ידי MIT ב-2016 והוא העדכני ביותר בתחום מתוך הרשימה כולה. על אף שיצא רק לאחרונה הספר הומלץ בחום על ידי הקהילה המקומית והצליח לקבל המלצות חמות גם בקרב הקהילה הבינלאומית. Deep Learning נכתב על ידי Ian Goodfellow, Yoshua Bengio ו- Aaron Courville במשך שנתיים וחצי וכעת הוא זמין בעותק דיגיטלי. בקישור לעותק הדיגיטלי ניתן למצוא מידע נלווה לספר כדוגמת תרגולים סביב החומר הנלמד ומצגות רלוונטיות. הספר מעניק תחילה את הבסיס המתמטי הנדרש (אלגברה לינארית, הסתברות, סטטיסטיקה ועוד), לאחר מכן עובר לסקירה קצרה על Machine learning ולבסוף צולל פנימה לתוך חומרים מתקדמים בעולם ה-Deep learning. עותק פיזי טרם זמין לרכישה, אך ניתן להירשם כבר עכשיו לרשימה המוקדמת.
לרכישה מאמזון עותק פיזי/קינדל – לחצו כאן.
לעותק דיגיטלי לשימוש אישי – לחצו כאן.
מחפשים משרה בתחום ה-Machine learing? היכנסו ללוח המשרות שלנו.
3. The Elements of Statistical Learning
מי שקטף את המקום השלישי הוא ספר בשם "The Elements of Statistical Learning" שיצא לאור על ידי אוניברסיטת סטנפורד. הספר נכתב על ידי שלושה מחברים: Trevor Hastie, Jerome H. Friedman ו-Robert Tibshirani ופורסם לראשונה בשנת 2001. במרוצת השנים דאגו מחבריו להמשיך לעדכן אותו כאשר הגרסה האחרונה יצאה בשנת 2013. The Elements of Statistical Learning עוסק במגוון רחב של תתי נושאים ומכסה את מרבית הנושאים החשובים למי שמעוניין לעסוק בתחום. ניתן ללמוד עוד על אופי הספר מהתיאור המצורף:
Deep learning is a form of machine learning that enables computers to learn from experience and understand the world in terms of a hierarchy of concepts. Because the computer gathers knowledge from experience, there is no need for a human computer operator to formally specify all the knowledge that the computer needs. The hierarchy of concepts allows the computer to learn complicated concepts by building them out of simpler ones; a graph of these hierarchies would be many layers deep. This book introduces a broad range of topics in deep learning.
The text offers mathematical and conceptual background, covering relevant concepts in linear algebra, probability theory and information theory, numerical computation, and machine learning. It describes deep learning techniques used by practitioners in industry, including deep feedforward networks, regularization, optimization algorithms, convolutional networks, sequence modeling, and practical methodology; and it surveys such applications as natural language processing, speech recognition, computer vision, online recommendation systems, bioinformatics, and videogames. Finally, the book offers research perspectives, covering such theoretical topics as linear factor models, autoencoders, representation learning, structured probabilistic models, Monte Carlo methods, the partition function, approximate inference, and deep generative models.
Deep Learning can be used by undergraduate or graduate students planning careers in either industry or research, and by software engineers who want to begin using deep learning in their products or platforms. A website offers supplementary material for both readers and instructors.
לרכישת עותק פיזי/קינדל – לחצו כאן.
4. Pattern Recognition and Machine Learning
הספר הרביעי ברשימה הוא "Pattern Recognition and Machine Learning" אשר נכתב על ידי Christopher Bishop ויצא לאור בשנת 2006. אחד היתרונות הגדולים של הספר הוא קובץ התרגילים שמופיע בסוף כל פרק. בדרך זו יכול הקורא לתרגל את החומר הנלמד ולוודא שאכן הבין את תוכן הפרק. ניתן לקבל מידע נוסף על הנקודות בהן יעסוק הספר מהתקציר הבא:
This is the first textbook on pattern recognition to present the Bayesian viewpoint. The book presents approximate inference algorithms that permit fast approximate answers in situations where exact answers are not feasible. It uses graphical models to describe probability distributions when no other books apply graphical models to machine learning. No previous knowledge of pattern recognition or machine learning concepts is assumed. Familiarity with multivariate calculus and basic linear algebra is required, and some experience in the use of probabilities would be helpful though not essential as the book includes a self-contained introduction to basic probability theory.
לרכישת עותק פיזי/קינדל – לחצו כאן.
לעותק דיגיטלי לשימוש אישי – לחצו כאן.
5. Pattern classification
אחרון חביב הוא ספר בשם "Pattern classification" שנכתב גם הוא על ידי שלושה מחברים: Richard O. Duda , Peter E. Hart ו-David G. Stork. הספר זכה למספר רב של מהודרות מאז ירד אל הדפוס בפעם הראשונה, אי שם בשנת 1973, ואף זכה למהדורה חדשה ומעודכנת שנכתבה על ידי Richard O. Duda. הגרסה הראשונה זמינה הן בעותק קשיח והן בעותק דיגיטלי בעוד שהמהדורה העדכנית ביותר זמינה רק בעותק קשיח. פרטים נוספים ניתן למצוא בקישור הבא:
The first edition, published in 1973, has become a classic reference in the field. Now with the second edition, readers will find information on key new topics such as neural networks and statistical pattern recognition, the theory of machine learning, and the theory of invariances. Also included are worked examples, comparisons between different methods, extensive graphics, expanded exercises and computer project topics. An Instructor's Manual presenting detailed solutions to all the problems in the book is available from the Wiley editorial department.
לרכישת עותק פיזי/קינדל למהדורה הראשונה – לחצו כאן.
לעותק דיגיטלי לשימוש אישי למהדורה הראשונה – לחצו כאן.
לרכישת עותק פיזי/קינדל למהדורה החדשה – לחצו כאן.
מלבד חמשת הספרים הנ"ל חברי הקבוצה המליצו על עוד שלושה ספרים:
Machine Learning: A Probabilistic Perspective (Adaptive Computation and Machine Learning series)
Data Science from Scratch: First Principles with Python
Bayesian Data Analysis, Third Edition (Chapman & Hall/CRC Texts in Statistical Science)
רוצים עוד מאיפה שזה הגיע? הצטרפו לניוזלטר שלנו דרך הקישור הבא.
הערה חשובה: הלינקים לספרים הם באפליאציה לאמזון מה שאומר שבכל רכישה אקבל כמה סנטים (המחיר עבורכם לא משתנה).