(גרסת 2018) מדריך להרכבת מחשב ייעודי ל-Deep Learning

מאת אורי אליאבייב, 7 באוגוסט 2017

מדריך זה נכתב על ידי ניר בן-צבי חוקר בתחום הראייה הממוחשבת בחברת Trigo.

בשנים האחרונות אנו עדים לשיפור הניכר שהשיגו אלגוריתמים לומדים בלא מעט תחומים. אלגוריתמים אלו, כדי שבאמת יספקו תוצאות מרשימות, מצריכים כוח עיבוד רציני ומחייבים את העוסקים בנושא להרכיב מערכות מחשוב מתקדמות מאוד. מאחר ומדובר על נושא מורכב למדי, החלטתי לכתוב את המדריך הבא שיסייע לכם לבחור את הרכיבים המתאימים ביותר לצרכים שלכם. חשוב לי להדגיש כי ניתן להעניק מענה לסוגיה זו בכמה אופנים ומדריך זה יכסה זווית אחת בלבד.

אתחיל מלחלק את האפשרויות הקיימות בפנינו לארבע קטגוריות עיקריות:

  1. מחשב שולחני פשוט יחסית עם כרטיס גרפי בודד.
  2. מחשב הזהה למחשב מס׳ 1, הנבדל ממנו בכך שיש לו שני כרטיסים גרפיים (או הכנה לכרטיס גרפי נוסף בעתיד).
  3. מחשב לאימון ״כבד״ – כלומר, מחשב בעל ארבעה כרטיסים גרפיים ומעלה.
  4. מחשבים לאימון כבד אף יותר, כאשר 8 מאיצים גרפיים זה בד״כ המקסימום (ראו הערה בהמשך).

עדכונים (יולי 2018)

ובכן, לא המון התעדכן מאז שכתבתי את המדריך הזה, אבל אפרט על מה שכן השתנה:

  • חברת Nvidia השיקה דור חדש של מעבדים, שנקרא Volta ומסומן באות V
  • עבור הדור הזה עדיין לא הושק כרטיס גיימינג שמקביל ל-GeForce 1080Ti. המחיר של האחרון נשאר יחסית יציב והוא עדיין מהווה תמורה מעולה לכסף.
  • הושקה גרסא חדשה של Titan, הנקראת Titan V. מדובר על כרטיס גרפי יקר מאוד בעלות של 3000$ –  לא מאוד מומלץ לדעתי (אפרט על זה בהמשך)
  • בתחום המעבדים לא השתנה המון – AMD השיקה מעבד שרתים חדש שנקרא Ryzen והוא מציע לא פחות מ-128 מסילות PCI-E. האם זה חשוב? תמשיכו לקרוא!

בסה״כ אני חושב שהכתוב כאן עדיין רלוונטי כמעט שנה אחרי שהגרסא הראשונה נכתבה 🙂

מערכות של 8 GPUs

לדעתי מערכות עם שמונה GPU's (ולפעמים גם 9-10) עדיף לקנות מורכבות מראש ע״י OEM כלשהו (Supermicro, HP וכו׳) כי כאן אנו נכנסים כבר להגדרות חומרה יחסית מתקדמות. כמובן שמדובר (למיטב ידיעתי) רק במחשבי rack (״פיצה״).

אפשר לבנות מערכות מסוג זה, אך מדובר על תהליך יקר ומורכב אשר דורש מומחיות חומרה יחסית גבוהה וכנראה גם עובד בחברה שתפקידו לתמוך בחומרה. חלק מהרכיבים הדרושים הם לא משהו שניתן למצוא בחנות המחשבים הקרובה אלא דורש הזמנה מראש וכו׳ וכו׳. מוצרים כאלה מחייבים בהרבה מקרים לוחות אם יקרים ומיוחדים ובעיקר חומרה מיוחדת, NVLINK או המקביל של Mellanox, שתדאג לקשר בין המאיצים הגרפיים השונים. בקיצור – אם מוצר כזה רלוונטי עבורכם, אני ממליץ לקנות מערכת מוכנה. יש בישראל כמה שחקניות בינלאומיות בתחום הנ"ל ומעת לעת נכנסות מספר שחקניות נוספות. מבחינת תרחישי שימוש בארגון גדול (שלא אכנס אליהם בהרחבה) – יש מספר מקרים בהם יש הרבה מה להרוויח ממכונה בת 8 GPUs בהשוואה ל-2 מכונות של 4, אבל המחיר הרבה פעמים לא כזה משתלם (כלומר היא עולה משמעותית יותר מפי 2).

איזה מאיץ גרפי אני רוצה?

לפני כמה חודשים NVIDIA שדרגה את ה-Titan Xp מבוסס Pascal (הגירסא החדשה נקראת Titan V). בנוסף, מלך ה-price/performance עדיין נותר ה-GTX 1080Ti. אני לא ממש רואה סיבה לקנות את ה-Titan X של הדור הקודם-קודם (Maxwell) והוא במדריך בשביל ההשוואה. את ה-Titan Xp כבר קצת קשה להשיג, וכמו שהטבלה מראה הוא אף פעם לא נתן עלות-תועלת משמעותית.

מוזמנים להציץ בטבלת ההשוואה בין שני הכרטיסים הנ"ל:

CardCUDA coresGPU MemoryMemory Bandwidth
TITAN V (Volta)512012GB652.8GBps
GTX 1080Ti (Pascal)358411GB484GBps
TITAN Xp (Pascal)384012GB547.7GBps
TITAN X Pascal (Maxwell)358412GB484GBps

כשכתבתי את המדריך המקורי המלצתי לשדרג ל-Titan Xp במקרים ספציפיים אבל אני לא חושב שהמלצה זו רלוונטית כיום. נכון לכתיבת שורות אלה, עדיף לבחור או את ה-1080Ti או את ה-Titan V כאשר האחרון יקר משמעותית ולכן יש לקחת זאת בחשבון (כמעט כפול במחיר מה-Titan בדורות הקודמים אגב). במדריך הקודם היו מספר מדדים שבחרתי להוריד בעדכון של המדריך מאחר והם פחות רלוונטים למשתמש הממוצע. עם זאת, חשוב לדעת מה ה-mem bandwidth וכמה CUDA cores יש לכל כרטיס, אבל בסופו של יום, הכי חשוב זה להשוות בין הכרטיסים במשימות רלוונטיות. למשל, אם אתם עוסקים בעיקר ב-segmentation חפשו השוואות על ארכיטקטורות פופולריות שיתנו לכם הצצה לביצועים שתקבלו.

Volta, TensorCores ו-FP16

מעבר לשדרוגים הרגילים שמגיעים בין גרסאות חומרה, הדור האחרון של חברת Nvidia הוא דגם Volta המציע שדרוג מהותי לביצועים כשעובדים ב-half precision. הגירסא המקצועית, Tesla V100, עולה קרוב ל-8,000$ ומתאימה לערכות מקצועיות (כלל לא הכרטיסים בהם אנו דנים עליהם במדריך זה). גרסת ה-consumer של כרטיסים אלו, שנקראת Titan V100, עולה כרגע בערך כ- 3,000$. האם היא מספקת ביצועים המקבילים ל3-4 מעבדי 1080Ti מהדור הקודם? אמלק: לא.  רוצים תשובה מפורטת? מציע להסתכל פה ופה.

בגדול, אם יש לכם צורך במהירות גבוהה (גם באימון אבל בעיקר ב-inference) – אתם עלולים להרוויח הרבה מ-fp16. עם זאת, את אותה האצה אתם יכולים גם לקבל מהוספה של עוד 2 מאיצים גרפיים, ולכן אני קצת לא יכול להמליץ לכם (ולעצמי) על הקפיצה המהותית הזאת במחיר. נחכה שחברת Nvidia יוציאו את 1180Ti. לדעתי, בדור הקודם, Pascal, השיפור ממעבר מ-32ביט ל-16ביט (single precision ל-half precision) יחסית צנוע.

ולמה בכלל לקנות מכונה ולא להשתמש במכונות בענן?

גוגל ואמזון מציעות היום מעבדי V100 בענן שלהן (גם מייקרוסופט אבל נכון לעכשיו בזמינות נמוכה ובמעט איזורים). גוגל מציעה גם P100 (שזה תמורה לא רעה לכסף רוב הזמן). בנוסף לכך, קיימים גם שירותים אחרים זולים אפילו יותר כמו Paperspace שאני ממליץ לכם לבחון. לגוגל גם יש את ה-TPU שלה בבטא כרגע והם אכן מאוד מאוד מהירים ומציעים תמורה מעולה של זמן אימון לדולר.

ובכל זאת, חשבון פשוט יראה שאם אתם באמת הולכים לאמן על מספר גדול של GPUs, חלק גדול מהזמן (כלומר המכונה תרוץ רוב הזמן ותמיד יהיה לה backlog משימות שישאיר אותה עמוסה) – העלות של מכונה מקומית במשרד נמוכה משמעותית. לעומת זאת, אם אופן השימוש הוא כזה שמאמנים מודל פעם בכמה ימים, ושאר הזמן משלבים אותו במוצר, מתחקרים אותו אופליין וכו׳ – אולי עדיף לרוץ עם מכונה בענן. אם יש לכם קצת אורך נשימה, כמובן שהכי חכם להחליט להתנסות בענן כלשהו במשך חודש ואז לבדוק מה היו העלויות שימוש ואז לקבל החלטה מושכלת. כמובן ששימוש בענן טוב גם להרבה פתרונות אחרים, וגם במקרה שרכשתם מכונה שיושבת אצלכם בבית או במשרד סביר להניח שמדי פעם תשדרגו אותה עם משאבי חישוב נוספים בענן כלשהו.

שיקול נוסף נגד מכונה לוקאלית הוא התחזוקה שלה, שיכולה לגזול משאבים רבים כשמשהו משתבש. אגב גם בענן לעתים רחוקות דברים מתרסקים (מכונה מסרבת לעלות אחרי שכבתה וכו׳) אבל זה לא מתקרב לגיהנום שהוא עדכון גרסאת display drivers ששוברת לחלוטין את הקרנל והמחשב מסרב לעלות.

כמה מעבדים אני צריך ואילו?


קצת על מעבדים ו-PCI-E Lanes

אחרי שחתמנו את נושא המאיצים הגרפים הגיע הזמן לעבור לאלמנט הבא: המעבד. כרטיס גרפי דורש 16 מסילות PCI-Express, מה שמחייב את המעבד לתמוך בכך, דבר שהיינו די סטנדרטי כיום. האתגר מתחיל כשנרצה לחבר שני מאיצים גרפיים, שיצריכו מאיתנו 32 מסילות – פיצ'ר שאיננו נפוץ במעבדים סטנדרטיים (32 מסילות קיימות במעבדי שרתים, Xeon ובמעבדים היקרים ביותר בסדרת Core).

כשנרצה לחבר יחדיו ארבעה מאיצים גרפיים ומעלה, נצטרך לרכוש מעבדים נוספים (CPUs) שכן המספר המקסימלי של מסילות עבור מעבד בודד עומד על 40 בסה"כ. מסיבה שאיננה ברורה לי, אין הקפדה יתרה על נושא זה ורוב המכונות מהסוג הנ"ל, הנמכרות כחבילה אחת, מגיעות עם CPU בודד. יתרה מכך, מערכת המבוססת על מעבד בודד המריץ ארבעה מאיצים גרפיים תגרום להרעבה שלהם במשימות מורכבות (רשתות מאוד עמוקות) – תוצאה שאיננו מעוניינים להגיע אליה.

האם אני חייב המון מסילות?

ובכן, התשובה היא ״לא״. הסעיף הקודם בעיקר מלמד אותנו שמספר המסילות הזמינות בעצם שולט בכמות התעבורה (throughput) בין הזיכרון של המחשב לזיכרון של לוח האם. זה חשוב מאוד בזמן אימון שמשתמש בכלל ה-GPUs שזמינים לנו במערכת, חשוב קצת פחות אם מאמנים על כל אחד מהם בנפרד. עוד פחות חשוב מכך, אם המערכת שנבנה בכלל מיועדת ל-inference ולא לאימון בכלל. נקודה חשובה: אם השימוש שלכם דורש זמני תגובה מאוד גבוהים (כמו נגיד מסחר) ואז לכו על 16.

ולמה כל זה נכון? כי בסה״כ ה״הרעבה״ רלוונטית במיוחד כשאנחנו מעוניינים שה-GPUs שלנו ידברו אחד עם השני (מה שקורה כשממקבלים אימון על כמה כרטיסים גרפיים) ופחות כאשר כל אחד מהכרטיסים הגרפיים פועל כיחידה עצמאית. וכמו שכתבתי קודם, במערכות מתקדמות (לשרתים בעיקר) קיימים חיבורים יעודיים שמאפשרים ל-GPUs לשוחח אחד עם השני בלי לעבור דרך ה-CPU והזיכרון שלו.

בקיצור – ככלל אצבע לא הייתי חורג בשום מקרה מ-8 PCI-E lanes עבור כל מאיץ גרפי במערכת, ומשתדל מאוד במידת האפשר לתת לכל אחד 16 אם אני מתכנן לאמן על המערכת הזאת כשכל ה-GPUs משתתפים.

מעבדי Core

Intel introduced the new Intel® Core™ X-series processor family on May 30, 2017. Intel’s most scalable, accessible and powerful desktop platform ever, it includes the new Intel® Core™ i9 processor brand and the Intel® Core™ i9 Extreme Edition processor – the first consumer desktop CPU with 18 cores and 36 threads of power. The company also introduced the Intel® X299, which adds even more I/O and overclocking capabilities. (Credit: Intel Corporation)

(יולי 2018) לאינטל יש עכשיו כבר סדרה חדשה, סדרה 8, ונראה שמעבדי סדרת ה-i9 פופולריים מתמיד לקונפיגורציות DL. אוסיף פירוט עליהן בהמשך אבל בגדול לא השתנה המון מבחינת ה״דברים שצריך לשים לב אליהם״. לא לכל המעבדים כבר קיים וריאנט מסדרה 8 אבל זה יקרה לאט לאט.

בדור הקודם-קודם (סדרה 6), היו לאינטל את ה-i7-6900K וה-6850K – עם 6 ו-8 ליבות ו-15ֿ\20 מגה של זיכרון מטמון, בהתאמה. לשניהם היו 40 מסילות והם היו מאוד משתלמים גם במחיר ואהובים מאוד על ידי מרכיבי מחשבי DL באינטרנט.

לצערנו, בדור הנוכחי אין משהו שממש מקביל אליהם. נהיה די קשה להשיג אותם וכמובן שמדובר ב-2 דורות אחורה, אבל אני משאיר את החלק הזה במדריך כדי שנתבאס כמה שדברים התייקרו בהשוואה ללפני שנתיים.

אז בדור הנוכחי (7 ו-8 בדרך) יש לנו שתי אלטרנטיבות:

  • סדרת i9 של אינטל (כן יש כזה עכשיו) עם 7900X ו-7920X עם 44 מסילות. יש להם גם 10 ו-12 ליבות, בהתאמה, וגם זה משהו שחשוב לזכור כי הרבה כלים אחרים מנצלים מקבול מעבדים (נגיד, OpenCV).
  • סדרת i7 בקצה העליון שלה – 7800X ו-7820X – עם 28 מסילות, שזה מספיק ל-setup של GPU בודד או 2
  • כמובן שאם ברור שנעשה שימוש רק ב-GPU בודד לנצח נצחים אפשר לקנות כל מעבד יקר של אינטל עם 16 מסילות ולעוף איתו לכוכבים

חשוב לשים לב המעבדים מסדרת X של אינטל משתמשים בסוג socket חדש וזה בעייתי (כי הוא חדש) – FCLGA2066. בפועל הוא כבר די פופולרי בשוק (שנה+ אחרי שהוכרז) גם בגלל שהם שולטים בשוק הגיימינג היקר וכמובן גם בשוק ה-deep learning.

כמובן שהאלטרנטיבה היא מעבדי Xeon, כמו שתכף נראה!

מעבדי Xeon

מעבדי Xeon הם סדרת השרתים של אינטל, שמיועדים למערכות יקרות יותר משלל סיבות שונות שלא אכנס אליהן כעת. חלקם גם תומך, ואף מיועד, להרצה במערכות מרובות מעבדים. מעבדים אלו גם אמורים להיות ״עמידים״ יותר ולא לקרוס תחת העומס (כשמדובר במערכת שעתידה להריץ משימות אימון במשך שעות רבות ללא מנוחה מדובר על פרמטר חשוב).

חשוב לדעת כי שימוש במעבד מסוג Xeon מקפיץ את המחיר של כל המערכת מכמה סיבות:

  • מעבדי זאון (Xeon) דורשים זיכרון ECC, שהוא יקר יותר.
  • באופן כללי רכיבים הפועלים עם מעבדי זאון יהיו יקרים יותר.
  • מעבדי זאון נוטים להיות יקרים ביותר ביחס למעבדים אחרים.

הסיבה המרכזית כן לעבוד איתם היא 40 מסילות, וכמובן שהמספר הזה עולה עם מרכיבים מחשב עם 2 כאלה וכו׳. בעבר היינו רואים כאלה מעבדים במערכות של 4GPUs והיום זה קצת נעלם. מנגד, ברגע שעוברים למחשבי rack (״פיצה״) זו נהיית הבחירה הדומיננטית, ושילוב של שני מעבדים כאלה על אותו לוח אם נותנת לנו 80 מסילות.

אם נבחר באופציה זו מסיבה זו או אחרת, המלצה פופולרית מאוד היא המעבד מדגם E5-2630 v4 בעל 10 ליבות, 25MB של זיכרון-מטמון המגיע בעלות של 600$. ניתן גם להסתפק במעבדים זולים יותר, למשל בדגם הזול בסדרה 5, E5-1620V4. למעבד זה 4 ליבות וזיכרון-מטמון של 10MB. לחלופין אפשר לעלות ל-6 ליבות, במחיר כמעט כפול, ולקבל את ה-E5-1650V4. כפי שהסברתי החלק היקר במעבר ל-Xeon אינו [רק] המעבד.

לסדרה הזולה יותר יש גם דירוג TDP גבוה יותר – הספק של 105W אל מול הספק של 85W. זה הבדל די גדול למערכת שהולכת לעבוד מאוד קשה. נכון ליולי 2018, אני רואה פחות מערכות מבוססות Xeon, שהיה פופולרי בעבר, וזאת כנראה בגלל סדרת i9 של אינטל. זה קצת מפשט את העניינים עבורנו.

ואיפה AMD?

ובכן – AMD מציעה משהו שעל הנייר היה אמור לזעזע את השוק, ובפועל לא ממש עשה את זה – סדרת מעבדי Epyc לשרתים עם 128 PCI-E lanes, יחד עם גרסאת ה-Desktop שנקראת Threadripper ומציעה 64 מסילות. הרכיב הרלוונטי הוא ה-Threadripper 1920x או ה-1950x, עם 16 ו-12 ליבות בהתאמה. ההפרש במחיר די זניח ולכן נפוץ יותר לראות מערכות עם האחרון. כולם מבוססים על הדור החדש שלהם, Ryzen 7. בנוסף לנתון הזה הם מציעים מספר גדול מאוד של cores (בין 12 ל-32, במחירים מאוד נמוכים בהשוואה לחומרה מקבילה של אינטל). אז למה זה לא כבש את השוק בסערה?

  • עושה רושם ש-single core performance נמוך משמעותית, וזה משהו שעדיין חשוב ללא-מעט תרחישים. עם זאת, תוכלו ליהנות יותר מיחס של cores for dollar, ומי שנהנה ממקבול יהנה מאוד!
  • אנשים חוששים לאמץ חומרה חדשה על כלל המשתמע מכך.
  • לא מעט ספריות ML ״קלאסיות״ (למשל OpenCV) עושות שימוש ב-MKL של אינטל; בגדול ובנפנוף ידיים מדובר בשכבה תוכנתית (אלרטנטיבה לכל מני אימפמנטציות של Blas) שמאוד מאוד מאיצה פעולות על CPUs. זה גם מאוד רלוונטי למי שמתכנן לבצע inference על CPU למרות שכנראה שזה פחות רלוונטי לקוראי המדריך הזה. כל העסק הזה לא רלוונטי כרגע עבור מערכות עם מעבדים של AMD. אינטל לעומת זאת משקיעה הרבה משאבים בשיפור תדיר של התמיכה של ספריות שונות ב-MKL ולהפך.
  • נושא ה-PCI-E lanes קצת סבוך יותר, ואפרט:

בניגוד לאינטל שיש לה חיבור מיוחד בין המעבד ללוח אם לכל מני דברים, המעבדים של AMD מקצים 4 מסילות לכל מני חיבורים (ככלל החיבור בין ה-chipset לבין המעבד עצמו) ועוד 4 מסילות לחיבור אחסון מסוג M.2. זה משאיר 56 מסילות לכרטיסים גרפיים. למה אני מספר לכם את זה? כי זה אומר שבפועל אפשר לחבר כרטיסים רק בתצורת 16x/16x/8x/8x. זה עדיין אחלה ועדין יותר ממה שאינטל מאפשרת גם בכרטיסים היקרים ביותר שלה – כרטיסי סדרת i9 – אבל זה נהיה הבדל פחות משמעותי. מה גם שהחיסכון של 500-600$ במחשב של 7000$ זה לא כזהההההההה אישו.

אמ;לק: נראה כי היתרונות של סדרת מעבדים זאת רלוונטיים בעיקר לגיימרים, הרפתקנים ובוני מערכות שמאוד חשוב להם לחסוך כמה ג׳ובות.
אז איפה עדין יש הגיון ב-AMD? למי שבונה מערכת עם 2 GPUs בלבד (מערכות זולות בכמה סדרי גודל ממערכות של 4) הן דווקא מהוות אלטרנטיבה נהדרת. כמו שציינתי, לאינטל בגדול אין יותר רכיבים עם מעל 28 מסילות PCI-E והאפשרות היחידה היא מעבדי ה-i9 היקרים מאוד. ה-Threadripper 1950X מציע 64 מסילות (כמו שהראינו, בפועל 56) וזה משאיר לכל מאיץ גרפי 16 מסילות שלמות ונהדרות וגם חוסך לא מעט כסף על CPU מסדרת i9 של אינטל.

הערה לגבי זיכרון

חשוב לזכור כי גם אם מעבד מסוים מתאים פיזית, מבחינת הסוקט, ללוח-אם התומך בכמות גדולה של זיכרון, ייתכן שהמעבד עצמו לא תומך בכמות שכזו. לצורך העניין, במידה ותרצו להרכיב מערכת עם מעל ל-64GB זיכרון, קחו בחשבון שדבר זה יתאפשר ככל הנראה רק ע״י מעבדים יקרים מאוד.

עוד על חומרה

לוח אם

91OZNKTjR1L._SL1500_

אין דרישות יוצאות דופן מלוחות אם בקטגוריה הזו והם כולם מאוד דומים. בחרו ביצרן טוב ותקראו כמה ביקורות אודות הלוח אם. אני מניח שהקורא הממוצע מבין מספיק בחומרה כדי לדעת (למשל) לבחור לוח אם לסוקט המתאים וכו׳. במערכת של ארבעה מאיצים גרפים הנושא נהיה מורכב יחסית אבל בשאר האופציות שבמדריך, ככל הנראה שהבחירה תהיינה בסוף בלוח אם לגיימרים – סדרת X99 של MSI  או הסדרה המקבילה של ASUS למשל. שימו לב שיש לוחות אם עם 2 מסילות שמתאימות לכרטיס מסך (פיזית), אבל רק אחת מהן היא ״באמת״ PCI-E x16 והשנייה היא ״רק״ x4. תמנעו מלרכוש לוח שכזה, אתם תרעיבו את הכרטיסים הגרפיים שלכם.

כאמור, זה דברים שמרכיב המערכת צריך להכיר לעומק והם לא שונים מבנייה של כל מחשב אחר (לגיימינג למשל). עוד דבר שלפעמים שוכחים לבדוק (במיוחד למערוכות של 4 GPUs) זה אם לכל slot יש מקום פנוי מעליו. כרטיסים מהסוג שאנחנו מדברים עליו פה תמיד תופסים שתי מסילות בגלל פתרון הקירור העצום שלהן

הערה לגבי ערכת-שבבים (chipset)

כמו ההערה הקודמת על המעבד, גם ערכת השבבים לא תמיד תומכת בכמות הזיכרון שלוח האם תומך בה פיזית. זו הרבה פעמים הדרך לבדל בין ערכות-שבבים זולות ליקרות וחשוב לבדוק את זה. לוחות אם יקרים (סדרות ה-flagship של כל יצרנית) בד״כ יכללו את ערכת השבבים היקרה והטובה ביותר עם התמיכה הרחבה ביותר לזיכרון, PCI-E וכו׳. באינטל ערכת השבבים צריכה להיות X299. ב-AMD זה יהיה X399.

זיכרון

כלל האצבע הוא פי-2 זיכרון למחשב עבור כל GPU. כלומר, עבור 4 כרטיסים מסוג 1080ti הייתי לוקח תצורה של 44*2=88GB. כמובן שהחישוב מתעגל לכפולה הבאה לפי כמות ה-memory sticks (שכמובן תמיד צריכים לבוא בזוגות). ל-setup של מאיץ גרפי בודד שאולי נרצה להרחיב כדאי לקחת GB32 באופן המאפשר להוסיף 32GB נוספים יחד עם ה-GPU שנקנה בעתיד. מנגד אפשר להתחיל גם עם 24GB, איך שתעדיפו (בד״כ מקלות הם של 16 או של 8).לוחות כאלה בד״כ מגיעים עם 8 מסילות זיכרון ככה שזה אמור להיות פשוט מאוד (נתחיל עם 2×16 ואולי נוסיף עוד 2 כאלה בהמשך). כמו בחלק של הלוח-אם, אני מניח שהקורא פה יודע לבחור את הזיכרון הנכון מבחינת מהירות. מעבדי Xeon דורשים זיכרון ECC יקר יותר

כמו בחלק של הלוח-אם, אני יוצא מנקודת הנחה שהקורא פה יודע לבחור את הזיכרון הנכון מבחינת מהירות. כפי שציינו בפסקה על המעבדים, מעבדי Xeon דורשים זיכרון ECC יקר יותר ולכן יש לקחת זאת בחשבון. במידה והקורא יעדיף לעבוד עם מעבדי Core, לוחות אם מבוססי ערכת השבבים x99 הם אמינים, זולים וניתן למצוא דגמים המכילים 8 מסילות זיכרון במחיר טוב. ייתכן שמאז כתיבת מדריך זה יצאה מחליפה ל-x299 כמובן, וכל מה שכתוב פה עובר אוטומטית לגרסא החדשה ביותר. אגב, מעבדי Volta בגרסאות מסוימות כוללים 32GB של זיכרון לכל כרטיס. אם בידכם כרטיסים כאלה הייתי משתדל שלכל כרטיס תהיה כמות כפולה של CPU Memory – קרי 64.

ספק כוח

ספק הכוח צריך להיות מסוגל לסחוב את כל העסק המרגש הזה. אם אתם הולכים על אופציה מספר 2 (הכנה לכרטיס גרפי נוסף בעתיד), אני ממליץ כבר עכשיו לקנות ספק כוח שיוכל לסחוב שני כרטיסים גרפיים. לכרטיס גרפי בודד כדאי להתחיל בספק איכותי בהספק של 750W, ולמערכת עם שני כרטיסי גרפיים הייתי בוחר בספק עם הספק של 1000W. מערכות של ארבעה כרטיסים גרפיים בדרך כלל כבר מגיעות עם שני ספקי כוח או ספק בודד בהספק של 1500W+. יצרנים טובים של ספקי כח הם Antec, CoolerMaster, Corsair, SeaSonic, EVGA וכו׳. 

קירור\מארז

בהנחה שהמחשב ישב בחדר נפרד ומקורר, אין צורך להתעסק עם פתרונות קירור מיוחדים. אם לעומת זאת, המערכת לא תשב בחדר נפרד ומקורר (דגש על נפרד) אולי תרצו להחליף את הקירור של המעבד בקירור שקט יותר. לגבי המארז, כדאי להשקיע בכזה שנוח "לעבוד בתוכו" ועם קירור טוב, אך מעבר לכך אין הרבה דרישות. יצרן מארזים פופולרי ומומלץ מאוד הוא NZXT. 

הערה: ספק כח שמגיע עם מארז בדר״כ לא שווה יותר מדי, אלא אם מדובר בדילים של מארז+ספק של חברות רציניות, כמו למשל Antec.

כוננים קשיחים

בנושא זה אין דגשים מיוחדים ובגדול זה עניין של תקציב. האופציה ה״זולה״ היא כונן SSD של 500GB יחד עם 4TB ״רגילים״. אם אין הגבלת תקציב כמובן שאפשר שכל הכוננים יהיו SSD ואפשר גם לערב תצורות RAID שונות. גם פה כמובן שיש כל מני דקויות בסוג החיבור ללוח האם (למשל חיבור NVME החדש-יחסית) וזה משהו שיכול להיות חשוב מאוד או כלל-לא, כתלות בייעוד הכללי של המערכת שאתם מרכיבים.

  • Shahar Zu

    היי ניר, תודה על המדריך! אתה חושב שהיום הדגמים שהמלצת עליהם עדיין מומלצים? או שנכנסו כוכבים חדשים מאז?

    • Uri Eliabayev

      המדריך עודכן עכשיו לגרסת 2018 🙂

  • Dagan

    תודה על הפירוט, שאלה קצת אוף-טופיק, אם יורשה לי. אחרי שהרכבתי לי מחשב כמתואר במאמר, האם ניתן למצוא מערכת הגנה מהפסקות חשמל ושינויי מתח (יעני ups), שמסוגל להחזיק בחיים מחשב כזה ליותר מקרה שניות?

X