הסקר השנתי של קהילת MDLI 2021 – פערי השכר המגדריים

Inbar, 01/02/2022

מהנתונים שאספנו עולה שפער השכר בין נשים לגברים עומד על 8%. רוב הפער נובע מכך שנשים ממלאות פחות תפקידים בכירים מגברים. חלק קטן מהפער נובע מכך שכשהן ממלאות תפקידים אלו – שכרן נמוך ממקביליהן הגברים. החדשות הטובות: מחוץ לתפקידים הבכירים, כמעט ולא קיימים פערים.

בחודשים האחרוניים פירסמתי מספר פוסטים שקשורים לסקר מדעני הנתונים ומקצועות המאשין לרנינג בישראל: דו”ח השכר, מאחורי הקלעים של מחשבון השכר (את מחשבון השכר עצמו ניתן למצוא כאן) וכן מיהו דאטה סיינטיסט – תשובה מבוססת נתונים. אחד הנושאים שנשאלתי עליו הכי הרבה היה פערי השכר המגדריים בסקר. בפוסט האחרון בסדרה ניגע סופסוף בתפוח האדמה הלוהט הזה.

כשבניתי את מחשבון השכר בחרתי לא להשתמש במגדר כפיצ’ר באופן מכוון – השכר ה”הוגן” או שכר ה”שוק” לא אמור להיות מושפע מהמגדר, ובוודאי שלא רצינו להנציח פערים קיימים. אולם כדי לא לטאטא את הנושא מתחת לשטיח, אני מתייחס אליו כאן בפוסט ארוך ומפורט מאוד. הפוסט מגיע על רקע התייחסות רחבה לנושא בתקשורת כמו שניתן לראות בכתבות בדה-מרקר ו-כלכליסט.

הפוסט הזה לא מתכוון לעסוק ב:

שאלת הגורמים הכלכליים והחברתיים שמביאים לפער השכר הממוצע בין גברים ונשים בכלל התעשייה בארץ. מי שרוצה להשכיל בנושא מוזמן לקרוא את הדו”ח המצוין של משרד האוצר. אין לי את הנתונים וגם לא את ההכשרה לענות על שאלות מהסוג הזה.
הטענה שאישה מרוויחה כ-70 אגורות (או כל מספר דומה) על כל שקל שגבר מרוויח באותה עבודה ובאותו היקף משרה. כפי שכותבת הדס פוקס ממרכז טאוב, הטענה הזו אינה נכונה ולדעתי עלולה לגרום נזק כפול. ראשית, היא עלולה להרחיק נשים מתעשיית ההיי-טק. ומכיוון שמדובר בהטעייה כל-כך ברורה, היא עלולה לשחק לידיים של אלו שמעדיפים להאמין שאין כלל אפליית שכר.
בהמשך ל-2 – הטענה (השגויה) שאין כל אפליית שכר בין גברים לנשים שנובעת באופן ישיר מהמגדר בצורה של אפליה או הטייה מבנית. אפשר למשל לראות דוגמא לכך במחקר שמביא אורן דניאלי בטוויטר, אבל יש עוד רבות.

הפוסט נועד לענות על שאלה אחרת – מה פערי השכר המגדריים בסקר שלנו וכיצד ניתן להסבירם ע”פ הנתונים הקיימים בסקר. חשוב להבהיר ש”הסבר” איננו הצדקה ופער “מוסבר” אינו בהכרח בלתי ניתן לשינוי. פער “מוסבר” (למשל, על ידי בחירת מקצוע או השכלה) יכול להיות תוצאה של אפליה מבנית והסללה, וכן של העדפות שונות. אין לי שום יכולת יכולת לענות על השאלות האלו מנתוני הסקר, אולם הניתוח יעזור לנו להבין על איזו שאלות צריך לענות ויכול להוות תרומה לשיח.

מי שרוצה לקרוא עוד פרטים טכניים וכן את רשימת המגבלות וההסתייגויות של הניתוח (ויש לא מעט כאלו. למשל שמדובר בנתונים תצפיתיים מסקר שהשתתפות בו וולונטרית, ועוד) יכול לקרוא בפוסט המפורט יותר כאן.

בפוסט ננסה לפרק את הנושא מכמה זויות. נתחיל במבט על כללי, נמשיך בחתכים ספציפיים, ולאחר מכן ננסה למצוא את פער השכר ה”לא מוסבר”, כלומר זה שנובע ישירות מהמגדר בסקר באמצעות כלים מעולם ההסקה הסיבתית ולמידת המכונה. נתחיל.

מבט על

נתחיל בהשוואות הנאיביות ביותר. השכר הממוצע לגבר במדגם היה כ-37.3 אלף שקל בחודש ברוטו. השכר הממוצע לאישה היה 34.4 אלף שקלים, שהם כ-8% פחות.

החלוקה לאחוזונים מספרת סיפור מעניין יותר: עד החציון, השכר של גברים ונשים דומה מאוד. אולם כשמגיעים לאחוזון ה-85 (בכל אחד מהמגדרים בנפרד), שכר הגברים כבר גבוה ב-10 אלף שקלים. באחוזון ה-95 הפער כבר מגיע ל-20 אלף שקלים כשהגברים הגיעו כבר למדרגת השכר המקסימלית בסקר (72.5 אלף שקלים בחודש) ואילו אישה באחוזון ה-95% בקרב הנשים תרוויח 20 אלף שקלים פחות.

חלוקה לחתכים

מבט העל הוא הדרך הנוחה והאינטואיטיבית ביותר להסתכל על הדאטה, אבל גם דרך בטוחה לפספס דברים רבים. ראשית, יתכן אפקט הטרוגני: פער השכר גבוה יותר או נמוך יותר בחתכים מסוימים. ושנית, אנחנו לא שולטים על המשתנים – על מנת שההשוואה שלנו תהיה בעלת ערך היא צריכה להיעשות בין תפוחים ותפוחים – כלומר בין נשים וגברים בתפקידים דומים, ברמת דומות של בכירות, השכלה, ניסיון וסטטוס ניהולי. הבעיה היא שכשמנסים לחתוך את הדאטה לפי כל כך הרבה משתנים מהר מאוד מגיעים לדליים ריקים ודאטה רועש.

לכן, אנחנו נאלצים להגביל את עצמנו למספר קטן של משתנים. המשתנים המתבקשים הם תפקיד ורמת בכירות. ברור שאין לנו סיבה לצפות לשכר זהה עבור תפקידים או רמות בכירות שונים. לכאורה, המשתנים האלו גם מגלמים במידה כזאת או אחרת את כל השאר – רמת הבכירות קורלטיבית מאוד לשנות הניסיון (וממילא ניסיון הוא מונח מעט מעורפל. אני, למשל, נמצא בתעשייה 8 שנים. אבל זה כולל עבודה במקצוע אחר, במשרת סטודנט וכו’. לכן כשמילאתי את הסקר סימנתי 5 שנות ניסיון). רמת ההשכלה ותחום ההשכלה רלוונטיים אבל ברגע שמדובר באותו תפקיד גם הם אמורים לשחק תפקיד משני.

אפילו כשחותכים את הדאטה על תפקיד ורמת בכירות בלבד, עבור רוב החיתוכים מספר הנשים קטן מדי (מתחת ל-10) ולכן המידע רועש מדי וקשה להסיק ממנו משהו. נשארנו עם מספיק דאטה בשני תפקידים בלבד – דאטה סיינטיסטית ומפתחת אלגוריתמים:

מה אפשר ללמוד מהגרפים? זה כנראה מתחיל להיות תלוי בפריורים. בשני התפקידים גברים במשרת סניור מרוויחים בממוצע יותר מנשים. בשאר הרמות הפערים הולכים לשני הכיוונים. התוצאה הזאת עקבית עם ממצאים אחרים שנראה בהמשך (כמו גם עם המחקר שציטט אורן דניאלי בטוויטר).

שיטות לבידוד האפקט המגדרי הישיר

נשתמש בשיטות מעולם ההסקה הסיבתית על מנט לשלוט בשלל ההבדלים בין הגברים לנשים בסקר. למרות שמבחינה פורמלית לא מדובר בבעיית סיבתיות קלאסית בה יש “טיפול” כלשהו שמפעילים חלק מהמשתתפים, עדין מדובר בכלים שימושיים מאוד. ראינו שפער השכר המגדרי הממוצע הוא מעט פחות מ-8%, אולם רובו ככל הנראה מתרכז ברמות השכר הגבוהות (עד החציון, האחוזונים של הגברים והנשים זהים). ראינו גם שבשני מקצועות ספציפיים – דאטה סיינטיסט ומפתח אלגוריתמים – גברים מרוויחים יותר במשרות סניור בעוד שבשאר רמות הבכירות הפערים לא עקביים. היינו רוצים לשלוט על כל המשתנים המתערבים הרלוונטיים כדי למצוא את הפער הממוצע שנובע ישירות מהמגדר. לשם כך נשתמש כאמור במספר שיטות מעולם ההסקה הסיבתית: Matching, Propensity Score, Oaxaca Decomposition וכן נעשה בימוש במודלים לומדים כמו Catboost ופרשנות שלהם באמצעות ערכיSHAP .

לפני שאנחנו ניגשים לשלוט על המשתנים שווה לשאול – האם יש בעיית איזון בדאטה שלנו? כלומר, האם התפלגות הנשים והגברים במדגם שונה, ובפרט, לאיזה כיוון נצפה שהשוני הזה (אם קיים) ישפיע מבחינת השכר?

נראה באילו פרמטרים יש לנו ייצוג יתר או חסר לנשים. האופן שבו עשיתי את זה הוא פשוט להשוות את הממוצע המנורמל (כלומר, לאחר חלוקה בסטיית תקן) עבור כל ערך בין גברים לנשים.

בצד הגברי ישנו ייצוג יתר לבעלי 10 שנות ניסיון ומעלה, סניורים, מנהלי קבוצות וראשי קבוצות. מדובר בחיתוכים עם רמות השכר הגבוהות ביותר, מה שכבר עשוי לרמז על הטייה ברורה בנתונים. גם פרופילים שמזוהים עם שכר נמוך יותר מהממוצע במדגם הם “גבריים” יותר, כמו למשל בוגרי כלכלה. מצד ה”נשי” ישנו ייצוג יתר לבוגרות מדעי הטבע (ביולוגיה, כימיה, מדעי המוח וכו’), בעלות פחות משנה ניסיון, לג’וניוריות ולעובדות שאינן מנהלות. ברובם אלו פרופילים שמזוהים עם שכר ממוצע נמוך יותר במדגם שלנו. מצד שני, הנשים במדגם הן משכילות יותר ויש להן ייצוג יתר בקרב הדאטה סיינטיסטיות, מה שמזוהה עם שכר גבוה יותר במדגם.

כמובן שזה לא עונה על השאלה מדוע מלכתחילה יש יותר גברים בפרופילים בהם השכר גבוה יותר, או מדוע השכר גבוה יותר בפרופילים גבריים יותר. שאלות שצריכות להיות חלק מהשיח אולם הן מעבר לסקופ של הפוסט הזה. יחד עם זאת, זה בהחלט מוכיח את הצורך בשליטה על המשתנים המתערבים אם רוצים למצוא את פער השכר שנובע באופן ישיר מהמגדר.

התאמה

השיטה הראשונה היא Matching, כלומר התאמה. נתאים לכל אישה במדגם את הגבר הדומה לה ביותר, ונבדוק את פער השכר הממוצע עבור זוגות כאלו. האתגר כאן הוא כמובן הגדרת הדמיון (או המרחק). ראשית נדרוש כמו בסעיף הקודם שהגבר והאישה יהיו באותו התפקיד וכן שלמדו אותו תחום. לאחר מכן נמצא את הזיווג כך שהמרחקים בין גברים ונשים מבחינת רמת הבכירות, ההשכלה, הניהול, שנות הניסיון, הגיל וסוג החברה יהיו הקטנים ביותר. המרחק מוגדר כמרחק אוקלידי לאחר נרמול המשתנים.

בסה”כ עבור כ-10 נשים לא נמצא כלל גבר באותו התפקיד ואותו תחום לימודים (שלא נתפס כבר בזיווג אחר). ההתאמה עצמה היתה מצוינת – כשהסתכלתי רק על 230 זוגות הגברים והנשים, התפלגות המשתנים השונים היתה הרבה יותר דומה, וההבדלים בממוצעים עבור הפיצ’רים השונים היו לא יותר מ-0.04 סטיות תקן במקרה הגרוע ביותר – נשים עדין היו משכילות יותר. זאת, לעומת הבדלים של מעל 0.1 סטיות תקן עבור מספר רב של משתנים בנתונים המקוריים. כאשר משווים בין הזוגות, פער השכר הממוצע מצטמצם ל-800 שקלים שהם 2.1%.

דרך נוספת לבצע התאמה היא להשתמש ב-Propensity Score. מדובר ב”ציון” שנועד להגיד עבור דוגמא מסוימת בדאטה, מה הסיכוי שמדובר (במקרה שלנו) באישה. את הציון הזה נוכל להשיג באמצעות מודל רגרסיה לוגיסטית שיתאמן על הדאטה בניסיון לחזות את המגדר מהפיצ’רים השונים. לאחר מכן, נבצע התאמה כמו קודם, רק שנשתמש ב-Propensity Score כמדד המרחק שלנו. גם בשיטה הזאת פער השכר הממוצע מצטמצם משמעותית למעט יותר מ-300 שקלים שהם מעט פחות מ-1.

ניתן להשתמש ב-propensity score על מנת למשקל את כל הדוגמאות במקום לבצע התאמה של גבר לאישה ולזרוק לפח את כל הדוגמאות שלא עשינו בהן שימוש (Inverse probability weighting). בשיטה הזאת פער השכר הממוצע הוא כ-840 שקלים שהם כ-2.2%.

מודלים לומדים

דרך אחרת לנסות לשלוט על כל המשתנים המתערבים היא באמצעות אימון מודלים לומדים וניסיונות פרשנות שלהם. הדרך המוכרת ביותר היא באמצעות רגרסיה לינארית – ניתן לאמן מודל לינארי שיחזה את השכר באמצעות כל המשתנים, כך שהמקדם של כל פיצ’ר (משתנה) הוא התרומה שלו לתוצאה. אם מאמנים רגרסיה לינארית לחיזוי השכר, המקדם של מגדר הוא 0.69-. מכיוון שהגדרתי את המגדר כך ש-“1” מייצג אישה, המשמעות היא שהמודל יתן לאישה אשר זהה לגבר בכל שאר הפיצ’רים שכר נמוך ב-690 שקלים (מכיוון שהשכר החזוי הוא ביחידות של אלפי שקלים). מדובר בפער שכר ממוצע של כ-1.8%.

רגרסיה לינארית מאפשרת לנו גם לפרק את הגורמים לפער השכר באמצעות וריאציה של פירוק Oaxaca: נאמן מודל רגרסיה על הגברים בלבד. לאחר מכן ניקח את הגבר ה”ממוצע” והאישה ה”ממוצעת”. נפעיל את המודל על שניהם. הפער בשכר החזוי הוא “הפער המוסבר”, ועל ידי הסתכלות על התרומה של כל רכיב לשכר החזוי והשוואה בין הגבר הממוצע לאישה הממוצעת נוכל לראות מה מסביר את הפער בצורה הטבה ביותר:

בגרף רואים שפערים ברמות הבחירות, הניסיון והניהול תורמים ביחד כ-2200 שקלים לפער הממוצע, כמו גם מיעוט גברים בתחומי מדעי הטבע וריבוי גברים במדעי המחשב. מהצד השני, רמת ההשכלה הגבוהה של הנשים ומיעוט הנשים בוגרות הכלכלה מצמצים מעט את הפער.

מודלים מסובכים יותר לא מציעים פרשנות מיידית, אולם ניתן להסביר אותם באמצעות כל מיני כלים כמו ערכי SHAP בהם השתמשתי בניסיון להסביר את מחשבון השכר. אימנתי מודל Catboost (דומה לזה שהשתמשתי בו למחשבון השכר, אולם הפעם יחד עם פיצ’רים שדאגתי שלא לקחת בחשבון במחשבון השכר כמו מין וגיל), ולאחר מכן חישבתי את ערכי SHAP הממוצעים עבור ערכים שונים של הפיצ’רים השונים. בממוצע, ערך ה-SHAP הממוצע עבור נשים (כלומר, עבור הערך “אישה” בפיצ’ר “מגדר”) הוא 470-. כלומר, פער שכר של 470 שקלים בממוצע לטובת הגברי, הפרש שמתאים לפער שכר של 1.3% שנובע מהמגדר בלבד.

דרך אחרת (פחות טובה, אבל אולי שקופה יותר למשתמש) לקרב את האופן בו המודל למד את הקשר בין מגדר לשכר היא לבצע A/B Test סינתטי. ניקח את כל הדוגמאות שהמודל לא ראה, נחליף להן את המגדר ונראה את ההשפעה על השכר החזוי. התוצאה שיטה הזאת דומה מאוד – בממוצע, המודל מייחס למגדר השפעה של כ-480 שקלים בממוצע (למעלה במידה ומדובר בגבר, למטה במידה ומדובר באישה).

סיכום ביניים – כששמנסים לשלוט על המשתנים המתערבים, רוב פער השכר הממוצע מצטמצם לכ-0.9-2.2%, אולם לא נעלם לגמרי. פער השכר הממוצע ברובו לא נובע מאפליה או הטייה ישירה אלא מגורמים עקיפים. יחד עם זאת הפער שנובע מהטייה ישירה הוא לא 0, אלא כמה מאות שקלים בחודש.

Synthetic A/B test on Catboost model	Average SHAP values on Catboost	Regression Coefficient	Propensity Score Inverse Weighting	Propensity Score Matching	Matching	Method
480 1.3%	470 1.3%	690 1.8%	840 2.2%	350 0.9%	800 2.1%	Unexplained Average Gap

אפקט הטרוגני – פער השכר תלוי בהרבה דברים

עד עכשיו עסקנו רק בניסונות לחלץ את פער השכר הממוצע תוך כדי שליטה על כל המשתנים המתערבים, ראינו שרוב הפער הממוצע מוסבר על ידי רמת הבכירות, הניהול והניסיון. אולם, נותן באופן עקבי פער שכר לא מוסבר של כ-1-2% לרעת הנשים, לא משנה באיזו שיטה נסתכל על כך. ראינו גם שפערי השכר הכללים עולים עם הגיל, ושבחלוקה לאחוזונים פערי השכר נמצאים באופן בלעדי באחוזונים הגבוהים. מכאן שפער השכר (הלא המוסבר) הוא ככל הנראה הטרוגני – קיים יותר במקצועות, תפקידים או רמות בכירות שונים.

על מנת להעריך את האפקט ההטרגוני השתמשתי ב-Causal Forest. בקצרה, מדובר במודלים מבוססים עצים המזכירים את Random Forest, אולם במקום לחזות ערך מסוים או שייכות לקבוצה מסוימת, הם מנסים לחזות את האפקט הסיבתי של התערבות כלשהי עבור חלוקות שונות של הדאטה. התוצאות שקיבלנו מעניינות מאוד – באופן עקבי פער השכר הלא מוסבר, כלומר זה שנראה כאילו הוא נובע ישירות מהמגדר, גבוה הרבה יותר בפרופילים בעלי שכר גבוה (באחוזים, לא רק באופן אבסולוטי). כך למשל, המודל חוזה פער שכר לא מוסבר של כ-5% בין גברים ושנים בעלי ניסיון רב שמוגדרים כסניורים. מצד שני, עבור רוב הפרופילים המודל לא חוזה פער שכר לא מוסבר. באופן כללי, עבור מקבלי השכר ה”””נמוך””” במדגם, מתחת ל-35-40 אלף שקל, המודל כמעט ולא מצא פערי שכר לא מוסברים. מכיוון שרווחי הסמך היו מסדר גודל של כ-3%, רוב הפערים אינם מאוד מובהקים אולם המגמה בה פערי השכר עולים עם הבכירות ברורה מאוד.

סיכום

פער השכר הממוצע בין גברים לנשים במדגם היה כ-7-8%. רוב (כשלושה רבעים) מהפער הוא “מוסבר”. כלומר כזה שמגיע ממשתנים מתערבים שאינם המגדר באופן ישיר. בפרט, רוב הפער נובע מרמות בכירות, ניסיון וניהול שונות. כלומר, בניגוד ממה שאולי ניתן היה לחשוב, רוב הפער לא נובע מבחירה שונה של מקצועות לימוד או תפקידים (לדוגמא, נשים מביולוגיה וגברים ממדעי המחשב, או נשים אנליסטיות וגברים חוקרי אלגוריתמים). רוב הפער נובע ממיעוט נשים בתפקידי סניור, ברמות ניהול גבוהות ועם הרבה ניסיון.

כרבע מהפער הוא “לא מוסבר”. כלומר כזה שלא ניתן להסביר באמצעות הנתונים. והוא נובע מאפליה ישירה, אפליה מערכתית או משתנים אחרים שלא שאלנו עליהם. הפער הזה, גם באחוזים וגם בסכומים אבסולוטים הוא קטן, אבל זה כנראה הרבה יותר קל להגיד את זה כגבר שלא משלם פרמייה של כמה מאות שקלים בחודש על המגדר שלו. גם הפער הזה הטרגוני – הוא קיים כמעט ורק ברמות הבכירות והניסיון הגבוהות – גבר שמוגדר כסניור ובעל שנות ניסיון רבות צפוי לקבל שכר גבוה ב-5% מאישה בעלת פרופיל דומה, על פי המודל שהשתמשתי בו. ברמות הניסיון והבכירות הנמוכות פער השכר לרוב לא קיים ולעתים מתהפך.

רוב פער השכר בסקר שלנו נובע ממיעוט נשים בתפקידים בכירים, ומיעוטו מכך שגם כשהן מגיעות לתפקידים בכירים, שכרן נמוך ממקביליהן הגבריים.

הניתוח מוגבל במובנים רבים מאוד וחלק מהתוצאות לא מאוד מובהק, אולם העקביות של התוצאות זו עם זו ועם ידע קיים גורמת לי להאמין שמדובר בתוצאות אמינות.

בסופו של דבר הנתונים, לדעתי, מצביעים לכיוון ברור. לפחות בהקשר של תעשיית הדאטה והמאשין לרנינג בישראל – פער השכר יצטמצם באמת רק כשיהיו נשים רבות באותם תפקידי סופרסטאר – תפקידי סניור וניהול בכירים לעובדים ועובדות מנוסים. את הדרך לשם אני לא יכול לדעת מהנתונים, לכן אני מקווה שהם יעלו ויתרמו לשיח בנושא. עד אז ניתן לשאוב הרבה עידוד מכך שברמות השכר הבינוניות וה-“””נמוכות”””, ברובם המוחלט של התפקידים, קשה מאוד למצוא פערי שכר מגדריים בסקר שלנו.

הפוסט נכתב על ידי

Inbar

עוד בנושא:

סיכום אירוע Google I/O 2024 – כל ההכרזות (והפרשנות) במקום אחד

כללי