מודל פתוח ראשון אומן על פלטי GPT-4

ים פלג, 10/04/2023

קטגוריה: כללי

—

מודל

המודל אומן על בסיס אלפקה (כרגע בגודל 7B בלבד).

אלפקה: למה שאומן על בסיס "מה GPT-3 היה עונה?"

דאטה

הדאטהסט מכיל כ20,000 שיחות ארוכות עם GPT-4 המתחלקות לשלוש קטגוריות:

הוראות (Instruct) – תפקידן ללמד את המודל לבצע הוראות בשפה אנושית. דוגמה: "כתוב מייל לרמי לוי שבמשלוח האחרון קיבלתי מילקי רגיל ולא מילקי רק קצפת ואני רוצה פיצוי על עוגמת הנפש."
העמדת פנים (Roleplay) – תפקידן ללמד את המודל לכתוב מנקודת מבטו של אדם אחר. דוגמה: "אתה נוסע בזמן מלפני 30 שנה. הסבר לכולנו איך יכול להיות שעדיין סרטי הצעקה בקולנוע בשנת 2023?!"
שימוש בכלים (Toolformer) – תפקידן ללמד את המודל להשתמש בכלים. מודלי שפה אמנם טובים מאוד בכל מניי משימות. (למשל: תרגילי חשבון) אבל "ייצוא" חלקים מהעבודה לכלים חיצוניים (למשל: מחשבון) מפחית את התלות בהם וממזער טעויות. דוגמה: "הכבישים החסומים היום הם ynet_traffic(datetime.now())"