מחקר: זיהוי אמת או שקר בשימוש בבינה מלאכותית

07/02/2024

זמן קריאה: 1 דק'

מחקר באוניברסיטת אריאל, במסגרת תוכנית לאומית בהובלת רשות החדשנות לעידוד מחקר ופיתוח בתחום עיבוד השפה הטבעית (NLP) ובמימונה, נועד לשיפור יכולות עיבוד השפה בעברית. לדברי פרופ' עמוס עזריה מבית הספר למדעי המחשב באוניברסיטת אריאל, "כיום ברור שהבינה המלאכותית היא חלק בלתי נפרד מהעתיד של כולנו, אך בשל מגוון סיבות יכולותיה בעברית לוקות בחסר. לכן הרשות לחדשנות יצאה בקול קורא שנועד לצמצם את הפער בין היכולות של הבינה המלאכותית בעברית ליכולותיה באנגלית."

מודלי שפה כגון ChatGPT מאומנים על כמויות עצומות של דאטה. הם יוצרים תגובה על ידי יצירת מילה אחר מילה. אבל בניגוד לאנשים, הם לעולם לא בוחרים באפשרות למחוק. זה לא מפתיע, כי למרות שלדאטה, שמודלי השפה התאמנו עליה, מן הסתם התלוו מחיקות רבות, המחיקות לא מופיעות בדאטה. אבל כמו שבתהליך כתיבה אפשר לזהות תוך כדי כתיבה שככל הנראה נכון למחוק משפט ולכתוב אותו אחרת, לעיתים בגלל שהניסוח המקורי לא היה מדויק או לא נכון, גם למודלי שפה עשויה להיות היכולת הזאת.

במחקר בהובלת פרופ' עמוס עזריה במסגרת תארים מתקדמים בבית הספר למדעי המחשב באוניברסיטת אריאל, נעשה שימוש בערכים הפנימיים של מודל השפה כדי לזהות מתי משפט שמודל השפה עצמו יצר אינו נכון. לדוגמה, "פריז היא עיר הבירה של צרפת = אמת", "כדור הארץ שטוח = שקר". כלומר בתהליך הניבוי מודל השפה מחשב ערכי ביניים רבים שעוזרים לו לנבא את המילה הבאה. אנו בונים מערכת למידת מכונה שיכולה להשתמש בערכי הביניים המחושבים על ידי מודל השפה כדי לנבא אם משפט שמודל מייצר הוא אמת או שקר.

פרופ' עמוס עזריה: "מערכת למידת המכונה הנבנית במסגרת זו מבוססת על מאגר משפטים שבהם אנו יודעים אם מדובר במשפט אמת או במשפט שקר. במחקר זה נבחנים ערכי הביניים למשפטים אלו, כך שכאשר מגיע משפט חדש, אפשר לבחון אם ערכי הביניים שלו דומים יותר לערכי הביניים של משפט שקרי או של משפט אמיתי."

תגובות

הוספת תגובה