מאמר חדש

מאמר חדש של הדוקטורנט דוד פיטרמן, מבית הספר לטיפול ייעוץ והתפתחות האדם, בהנחיית פרופ' זוהר אליוסף, שם המאמר: "Would ChatGPT Help Me Eat My Dead Dog? Probing Moral Judgment and Moral Action in Large Language Models" . המאמר פורסם בכתב בכתב העת Computers in Human Behavior: Reports (מדורג 4/102 בפסיכולוגיה ניסויית). המחקר הובל על ידי פרופ' אביטל מנטוביץ מהפקולטה למשפטים, בשיתוף עם ד"ר יאיר בן-דוד. המחקר בחן האם מודלי שפה גדולים לא רק "מדברים מוסר" אלא גם פועלים בהתאם — וחשף פער מטריד: כשהמודלים נשאלו לדעתם, הם גינו מעשים טאבו בדומה לבני אדם, אך כשהופעלו במצב סוכני והתבקשו לסייע בביצוע אותם מעשים בפועל — הם צייתו ברוב המוחלט של המקרים. זהו אחד המחקרים הראשונים הבוחנים התנהגות מוסרית בפועל של בינה מלאכותית סוכנית, והוא מצביע על אתגר מרכזי בבטיחות AI.

כל הכבוד לדוד על ההישג!

לקריאה מלאה של המאמר >>

הדוקטורנט דוד פיטרמן

פרופ' זהר אליוסף

הפקולטה לחינוך

אוניברסיטת חיפה

מאמר חדש