2024-11-26 01:30:48 1
IT之家 11 月 25 日訊息,據 The Decoder 今日報道,斯坦福大學、華盛頓大學和 Google DeepMind 的研究人員聯合開發了一種 AI 智慧體(AI Agent,也稱“AI 代理”),能夠在社會實驗中逼真地模擬人類行為。
研究指出,這類模擬系統可以作為一個虛擬實驗室,幫助驗證經濟學、社會學、組織學和政治科學中的理論。研究團隊透過對 1000 多名具有代表性的美國人(覆蓋多種年齡、性別、教育背景和政治立場)進行訪談,建立了這些 AI 智慧體模型。
系統執行方式是將詳細的訪談記錄與 GPT-4o 模型結合。當使用者向智慧體提問時,系統會載入訪談記錄並讓 AI 模仿受訪者的回答。為生成這些記錄,研究團隊對每位受訪者進行了長達兩小時的訪談,並透過 OpenAI 的 Whisper 技術將對話轉錄成文字。
研究團隊設計了多個測試,評估 AI 對人類行為的預測能力,涵蓋《通用社會調查》、大五人格評估以及若干行為經濟學實驗。
結果顯示,基於訪談資料的 AI 在預測社會調查(GSS)問題時,準確率高達 85%,遠超單純依賴人口統計資訊的 AI 智慧體。
研究團隊在五項社會科學實驗中測試了人類與 AI 的表現,其中四項研究顯示,AI 的結果與人類高度一致。相關係數高達 0.98,表明 AI 對人類行為有極強的模擬能力。
與傳統的人口統計法相比,訪談驅動的 AI 顯示出顯著的優勢,尤其是在處理不同種族群體和政治觀點的預測時更加準確,同時也能有效減少人口統計類別之間的偏差。
研究團隊已將包含 1000 個 AI 模型的資料集開放至 GitHub,並建立了兩層訪問機制。綜合性資料對研究人員完全開放,而個別參與者的詳細資料則需經過特殊審批。
本站內容由互聯網用戶自發貢獻,該文觀點僅代表作者本人。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如發現本站有涉嫌抄襲侵權/違法違規的內容,請發送郵件至舉報,壹經查實,本站將立刻刪除。