您好，歡迎到訪!

斯坦福大學、華盛頓大學研究：1000個AI智慧體預測人類行為，準確率最高可達85%

2024-11-26 01:30:48 1

IT之家 11 月 25 日訊息，據 The Decoder 今日報道，斯坦福大學、華盛頓大學和 Google DeepMind 的研究人員聯合開發了一種 AI 智慧體（AI Agent，也稱“AI 代理”），能夠在社會實驗中逼真地模擬人類行為。

研究指出，這類模擬系統可以作為一個虛擬實驗室，幫助驗證經濟學、社會學、組織學和政治科學中的理論。研究團隊透過對 1000 多名具有代表性的美國人（覆蓋多種年齡、性別、教育背景和政治立場）進行訪談，建立了這些 AI 智慧體模型。

系統執行方式是將詳細的訪談記錄與 GPT-4o 模型結合。當使用者向智慧體提問時，系統會載入訪談記錄並讓 AI 模仿受訪者的回答。為生成這些記錄，研究團隊對每位受訪者進行了長達兩小時的訪談，並透過 OpenAI 的 Whisper 技術將對話轉錄成文字。

研究團隊設計了多個測試，評估 AI 對人類行為的預測能力，涵蓋《通用社會調查》、大五人格評估以及若干行為經濟學實驗。

結果顯示，基於訪談資料的 AI 在預測社會調查（GSS）問題時，準確率高達 85%，遠超單純依賴人口統計資訊的 AI 智慧體。

研究團隊在五項社會科學實驗中測試了人類與 AI 的表現，其中四項研究顯示，AI 的結果與人類高度一致。相關係數高達 0.98，表明 AI 對人類行為有極強的模擬能力。

與傳統的人口統計法相比，訪談驅動的 AI 顯示出顯著的優勢，尤其是在處理不同種族群體和政治觀點的預測時更加準確，同時也能有效減少人口統計類別之間的偏差。

研究團隊已將包含 1000 個 AI 模型的資料集開放至 GitHub，並建立了兩層訪問機制。綜合性資料對研究人員完全開放，而個別參與者的詳細資料則需經過特殊審批。

文章版權及轉載聲明

本站內容由互聯網用戶自發貢獻，該文觀點僅代表作者本人。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。如發現本站有涉嫌抄襲侵權/違法違規的內容,請發送郵件至舉報，壹經查實，本站將立刻刪除。