2024-10-20 01:31:52 5
IT之家 10 月 19 日訊息,據路透社報道,Meta 當地時間週五宣佈,其研究團隊推出了一系列新的 AI 模型,其中包括一個名為“自我訓練評估器”的工具。該工具有望推動 AI 開發過程中減少對人類干預的依賴。這個工具早前在 8 月的論文中首次亮相,其使用與 OpenAI 新發布的 o1 模型類似的“思維鏈”技術,讓 AI 對模型的輸出做出可靠判斷。
這種技術將複雜問題分解為多個邏輯步驟,從而提高了在科學、程式設計和數學等高難度領域中的答案准確性。Meta 的研究人員使用完全由 AI 生成的資料來訓練這個評估器,從而在這一過程中完全摒棄了人類的參與。
使用 AI 來評估 AI 的能力展示了實現自主 AI 智慧體的可能性,這類代理能夠從自身錯誤中學習。兩位負責該專案的 Meta 研究人員表示,許多 AI 專家設想未來可以開發出“智慧化程度極高”的數字助手,可以自主處理大量任務,而無需人類介入。
自我改進的模型有望減少目前使用的“基於人類反饋的強化學習”(RLHF)過程的需求。這一過程往往昂貴且低效,因為它依賴於擁有專業知識的人類來標註資料和驗證複雜問題的答案是否正確。
“我們希望,隨著 AI 的發展,它能超越人類,逐漸具備自行檢查工作的能力,並在準確性上超過普通人類水平,”專案研究員之一 Jason Weston 說。“自我訓練和評估的能力是實現超人級 AI 的關鍵因素之一。”他補充道。
IT之家從報道中獲悉,包括谷歌和 Anthropic 在內的其他科技公司也在研究 RLAIF(基於 AI 反饋的強化學習)這一概念,但與 Meta 不同,這些公司通常不會公開發布其研究模型。
Meta 此次釋出的其他 AI 工具還包括對其影象識別模型“Segment Anything”的更新,一個加速大語言模型響應時間的工具,以及一些有助於發現新型無機材料的資料集。
本站內容由互聯網用戶自發貢獻,該文觀點僅代表作者本人。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如發現本站有涉嫌抄襲侵權/違法違規的內容,請發送郵件至舉報,壹經查實,本站將立刻刪除。