您好,歡迎到訪!

對話Soul App CTO:看好多模態端到端大模型落地社交,新能力預計年底上線

2024-10-20 01:32:17 3

圖片由Soul官方提供

圖片由Soul官方提供

社交平臺Soul App在出海方向上有了新的進展。他們將最新自研的3D虛擬人多模態AI互動體驗首次落地10月14日-18日舉辦的迪拜GITEX GLOBAL海灣資訊科技博覽會上。

這也是Soul自2016年上線以來,首次亮相國際大型展會。在大會現場,參與體驗的使用者可以實現高相似度的3D虛擬人的AI建模,透過包含人臉的90餘個形狀引數和6個屬性引數,於幾秒鐘內,快速在3D世界精細化還原真實人臉的特徵 ,打造專屬的虛擬化身。

據Soul App CTO 陶明對鈦媒體APP介紹,該模型具備多模態理解、真實擬人、文字對話、語音通話、多語種等特性,實現更接近人類模式的互動體驗。

“目前可以看到的是,海外市場對AIGC+社交的接受度非常高。”陶明對鈦媒體APP表示。

從具體的資料增長情況來看,根據第三方資料公司data.ai,美國等海外市場的社交應用榜單TOP30上,已經頻繁出現瞭如Pengu、Linky AI等AI社交型別的產品。

比如說Character.AI,儘管已經被Google以25億美元收購,但在全球收穫超過2億使用者後,Character.AI也透過2023上線後的瘋狂增長速度,證明了海外使用者對AIGC+社交產品的歡迎與認可。

不過,陶明也發現,目前在海外還沒有見到特別亮眼的“AIGC+社交”的相關產品。

這背後主要的原因是,海外市場的重點其實還是聚焦在技術能力的突破上,而技術突破和應用層落地之間,有比較大的割裂,或者說,海外並不著急把技術儘快落地。

而國內目前的情況是,在技術上很多公司與海外巨頭相比,存在一定的差距,但優勢在於場景和應用的快速落地。這是國內在移動網際網路、數字經濟時代就有的鮮明特徵。

所以,他認為,在“AIGC+社交”方向,國內的應用落地探索反而會是更快速和積極的。

“在推進AIGC+社交業務落地的過程中,我們採取的是‘模應一體’思路,大模型是Soul解決使用者社交需求的方案之一,不是最終目的。”陶明說。

2016年,Soul在上線時,一個基本的思路是,希望能夠線上上創造一個新的世界,它與現實世界可以不一樣,是真實存在的另一個平行世界,但更有歸屬感。

所以,當時Soul沒有采用彼時社交產品流行的匯入通訊錄現實關係,或者LBS的模式,而是採用了AI的解決方案,即,用基於AI演算法的靈犀引擎,主要是透過對使用者在站內多元場景下的行為資料分析,為使用者推薦有可能結成深度社交關係的人,以去中心化的機制分發關係和內容。

這是Soul用AI對社交關係中“發現”環節的變革,也讓Soul在使用者層面形成了非常差異化的認知,在上線後,以很快地速度獲得了市場的使用和認可。

截至2022年,Soul的月活使用者近3000萬,其中,Z世代使用者佔比超過78%;平臺月活躍15天以上的使用者佔比63.7%;人均使用者日均使用時長為46.4分鐘,日均私人資訊數為66.9條。

靈犀引擎的推出和受認可,讓Soul堅定了對AI的投入,後續,Soul還陸續推出了整合AI的NAWA引擎,以及AI苟蛋等相關應用。

從目前推出的一系列新功能的使用者反饋來看,AI的應用讓Soul的使用者對話輪數、次留、使用者時長等關鍵資料都有不錯的表現,並且在持續增長中。

陶明舉例說,使用者平均每天會給AI苟蛋傳送超過70條訊息,互動平均時長超過30分鐘。而在輔助對話方面,在AI的參與下,陌生關係的對話方塊回覆率提高了接近十個百分點。

整體來看,陶明認為,AI對Soul的使用者產生了可持續的價值,同時也在Soul整體的使用者時長、粘性、使用者體驗等方面都有積極、正向的助力,“這對我們來說就是難以衡量的收益”。

但AI在社交領域現有的應用落地實踐,距離實現行業徹底的變革還有一定差距,陶明認為,這其中主要的挑戰還在於技術側。

以Soul關注的情感關懷這個方向為例,他認為,讓AI理解社交、理解情感和情緒這件事情,這其實也是當下AGI的難題。比如說,面對“我感冒了”的資訊,在不同的場景中,回答“多喝熱水”可能並不是讓使用者滿意的答案。

另一方面在於應用層,如何理解使用者核心的社交需求,將前沿的技術能力轉化為使用者需要的產品功能。

諸多難點之下,可以看到的是,AI對話類的產品正經歷新一輪的洗牌,相關產品正在批次式關停。

很大程度上,這是因為得益於ChatGPT橫空出世,以及對話模型的開源,很多AI聊天APP,背後直接使用了開源模型,於是,市場上AI社交應用批次湧現,但問題也隨之而來:同質化情況嚴重,人機互動體驗、情緒價值反饋沒有顯著的改善,導致使用者留存差,也無法實現有效的商業化。

而Soul在快速落地“AIGC+社交”的實踐中發現,很多方向也在逐一被證偽。比如說,做“AI苟蛋”的時候,團隊希望它能說會唱、能識圖、有形象。他們原本也以為,把很多資源投入到每個點上,每個點都做得最好,一定能實現不錯的使用者反饋,但最終發現資源用了很多,效果並不明顯。

“能說會唱只是一種增益,對話能力,即聊天的情感化再加上語境裡的場景構建是最重要的。在不同場景,一個人用同樣一句語料所表達的情感不一樣,大模型產品在這裡的改進空間還很大。我們的經驗總結是,要先把基礎分做好,然後再最佳化增益項。”陶明對鈦媒體APP說。

在市面上眾多AI人機互動產品之中,要做出差異化的關鍵在於“大模型的情感能力”。 而陶明認為,人機互動的本質,是讓AI與人社交。社交的本質是情感的流動,只有能夠實現情感的識別,才能讓AI更好地理解人性、情緒和情感,實現理想的人機互動。

這需要大模型多模態的、具備擬人化屬性,確保實現情感化、個性化和生活化。也就是說,情感識別是Soul一直在持續投入攻克的難點。

下一階段,具備情感能力的大模型或許將會是“AIGC+社交”行業競爭的新焦點,同時,在“AIGC+社交”方向的探索過程中,產品形態不會僅侷限於對話場景。

AI Agent是承載AI社交服務的重要載體,也是完成人機互動體驗的重要組成。從更大視角來看,當人們習慣於與AI Agent對話、互動,AI Agent便成為人們接觸數字世界和數字服務的入口,這將進一步開啟“AI+社交”賽道的發展空間。

陶明更看好的是,多模態端到端大模型的應用,特別是在情感能力突破、多模態互動和端到端能力方向。

情感能力突破指向的是AI更能理解、反饋人類,多模態互動則更接近真實、自然的真人日常互動模式,端到端則意味著,為使用者服務的底層方案的創新和真正意義上“在場感”的實現。

“這都是顛覆社交體驗的關鍵。”陶明說,快的話,預計在今年年底,Soul多模態端到端大模型將再次升級,推出全雙工視訊通話能力,讓使用者可以便捷、自然地體驗到包括文字、語音、視覺在內的多模態創新互動。(作者|李程程,編輯|胡潤峰)

文章版權及轉載聲明

本站內容由互聯網用戶自發貢獻,該文觀點僅代表作者本人。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如發現本站有涉嫌抄襲侵權/違法違規的內容,請發送郵件至舉報,壹經查實,本站將立刻刪除。