您好，歡迎到訪!

對話Soul App CTO：看好多模態端到端大模型落地社交，新能力預計年底上線

2024-10-20 01:32:17 3

圖片由Soul官方提供

社交平臺Soul App在出海方向上有了新的進展。他們將最新自研的3D虛擬人多模態AI互動體驗首次落地10月14日-18日舉辦的迪拜GITEX GLOBAL海灣資訊科技博覽會上。

這也是Soul自2016年上線以來，首次亮相國際大型展會。在大會現場，參與體驗的使用者可以實現高相似度的3D虛擬人的AI建模，透過包含人臉的90餘個形狀引數和6個屬性引數，於幾秒鐘內，快速在3D世界精細化還原真實人臉的特徵，打造專屬的虛擬化身。

據Soul App CTO 陶明對鈦媒體APP介紹，該模型具備多模態理解、真實擬人、文字對話、語音通話、多語種等特性，實現更接近人類模式的互動體驗。

“目前可以看到的是，海外市場對AIGC+社交的接受度非常高。”陶明對鈦媒體APP表示。

從具體的資料增長情況來看，根據第三方資料公司data.ai，美國等海外市場的社交應用榜單TOP30上，已經頻繁出現瞭如Pengu、Linky AI等AI社交型別的產品。

比如說Character.AI，儘管已經被Google以25億美元收購，但在全球收穫超過2億使用者後，Character.AI也透過2023上線後的瘋狂增長速度，證明了海外使用者對AIGC+社交產品的歡迎與認可。

不過，陶明也發現，目前在海外還沒有見到特別亮眼的“AIGC+社交”的相關產品。

這背後主要的原因是，海外市場的重點其實還是聚焦在技術能力的突破上，而技術突破和應用層落地之間，有比較大的割裂，或者說，海外並不著急把技術儘快落地。

而國內目前的情況是，在技術上很多公司與海外巨頭相比，存在一定的差距，但優勢在於場景和應用的快速落地。這是國內在移動網際網路、數字經濟時代就有的鮮明特徵。

所以，他認為，在“AIGC+社交”方向，國內的應用落地探索反而會是更快速和積極的。

“在推進AIGC+社交業務落地的過程中，我們採取的是‘模應一體’思路，大模型是Soul解決使用者社交需求的方案之一，不是最終目的。”陶明說。

2016年，Soul在上線時，一個基本的思路是，希望能夠線上上創造一個新的世界，它與現實世界可以不一樣，是真實存在的另一個平行世界，但更有歸屬感。

所以，當時Soul沒有采用彼時社交產品流行的匯入通訊錄現實關係，或者LBS的模式，而是採用了AI的解決方案，即，用基於AI演算法的靈犀引擎，主要是透過對使用者在站內多元場景下的行為資料分析，為使用者推薦有可能結成深度社交關係的人，以去中心化的機制分發關係和內容。

這是Soul用AI對社交關係中“發現”環節的變革，也讓Soul在使用者層面形成了非常差異化的認知，在上線後，以很快地速度獲得了市場的使用和認可。

截至2022年，Soul的月活使用者近3000萬，其中，Z世代使用者佔比超過78%；平臺月活躍15天以上的使用者佔比63.7%；人均使用者日均使用時長為46.4分鐘，日均私人資訊數為66.9條。

靈犀引擎的推出和受認可，讓Soul堅定了對AI的投入，後續，Soul還陸續推出了整合AI的NAWA引擎，以及AI苟蛋等相關應用。

從目前推出的一系列新功能的使用者反饋來看，AI的應用讓Soul的使用者對話輪數、次留、使用者時長等關鍵資料都有不錯的表現，並且在持續增長中。

陶明舉例說，使用者平均每天會給AI苟蛋傳送超過70條訊息，互動平均時長超過30分鐘。而在輔助對話方面，在AI的參與下，陌生關係的對話方塊回覆率提高了接近十個百分點。

整體來看，陶明認為，AI對Soul的使用者產生了可持續的價值，同時也在Soul整體的使用者時長、粘性、使用者體驗等方面都有積極、正向的助力，“這對我們來說就是難以衡量的收益”。

但AI在社交領域現有的應用落地實踐，距離實現行業徹底的變革還有一定差距，陶明認為，這其中主要的挑戰還在於技術側。

以Soul關注的情感關懷這個方向為例，他認為，讓AI理解社交、理解情感和情緒這件事情，這其實也是當下AGI的難題。比如說，面對“我感冒了”的資訊，在不同的場景中，回答“多喝熱水”可能並不是讓使用者滿意的答案。

另一方面在於應用層，如何理解使用者核心的社交需求，將前沿的技術能力轉化為使用者需要的產品功能。

諸多難點之下，可以看到的是，AI對話類的產品正經歷新一輪的洗牌，相關產品正在批次式關停。

很大程度上，這是因為得益於ChatGPT橫空出世，以及對話模型的開源，很多AI聊天APP，背後直接使用了開源模型，於是，市場上AI社交應用批次湧現，但問題也隨之而來：同質化情況嚴重，人機互動體驗、情緒價值反饋沒有顯著的改善，導致使用者留存差，也無法實現有效的商業化。

而Soul在快速落地“AIGC+社交”的實踐中發現，很多方向也在逐一被證偽。比如說，做“AI苟蛋”的時候，團隊希望它能說會唱、能識圖、有形象。他們原本也以為，把很多資源投入到每個點上，每個點都做得最好，一定能實現不錯的使用者反饋，但最終發現資源用了很多，效果並不明顯。

“能說會唱只是一種增益，對話能力，即聊天的情感化再加上語境裡的場景構建是最重要的。在不同場景，一個人用同樣一句語料所表達的情感不一樣，大模型產品在這裡的改進空間還很大。我們的經驗總結是，要先把基礎分做好，然後再最佳化增益項。”陶明對鈦媒體APP說。

在市面上眾多AI人機互動產品之中，要做出差異化的關鍵在於“大模型的情感能力”。而陶明認為，人機互動的本質，是讓AI與人社交。社交的本質是情感的流動，只有能夠實現情感的識別，才能讓AI更好地理解人性、情緒和情感，實現理想的人機互動。

這需要大模型多模態的、具備擬人化屬性，確保實現情感化、個性化和生活化。也就是說，情感識別是Soul一直在持續投入攻克的難點。

下一階段，具備情感能力的大模型或許將會是“AIGC+社交”行業競爭的新焦點，同時，在“AIGC+社交”方向的探索過程中，產品形態不會僅侷限於對話場景。

AI Agent是承載AI社交服務的重要載體，也是完成人機互動體驗的重要組成。從更大視角來看，當人們習慣於與AI Agent對話、互動，AI Agent便成為人們接觸數字世界和數字服務的入口，這將進一步開啟“AI+社交”賽道的發展空間。

陶明更看好的是，多模態端到端大模型的應用，特別是在情感能力突破、多模態互動和端到端能力方向。

情感能力突破指向的是AI更能理解、反饋人類，多模態互動則更接近真實、自然的真人日常互動模式，端到端則意味著，為使用者服務的底層方案的創新和真正意義上“在場感”的實現。

“這都是顛覆社交體驗的關鍵。”陶明說，快的話，預計在今年年底，Soul多模態端到端大模型將再次升級，推出全雙工視訊通話能力，讓使用者可以便捷、自然地體驗到包括文字、語音、視覺在內的多模態創新互動。（作者｜李程程，編輯｜胡潤峰）

本文標籤對話 soul app to 看好多模態端到端大模型落地社交新能力預計年底上線

文章版權及轉載聲明

本站內容由互聯網用戶自發貢獻，該文觀點僅代表作者本人。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。如發現本站有涉嫌抄襲侵權/違法違規的內容,請發送郵件至舉報，壹經查實，本站將立刻刪除。

部分使用者反饋其微軟賬號遭到疲勞攻擊，被頻繁登入

« 上一篇 2024-10-20

這屆年輕人，流行在直播間搶“捏捏”

2024-10-20 下一篇 »

對話Soul App CTO：看好多模態端到端大模型落地社交，新能力預計年底上線

最近發布

隨便看看

熱門標簽

關于我們

對話Soul App CTO：看好多模態端到端大模型落地社交，新能力預計年底上線

相關文章

最近發布

隨便看看

熱門標簽

關于我們