原標題:Soul創(chuàng)始人張璐團隊推出多模態(tài)社交應用,促進社交體驗創(chuàng)新迭代
在AI大模型全面發(fā)展的當下,多模態(tài)模型是當前訓練和開發(fā)的重要方向,在社交行業(yè)實踐中顯現(xiàn)出極強的可交互性,能夠提升應用的可用性,帶來更豐富的社交體驗。新型社交平臺Soul App創(chuàng)始人張璐團隊正積極迭代升級多模態(tài)能力,致力打造社交“多邊形戰(zhàn)士”。
Soul的“AI+社交”布局正朝著多模態(tài)方向不斷升級,而促進虛擬人在文字、語音、圖片等方面模態(tài)的相互結(jié)合是Soul的主攻方向。在Soul 創(chuàng)始人張璐看來,產(chǎn)品有一個文字對話的基礎(chǔ)得分,做得很好就可以得到六七十分。如果基礎(chǔ)得分不好,即使聲音做得再好,圖片理解方面再出色也不行。確定拿到基礎(chǔ)得分后,接下來就是不斷迭代,做好多模態(tài)爭取更好的表現(xiàn)。為此,夯實文字對話基礎(chǔ)是Soul虛擬人升級的第一步。
Soul的各類AI功能升級離不開自研大模型SoulX的助力。SoulX具備了prompt驅(qū)動、條件可控生成、上下文理解、多模態(tài)理解等能力。這一多模態(tài)能力不僅提升了虛擬人在帖子、圖片、音頻等多種形式創(chuàng)作上的能力,也還讓Soul的一眾社交場景產(chǎn)生了更多高質(zhì)量的內(nèi)容。
與此同時,在夯實文字對話能力后,Soul也在持續(xù)優(yōu)化語音系統(tǒng)。語音模態(tài)是Soul比較看重的一大功能。Soul創(chuàng)始人張璐表示:“語音是一個相對重要的點,可能會占30分。語音其實有很多人在做的,有非常多的解決方案,我們會聚焦在AI語音賦能‘溫度’和‘陪伴感’方向,因為社交互動本質(zhì)上是情感的流動”。這個多邊形戰(zhàn)士不僅需要具備多模態(tài)的能力,還需要情感化,而不只是提升效率的工具。虛擬人需要找到用戶的情緒價值點,同時具備個性化,展現(xiàn)出不同的性格特征;有時候應該順應用戶,有時候應該拒絕用戶。
目前,Soul表現(xiàn)較好的虛擬人有AI茍蛋。AI茍蛋是一個多模態(tài)的機器人,有非常明顯的擬人傾向。比如,用戶分享一個照片,它能夠根據(jù)對照片上的內(nèi)容和時間理解,判斷發(fā)生什么事情,然后進行主動地關(guān)懷和互動。還能基于和用戶的歷史聊天內(nèi)容,沉淀回憶、構(gòu)建個人專屬記憶的虛擬伙伴。從Soul公開的數(shù)據(jù)看,AI茍蛋的對話輪數(shù)比較高,用戶平均每天會給茍蛋發(fā)送超過70條消息,互動平均時長超過30分鐘。這其實已經(jīng)意味著,很多用戶把茍蛋當做了可以持續(xù)互動聊天的伙伴。
從大模型的發(fā)展趨勢看,多模態(tài)是發(fā)展的必經(jīng)之路,AIGC大模型從單模態(tài)向多模態(tài)發(fā)展已成為行業(yè)共識。Soul創(chuàng)始人張璐團隊不斷更新多模態(tài)社交應用、促進社交體驗好上加好,體現(xiàn)了Soul 追求卓越、臻于至善的發(fā)展態(tài)度,也體現(xiàn)了Soul對用戶體驗提升與對社交行業(yè)發(fā)展的創(chuàng)新能力。
投稿郵箱:chuanbeiol@163.com 詳情請訪問川北在線:http://m.fishbao.com.cn/