中國消費者報報道(記者武曉莉)10月24日,第七屆世界聲博會暨2024科大訊飛全球1024開發(fā)者節(jié)在安徽合肥開幕?;顒蝇F(xiàn)場,科大訊飛首發(fā)10項基于訊飛星火底座能力的硬核產(chǎn)品與創(chuàng)新應用,通過這些產(chǎn)品和應用,用戶可以和“自己”打視頻電話、可以和外國人自由聊天、可以“聽懂”200多種方言……國內大模型應用已走入深水區(qū)。
此次科大訊飛首發(fā)的語音視覺虛擬人交互“三合一”超擬人數(shù)字人令人驚艷。此前的多模態(tài)的交互的創(chuàng)新,用戶可以通過撥打“語音電話”的形式和大模型問話對答。這次,訊飛星火大模型4.0 Turbo從超擬人語音升級為超擬人數(shù)字人,用戶可以通過撥打“視頻電話”的形式和大模型問話對答。
“我們實現(xiàn)了語音、視頻、圖文的全部聯(lián)動的多模態(tài)交互。”科大訊飛研究院院長劉聰現(xiàn)場和超擬人數(shù)字人玩起了“角色扮演”游戲,無論是扮演孫悟空還是小豬佩奇,超擬人數(shù)字人的反應都惟妙惟肖。
劉聰還演示了更實用的旅游購物場景,當攝像頭轉向印有外文的化妝品及酒類產(chǎn)品時,超擬人數(shù)字人能對畫面中產(chǎn)品的品牌、功能等信息進行秒回,成為“跨語言”購物的好幫手。
202種方言實現(xiàn)免切換自由說
在語音識別領域,科大訊飛的遠場高噪場景語音識別領先優(yōu)勢進一步擴大。此次發(fā)布的星火多語言大模型,首次實現(xiàn)全國地級市方言全覆蓋,含全國288個地市、202種方言。據(jù)介紹,訊飛輸入法14.0即將支持202種方言免切換自由說。
在多語種能力上,除中英文外,可支持俄、日、阿、法等8個語種。根據(jù)實用任務場景構建測試集MMT-Eval-1.0,訊飛星火在汽車、家電、辦公、翻譯等行業(yè)的任務場景應用效果超過了GPT-4o。
多模態(tài)多語言能力升級,將全面賦能汽車產(chǎn)業(yè)??拼笥嶏w還首發(fā)了汽車端側星火大模型,據(jù)悉,今年第四季度起,奇瑞、廣汽、長城等多款搭載端側大模型的車型將上市開售。
大模型賦能民生多領域AI助手
用人工智能技術解決社會剛需,是大模型應用的價值所在。此次1024科大訊飛全球開發(fā)者節(jié)上,科大訊飛面向教育、醫(yī)療、司法、政務服務、企業(yè)辦公等多個行業(yè)場景發(fā)布了最新的產(chǎn)品應用。
在教育行業(yè),首次發(fā)布基于“問題鏈”的高中數(shù)學智能教師系統(tǒng)。結合眾多高中數(shù)學學科優(yōu)秀教師集體智慧和AI大模型的機器智能,實現(xiàn)智能生成教學問題鏈。搭載了高中數(shù)學智能教師系統(tǒng)的星火智慧黑板2.0也于10月25日在第84屆教育裝備展上發(fā)布。
在醫(yī)療行業(yè),發(fā)布訊飛星火醫(yī)療大模型2.0,以及基于訊飛星火醫(yī)學影像大模型打造的智能醫(yī)學影像助手。
在政務服務場景,政務大模型持續(xù)迭代,全面覆蓋4500多種標準化事項和60多種材料,用戶和政務大模型“聊天”就能實現(xiàn)邊聊邊確認辦事意圖,審核時間縮短80%,登記效率提升5倍。