2025 年世界機器人大會于昨日正式落下帷幕。大會期間,50 家人形機器人整機企業(yè)同臺亮相,全方位展示人形機器人在工業(yè)制造、醫(yī)療護理、家庭服務等多元化場景下的創(chuàng)新應用成果。
2025世界機器人大會主論壇現(xiàn)場
不少國內(nèi)機器人公司都帶來了令人眼前一亮的“花活”,比如天工 2.0 機器人持續(xù)數(shù)小時的長跑直播、宇樹科技帶來的機器人格斗大賽等等,吸引了不少現(xiàn)場觀眾的目光。
但機器人大會上并不僅僅只有機器人的動態(tài)展示,不少大模型相關(guān)科技公司也涌入機器人大會。事實上,以機器人為代表的具身智能發(fā)展與 AI 大模型密不可分,它們就像是機器人的“大腦”,正是有了諸如大模型、多模態(tài)感知等技術(shù)的加入,機器人才真正具備人機互動的能力。
發(fā)布會現(xiàn)場,國內(nèi)老牌科技廠商科大訊飛就帶來一個機器人“大腦”,在展會上展示一款“智能語音背包”方案??拼笥嶏w機器人超腦平臺總經(jīng)理劉可介紹, “智能語音背包” 方案可在不改造機器人本體的情況下,通過 “即插即用” 賦予機器人語音交互能力。
據(jù)現(xiàn)場工作人員介紹,通過多模態(tài)降噪和識別,它不僅在展會嘈雜環(huán)境下聽得清,而且還能看得懂,更能帶有情緒地模擬人聲。“機器人已從遙控器、語音指令控制,邁向自主深度思考推理,不會被非預設的提問‘尬住’。”
“智能語音背包”方案的背后,正是星火大模型的支撐。和其他大模型廠商不同,科大訊飛除了在大模型領域?qū)崿F(xiàn)從芯片、算法到應用的全棧自主可控技術(shù)生態(tài)外,更是語音領域的絕對龍頭,在包括復雜語音合成、語音識別以及多語種翻譯等領域處于世界領先地位。
尤其在大模型時代,科大訊飛的語音優(yōu)勢進一步強化。星火語音大模型在 37 個主流語種語音識別上超越 OpenAI Whisper V3,支持 74 個語種方言免切換,破解強干擾場景識別難題;在語音合成方面,星火語音大模型的首批40個語種平均MOS分絕對提升0.25,擬人度超83%。
星火大模型同時也是最具國際化的大模型之一。7 月最新升級的星火 X1,目前已支持130+語種的交互問答、數(shù)學解題、文本生成、翻譯等任務,為全球用戶提供了真正意義上的“第二選擇”。
多語言能力對于力圖出海的中國汽車產(chǎn)業(yè)更顯重要。目前,中國汽車出海前 10 強企業(yè)中有 8 家都與科大訊飛進行深度合作,訊飛座艙智能語音解決方案已幫助上百種車型出海60余個國家和地區(qū),覆蓋全球23種外語。
上個月剛剛結(jié)束的世界人工智能大會上,科大訊飛是大會唯一“翻譯合作伙伴”,為參會嘉賓、行業(yè)專家提供無障礙的專業(yè)同傳服務。世界人工智能大會是目前全球最重要的人工智能盛會之一,今年有來自30余個國家及地區(qū)的1200多名嘉賓參會,流暢的翻譯和同傳服務更是保障參會嘉賓無障礙交流的關(guān)鍵。
搭載星火語音同傳大模型的訊飛同傳圓滿地完成了大會翻譯的重任,首次訪華的“深度學習之父”杰弗里?辛頓在世界人工智能大會開幕式上的演講,就是通過星火語音同傳大模型的專業(yè)同傳翻譯傳達給國內(nèi)用戶。
在 WAIC 期間,星火大模型強大的多語言能力同樣吸引了眾多海外 AI 行業(yè)專家的目光。比如泰國人工智能公司Omniscien首席技術(shù)官Dion Wiggins,他專程來到訊飛展臺參觀,對多語種 AI 透明屏贊不絕口。
WAIC期間,科大訊飛舉辦了“科大訊飛高級別高水平多語言基座大模型國際學術(shù)研討會”,吸引來自國內(nèi)高校院所、海外學府以及眾多AI產(chǎn)業(yè)人士參與。據(jù)介紹,會議匯聚專家涵蓋匈牙利語、希伯來語、阿拉伯語、馬來語、泰語、柬語、越南語等多種本土語言的大模型技術(shù)開發(fā)研究。
在當前世界人工智能發(fā)展日益加快的當下,這樣的跨國界、跨語言的交流互通更顯可貴。美國特朗普上臺之后,不斷加強對華科技禁令,割裂全球AI生態(tài)。
在這樣的情況下,中國科技企業(yè)更應當勇敢地走出國門,敞開懷抱與世界交流互通,表達中國科技企業(yè)在全球AI治理方面的包容態(tài)度。
杰弗里·辛頓在WAIC開幕式演講中同樣強調(diào),國際社會應當聯(lián)合起來一起在AI方面加強合作,訓練AI向善,“所有國家都可以一起合作。”
科大訊飛一直秉承著讓中國 AI 走向世界的初心。自2018年確立國家化戰(zhàn)略以來,科大訊飛在中東歐、西歐、澳新、東南亞、日韓、泛俄、中東等區(qū)域廣泛開展業(yè)務,推動中國AI技術(shù)向全球落地。
訊飛開放平臺國際站在 2020 年正式上線,為全球開發(fā)者提供語音識別、語音合成、機器翻譯、圖文識別等人工智能服務,打造全球人工智能產(chǎn)業(yè)生態(tài)。目前,訊飛開放平臺的海外開發(fā)者總數(shù)已達52.4萬,形成了強大的全球開發(fā)者社區(qū)。
在當今世界,中國AI已經(jīng)成為全球不可忽視的一股重要力量,中國科技創(chuàng)新不會因某些勢力的阻撓而停滯,中國AI走向世界的步伐也不會停止。科技向善,為世界提供第二種選擇。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!