1月20日,豆包實(shí)時語音大模型正式推出,并在豆包APP全量開放。1)該模型可理解輸入語言情緒、實(shí)時聯(lián)網(wǎng),在輸出時具備強(qiáng)大聲音控制能力,且高度近似人類、有超低延遲、可隨時打斷。2)豆包實(shí)時語音大模型的整體滿意度較GPT-4o有明顯優(yōu)勢,特別是在語音語氣自然度和情緒飽滿度方面遠(yuǎn)高于后者。3)增加了情感的語音交互將顯著有利于AI的軟硬件應(yīng)用,能夠降低使用門檻、改進(jìn)效率、提升體驗(yàn),包括如下應(yīng)用場景:1)情感陪伴與智慧教育應(yīng)用,關(guān)注盛天網(wǎng)絡(luò)、昆侖萬維等;2)AI陪伴硬件如AI玩具、AI寵物,可幫助硬件生產(chǎn)商與IP方擴(kuò)大需求,關(guān)注上海電影、湯姆貓等;3)AI眼鏡、AI耳機(jī)、AI音箱等生活效率產(chǎn)品將受益于交互方式的改進(jìn),關(guān)注小米集團(tuán)等。 |