今天(2月18日),AI大模型公司階躍星辰宣布與吉利汽車集團(tuán)聯(lián)合開(kāi)源了兩款階躍Step系列多模態(tài)大模型——Step-Video-T2V視頻生成模型和Step-Audio語(yǔ)音模型。
階躍星辰表示,在兩款大模型的研發(fā)過(guò)程中,雙方展開(kāi)了深度合作,在算力算法、場(chǎng)景訓(xùn)練等領(lǐng)域優(yōu)勢(shì)互補(bǔ),顯著增強(qiáng)了多模態(tài)大模型的性能表現(xiàn)。
根據(jù)技術(shù)報(bào)告中的評(píng)測(cè)結(jié)果,階躍Step-Video-T2V的參數(shù)量和模型性能目前在全球開(kāi)源視頻生成領(lǐng)域都處于領(lǐng)先水平,其參數(shù)量達(dá)到300億,可以直接生成204幀、540P分辨率的高質(zhì)量視頻,是當(dāng)前全球范圍內(nèi)參數(shù)量最大、性能最好的開(kāi)源視頻生成大模型。
階躍Step-Audio是行業(yè)內(nèi)首個(gè)產(chǎn)品級(jí)的開(kāi)源語(yǔ)音交互模型,能夠根據(jù)不同的場(chǎng)景需求生成情緒、方言、語(yǔ)種、歌聲和個(gè)性化風(fēng)格的表達(dá),能和用戶自然地高質(zhì)量對(duì)話,是行業(yè)內(nèi)首個(gè)產(chǎn)品級(jí)的開(kāi)源語(yǔ)音交互模型。
模型生成的語(yǔ)音具有自然流暢、高情商等特征,同時(shí)也能支持不同角色的音色克隆,可應(yīng)用于影視娛樂(lè)、社交、游戲等行業(yè)場(chǎng)景。
階躍星辰是吉利汽車集團(tuán)的科技生態(tài)戰(zhàn)略合作伙伴,擁有國(guó)際頂尖的算法團(tuán)隊(duì),由原微軟全球副總裁姜大昕創(chuàng)立于2023年4月,隨后即與吉利便在預(yù)訓(xùn)練大模型、垂直領(lǐng)域大模型、應(yīng)用場(chǎng)景設(shè)計(jì)、工程開(kāi)發(fā)等方面展開(kāi)了深度合作。
其中,吉利牽頭了場(chǎng)景設(shè)計(jì)、模型測(cè)評(píng)、工程開(kāi)發(fā)等業(yè)務(wù),階躍星辰主導(dǎo)了模型預(yù)訓(xùn)練等業(yè)務(wù),雙方優(yōu)勢(shì)互補(bǔ),顯著增強(qiáng)了兩款階躍Step系列多模態(tài)大模型的性能表現(xiàn)。
吉利汽車在2022年建成全球車企首個(gè) “云、數(shù)、智”一體化的星睿智算中心,在2023年發(fā)布了全球首個(gè)汽車行業(yè)全棧自研全場(chǎng)景AI大模型——星睿AI大模型,2025年,發(fā)布了行業(yè)首個(gè)“智能汽車全域AI”技術(shù)體系。
此次,吉利與階躍星辰聯(lián)合開(kāi)源的階躍Step系列多模態(tài)大模型,也將助力吉利的汽車產(chǎn)品在智駕和智艙兩個(gè)維度在行車安全、緊急避險(xiǎn)、智慧泊車等全場(chǎng)景為用戶帶來(lái)自動(dòng)駕駛程度更高、更安全的高階智駕體驗(yàn),同時(shí)打造更加智能的汽車情感座艙,重新定義人車交互體驗(yàn),推動(dòng)AI科技在智能汽車領(lǐng)域的普及應(yīng)用。
吉利星睿AI大模型中的AI Drive大模型,具備強(qiáng)大場(chǎng)景生成與規(guī)劃能力,能夠根據(jù)雨雪等不同天氣光照條件、道路結(jié)構(gòu)、擁堵路況、立體車庫(kù)和不常見(jiàn)的交通目標(biāo),構(gòu)建出真實(shí)駕駛中難得一遇的極端駕駛場(chǎng)景。
基于真實(shí)的駕駛視頻數(shù)據(jù)去優(yōu)化階躍Step-Video-T2V,可以將它變成一個(gè)自動(dòng)駕駛數(shù)據(jù)合成器。
星睿AI大模型正在探索將這些豐富的合成場(chǎng)景轉(zhuǎn)換成“以假亂真”的訓(xùn)練數(shù)據(jù),相當(dāng)于自動(dòng)駕駛系統(tǒng)打造了一個(gè)豐富的"虛擬駕考考場(chǎng)",從而顯著提升車輛在智駕行駛時(shí)面對(duì)各種路況的應(yīng)變能力,保障行車安全。
在階躍Step-Audio大模型超強(qiáng)交互功能賦能下,吉利星睿AI大模型可以大幅提升語(yǔ)音指令響應(yīng)速度,以及交互過(guò)程的情感理解與表達(dá)能力。
當(dāng)用戶說(shuō)“導(dǎo)航,快遲到了”的時(shí)候,系統(tǒng)不僅會(huì)自動(dòng)規(guī)劃更快路線,還會(huì)主動(dòng)詢問(wèn)是否需要播放輕音樂(lè)緩解情緒。同時(shí),系統(tǒng)不僅可識(shí)別粵語(yǔ)、四川話等豐富的方言,還支持個(gè)性化聲音定制,用戶既可以選擇系統(tǒng)提供的人聲音色,也能錄制孩子的笑聲制作專屬提示音,甚至讓車載AI模仿山澗流水聲營(yíng)造車內(nèi)冥想空間。
此外,吉利也與DeepSeek完成了深度融合,通過(guò)攜手DeepSeek-R1模型,吉利將對(duì)星睿車控FunctionCall大模型、汽車主動(dòng)交互端側(cè)大模型等進(jìn)行蒸餾訓(xùn)練。
屆時(shí),吉利智能汽車AI不僅能對(duì)用戶的模糊意圖實(shí)現(xiàn)精準(zhǔn)理解,進(jìn)而準(zhǔn)確調(diào)用約2000個(gè)車載接口,還能基于車內(nèi)外場(chǎng)景主動(dòng)分析用戶潛在需求,并為用戶主動(dòng)提供車輛控制、主動(dòng)對(duì)話、售后等服務(wù),智能交互體驗(yàn)將大幅提升,加速AI在智能汽車領(lǐng)域普及。
目前,基于“智能汽車全域AI”技術(shù)體系打造的AI銀河精靈、Flyme Auto 智能座艙、無(wú)界空間、AI云動(dòng)力、AI繪本、AI哨兵等一系列AI應(yīng)用,已在銀河E8、銀河E5、銀河星艦7EM-i等車型上搭載。
今年3月初,吉利還將對(duì)外發(fā)布重磅AI智能化戰(zhàn)略,加速推動(dòng)AI數(shù)字底盤(pán)、高階智能駕駛等最新AI技術(shù)的逐步上車,為用戶帶來(lái)顛覆性的智能化體驗(yàn)。
x
-
安慶衡:東風(fēng)、長(zhǎng)安兩大汽車央企重組合并基本屬實(shí),一汽是否加入看兩家合并效果 2025-02-13 23:51
-
長(zhǎng)安打響「全民智駕」第一槍 2025-02-11 13:34
-
CES 2025之中國(guó)汽車產(chǎn)業(yè)鏈的科技春晚 2025-01-10 11:38
-
13萬(wàn)元650km續(xù)航,埃安霸王龍智享版打破電動(dòng)SUV性價(jià)比開(kāi)花板 2025-02-17 12:40 -
嵐圖全品類車型將在年內(nèi)搭載華為乾崑智駕+鴻蒙座艙 2025-02-17 21:37 -
售價(jià)23.98萬(wàn)元起,一汽紅旗天工08華北區(qū)正式上市 2025-02-17 22:18


京公網(wǎng)安備 11010502038466號(hào)
關(guān)注官方微信