蚂蚁集團開源發布全模態大模型 Ming-Flash-Omni 2.0

2026-02-14 02:43:48

蚂蚁集团開源發布全模態大模型 Ming-Flash-Omni 2.0，是業界首個全場景音頻統一生成模型，可在同一條音軌中同時生成語音、環境音效與音樂。用戶用自然語言下指令，可對音色、語速、語調、音量、情緒與方言等進行控制。模型在推理階段實現了 3.1Hz 的極低推理幀率，實現了分鐘級長音頻的實時高保真生成。（科創板日報）

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

讚賞
按讚
留言
轉發
分享

留言

請輸入留言內容

暫無留言

熱門話題
查看更多
#
Gate廣場AI測評官
32.97萬熱度
#
加密市場上漲
53.33萬熱度
#
比特幣站上七萬美元
4982.51萬熱度
#
美政府計劃多國聯合護航霍爾木茲
17.58萬熱度
#
英偉達GTC2026大會召開
208.49萬熱度

熱門 Gate Fun
查看更多

1
PRC
PRCreator
市值:$2517.24持有人數:2
0.06%
2
AutoClaw
澳龙
市值:$2557.91持有人數:2
0.13%
3
QBANA
QuantumBanana
市值:$2527.58持有人數:1
0.00%
4
快手
快手极速版
市值:$2541.37持有人數:1
0.00%
5
🐼
熊猫币
市值:$2548.27持有人數:1
0.00%

蚂蚁集團開源發布全模態大模型 Ming-Flash-Omni 2.0

熱門話題

Gate廣場AI測評官

加密市場上漲

比特幣站上七萬美元

美政府計劃多國聯合護航霍爾木茲

英偉達GTC2026大會召開

熱門 Gate Fun

PRC

PRCreator

AutoClaw

澳龙

QBANA

QuantumBanana

快手

快手极速版

🐼

熊猫币

置頂