蚂蚁集团开源发布全模态大模型 Ming-Flash-Omni 2.0

2026-02-14 02:43:48

蚂蚁集团开源发布全模态大模型 Ming-Flash-Omni 2.0，是业界首个全场景音频统一生成模型，可在同一条音轨中同时生成语音、环境音效与音乐。用户用自然语言下指令，可对音色、语速、语调、音量、情绪与方言等进行控制。模型在推理阶段实现了 3.1Hz 的极低推理帧率，实现了分钟级长音频的实时高保真生成。(科创板日报)

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

赞赏
点赞
评论
转发
分享

0/400

暂无评论

热门 Gate Fun
查看更多

1
Cznm
纯种牛马
市值:$2392.69持有人数:2
0.14%
2
SHEIKH
sheikh Whale
市值:$2375.86持有人数:1
0.00%
3
坚定HODL
坚定HODL
市值:$0.1持有人数:1
0.00%
4
Arab
Arabica
市值:$0.1持有人数:1
0.00%
5
HODL
坚定
市值:$0.1持有人数:1
0.00%

蚂蚁集团开源发布全模态大模型 Ming-Flash-Omni 2.0

热门话题

Gate广场发帖领五万美金红包

特朗普宣布新关税政策

何时是最佳入场时机

美国CLARITY法案推进

Gate春节赛马红包嘉年华

热门 Gate Fun

Cznm

纯种牛马

SHEIKH

sheikh Whale

坚定HODL

坚定HODL

Arab

Arabica

HODL

坚定

置顶