阿里通义发布端到端语音交互模型 Fun-Audio-Chat，能猜出你的心情

2025-12-23 发布浏览431次点赞0次收藏0次

感谢网友啊俊的线索投递！

12 月 23 日消息，阿里通义大模型今日发布了新一代端到端语音交互模型 Fun-Audio-Chat。

阿里通义本次开源了 Fun-Audio-Chat 8B，该模型在 OpenAudioBench、MMAU、Speech-ACEBench、VStyle 等多个榜单上“同尺寸模型排名第一”，综合性能超 GLM4-Voice、Kimi-Audio、Baichuan-Omni 等。

阿里通义发布端到端语音交互模型 Fun-Audio-Chat，能猜出你的心情

附 Fun-Audio-Chat 技术亮点如下：

阿里通义发布端到端语音交互模型 Fun-Audio-Chat，能猜出你的心情

阿里通义表示，Fun-Audio-Chat 可以提供“像朋友一样的对话体验”，感知用户的情绪，哪怕用户没直接说情绪，它也能从语气、语速、停顿里猜出心情，然后给出回应。

此外，Fun-Audio-Chat 可完成复杂任务，用户只需用自然语音下达指令，它就能自动调用函数。

附 Fun-Audio-Chat 8B 开源地址如下：

阿里通义语音交互模型大模型 mod 4 FunAudioChat 性能体验 models

声明：本文转载自IT 之家，转载目的在于传递更多信息，并不代表本社区赞同其观点和对其真实性负责，本文只提供参考并不构成任何建议，若有版权等问题，点击这里查看更多信息！