【全模态能力新突破!通义千问Qwen3-Omni模型多版本齐开源,原生融合文

科技有点神经 2025-09-26 17:30:33

【全模态能力新突破!通义千问 Qwen3-Omni 模型多版本齐开源,原生融合文本、图像、音频与视频理解等能力】 近期,阿里通义千问团队开源全模态模型 Qwen3-Omni,包含 Qwen3-Omni-30B-A3B-Instruct(指令跟随)、Qwen3-Omni-30B-A3B-Thinking(推理)和通用音频字幕器 Qwen3-Omni-30B-A3B-Captioner。 Qwen3-Omni 是原生端到端的跨语言多模态基础模型。它处理文本、图像、音频和视频,并以文本和自然语音两种形式提供实时流式响应,在取得强大的音频和音视频结果的同时,单模态文本和图像性能不会下降,解决了长期以来多模态模型需要在不同能力之间进行权衡取舍的难题。 目前,「Qwen3-Omni:突破模态边界的全能选手」已上线至 HyperAI 官网的「教程」板块,一键克隆即可快速体验! 在线教程:

0 阅读:0
科技有点神经

科技有点神经

感谢大家的关注