全开源端到端共情语言大模型低成本构建共情语音系统GPT-4o、Gemini这些顶

量子位看科技 2025-07-16 12:40:24

全开源端到端共情语言大模型低成本构建共情语音系统

GPT-4o、Gemini这些顶级语音模型虽然展现了惊人的共情对话能力，但它们的技术体系完全闭源。

现在，紫东太初团队联合长城汽车AI Lab直接把整个技术栈都开源了，推出完全透明开源的端到端共情语音语言大模型OpenS2S。

OpenS2S的核心在于提供一个高效、低成本构建共情语音系统的新范式。

它不仅继承了团队在语音到文本共情模型BLSP-Emo上的技术积累，更引入了流式交错解码架构，实现了低延迟的实时语音生成。OpenS2S提出自动化数据生成方法，结合大语言模型与可控文本到语音生成技术，构建多说话者、多情感的高质量共情语音训练语料。

最为重要的是，团队开源了构建OpenS2S所需的所有资源，包括：训练与微调数据集、数据构建代码、模型权重以及预训练和微调代码，致力于赋能更广泛的研究社区，推动共情语音系统领域的创新与发展。

详情请查看文章👇

0 阅读：0

量子位看科技

感谢大家的关注

作者最新文章

1

AI也有味觉了用石墨烯舌头分辨咖啡可乐AI现在有味觉了！近日，科学家研发出一种人

2

智源发力具身智能领域从单机智能迈向群体智能具身智能大脑+全球首个具身智能SaaS

3

AI设计蛋白质饿死细菌新型蛋白质给细菌断粮抗生素日益泛滥的今天，AI正在给出一个

4

肥胖竟与周边餐厅有关肥胖竟受周边餐厅影响研究表明，肥胖与周边餐厅能吃到啥有关。麻

5

OpenAI首个开源模型再延期OpenAI开源模型因安全测试延期OpenAI的首

6

小扎挖人收购两不误Meta收购语音初创公司PlayAIMeta继续“买买买”！超

7

麦当劳泄露六千万人简历麦当劳密码竟是123456一串“123456”的密码，让麦

8

【马斯克公司组团升级】SpaceX向xAI输血20亿美元马斯克公司上演“组团升级

9

GPT5基准测试分数泄露GPT5要来了吗GPT-5基准测试分数泄露，整体表现超前

10

让AI又懂医疗又懂编程医疗代码生成大模型训练平台医疗AI场景复杂，需要“又懂医疗

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

小米YU7价格25.35万，27.99万，32.99万三个版本，最推荐入门版本，

2

2025下半年新机打架谁是你的菜？

3

一万买的华为pura80pro+还没捂热夫妻吵架给砸了一个老主顾半夜联系我

4

朝鲜的Mate50[doge][doge][doge]

5

左边是我花了5499国补价买到的iPhone16Pro，右边是苹果直营店里

6

荣耀线下店基本全面铺货，趁着周末去摸了摸荣耀X70，跟我想的有点不一样上手真

7

有部分汽车博主在本周末被集体禁言，就有车圈司马南之称的那位经期博主在弹冠相庆。话

8

二季度小米手机全球市场份额第三小米第三就算了，第一的竟然不是苹果，而是三星，这

9

提前给大家看下荣耀MagicV5的真机~和iPhone对比，也只是稍微厚一点点

10

目前来看，iPhone17系列只要你不选标准版，大概率是怎么选都不会后悔，当然

科技最新文章

1

朋友最后还是没忍住，入手了最新的荣耀MagicV5大折叠，截图给我看了眼订单，

2

Ai伴侣来了。马斯克旗下的xAI最新推出的Grok智能伴侣Ani，在好感度达到3

3

二季度小米手机全球市场份额第三小米第三就算了，第一的竟然不是苹果，而是三星，这

4

中美芯片大战，日本人突然发现了一个重大的秘密！美国靠着尖端芯片死磕中国，而中国呢

5

晚了！美国批准英伟达H20芯片出口！根据媒体7月15号报道，黄仁勋在接受采访时高

6

荣耀再一次掀桌子，大家都别玩了荣耀X70只要1399顶配版是12G+512G

7

9月份集体硬刚iPhone？你更期待哪款？9月份就是新一轮旗舰机，集体硬刚i

8

分享三个同事的手机锁屏～找了隔壁同事的手机看锁屏分别是OPPOfi

9

比亚迪APP征集全新名称了，目前看了一下，提到比较多的就是“迪家”，确实简单好记

10

美国对H20芯片松口，黄仁勋年内第三次抵华，稳住中国市场是关键7月15日，美