腾讯发布了Hunyuan-TurboS，比较有意思的是这是个混合Trans

蚁工厂 2025-03-11 13:25:50

腾讯发布了 Hunyuan-TurboS ，比较有意思的是这是个混合 Transformer 和 Mamba 的 MoE模型。

“传统的纯 Transformer 模型在处理长文本训练和推理时，会面临 O(N²) 复杂度和 KV-Cache 问题。Hunyuan-TurboS 结合了：

✅ Mamba 的高效长序列处理能力

✅ Transformer 强大的上下文理解能力

🔥 成果：

1.在数学、推理和对齐方面，性能超越 GPT-4o-0806、DeepSeek-V3 以及其他开源模型。

2.在知识方面（包括 MMLU-Pro）具有竞争力。

3.推理成本比我们之前的 Turbo 模型降低 1/7。”

但目前还没有公布更多的资料，再等等看。

AI生活指南 AI创造营

0 阅读：2

感谢大家的关注

作者最新文章

1

从零开始构建一个最小化的Transformerwww.k-a.in/llm3.h

2

MIT的深度学习导论公开课2025年版还有一天就要开课啦。introtodeep

3

电子书机器学习的笔算练习《Pen and paper exercises i

4

一个算法教程adeveloperdiary.com/algorithm/“在各种

5

从零开始的自然语言处理🔗：nlpfromscratch.com/“从零开始的自

6

用x86-64汇编语言来写GUI应用的两篇教程1. hello worldgau

7

推友xorswap在深入研究deepseek的开源文件系统3FS后做的解读：De

8

QwQ-Max-Preview 下周开源

9

电子书《Sketching Algorithms》草图算法www.sketchi

10

转发抽奖[超话] 转发抽三本的《走进具身智能》。 3月9日从转发里抽3人各得一

热门分类

科技TOP

1

【华为MateXTs非凡大师及全场景新品发布会官宣9月4日举办，将

2

四选一怎么选？旗舰新机一款比一款炸裂打算今年换机的朋友爽了，看了下今年的旗舰是

3

史上最薄iPhoneiPhoneAir现场真机实拍这外观给几分？

4

重磅！华为公布多颗新昇腾芯片9月18日，在华为全连接大会2025上，华为轮值

5

追觅汽车首款车型官图发布这次会是PPT造车吗？此前追觅就官宣要造车，并且工厂

6

买手机不要着急，买新不买旧。9月10月份将有大量新机发布，配置提升，续航也提升

7

小米澎湃OS3官宣8月28日发布了，而且值得一提的是这次是OS3单开一场，可

8

荣耀不讲武德[捂脸哭]荣耀500系列这是要卷死友商，不仅全系标配2亿大底主摄，电池

9

感受一下1999的真我15Pro，这确实太薄了，7.79mm，187g，

10

还没下单iphone17Pro的劝你先等等~因为iPhone18Pro已完

科技最新文章

1

据说这就是荣耀500系列的配置，也是一款重量级的产品了。电池还是一如既往的大，主

2

500万到手！就是有头铁的网友，发布会还没开，Magic8真机已经开箱了！保密协

3

“芯片不如美国，机床不如日本，汽车不如德国，电视不如韩国，飞机不如法国，奢侈品不

4

荣耀Magic8系列真机这就曝光了？有人居然提前曝光了荣耀Magic8pr

5

今年的雷军年度演讲注定不平凡。汽车与芯片，这两大公认的“硬骨头”，小米不仅同时啃

6

荣耀不讲武德[捂脸哭]荣耀500系列这是要卷死友商，不仅全系标配2亿大底主摄，电池

7

好家伙，大早上的突然宣布了！2025雷军年度演讲定在9月25日晚7点，所以小

8

雷军年度演讲这一次，雷总的主题是《改变》。玄戒O1+小米汽车，5年的时间犹如白驹

9

一加15真机曝光，外观延续一加13T的风格，后置三摄，deco有点大。骁龙8

10

鸿蒙NEXTMate80最强配置，据博主爆料，十大黑科技，每一项都是吊炸天，