o3视觉推理开源平替字节港大开源o3视觉平替OpenAIo3的多轮视觉推理，有

量子位看科技 2025-09-11 18:16:19

o3视觉推理开源平替字节港大开源o3视觉平替

OpenAI o3的多轮视觉推理，有开源平替版了。

并且，与先前局限于1-2轮对话的视觉语言模型（VLM）不同，它在训练限制轮数只有6轮的情况下，测试阶段能将思考轮数扩展到数十轮。

这个模型叫Mini-o3，它无需消耗大量训练周期资源，通过恰当的数据、初始化方法和强化学习微调，即可实现长周期视觉搜索能力。由字节、香港大学团队联合开发。

最近的多模态大模型虽然能通过”图像工具+强化学习”处理视觉问题，但现有开源方案存在很大的短板：

比如推理方式单调、交互轮次受限、遇到需要反复试错的复杂任务就束手无策。

而Mini-o3突破了上述局限——它能够进行长达数十个步骤的深度多轮推理，在高难度视觉搜索任务中达到了当前最佳水平。

0 阅读：3

量子位看科技

感谢大家的关注

作者最新文章

1

Meta超级智能实验室新论文陷争议Meta论文被指忽略大量前人研究Meta超级智

2

2025人工智能年度评选启动 3大维度5类奖项，正在寻找AI+时代领航者为了让更

3

Mac本地运行LLM教程小白也能在mac上玩大模型在Mac上跑大模型教程来了，有

4

支付宝推出国内首个AI付支付宝点咖啡全程不动手支付宝在外滩大会上发布了国内首个“

5

81岁甲骨文创始人冲上首富OpenAI3000亿合同推高甲骨文股价万万没想到，昨

6

Kimi放大招20秒更新万亿参数Kimi神器让模型权重实现秒更Kimi这次是真的

7

iOS26支持机型苹果发布会

8

iPhone17Pro手机壳苹果发布会 iPhone 17 Pro手机壳，此前大

9

iPhone17系列定价iPhone17系列定价揭晓iPhone 17起售价$7

10

iPhone17Pro配色

热门分类

科技TOP

1

10月份即将发布的新手机，看看有没有你喜欢的？

2

华为Mate70Pro在某多多上面百亿补贴的价格才四千多？敢不敢买？看上m

3

荣耀不讲武德[捂脸哭]荣耀500系列这是要卷死友商，不仅全系标配2亿大底主摄，电池

4

红米K90真长这样也挺好看的，或许这是前红米品牌总经理王腾的最后“遗作”瞄准高

5

我发誓，我的Mate60Pro还没捂热乎呢，Mate80的消息就直接要上王

6

有“高人”指点荣耀。荣耀推出“后悔宝”，让用户毋庸担心后悔购买搭载骁龙8ge

7

荣耀500系列曝光，全面对标苹果！荣耀500系列在工艺上完全对标苹果，中端机

8

前几天帮朋友挑1500内手机，线下导购推荐了荣耀GT，说性价比高、销量挺火。查了

9

荣耀Magic8标准版曝光，看着像是采用了4颗摄像头，然后是圆形的摄像头deco

10

旗舰都在用这些屏幕！认准他们准不差跟你们透个底！发现vivoX300系列屏幕

科技最新文章

1

欧盟好样的！之前要求手机充电口必须是统一C口。让iPhone妥协了。这次如果要

2

最近网上流传的疑似华为Mate80Pro真机图，这个造型可太好看了，四面窄边框

3

华为Mate80屏幕双层OLED，RGB色，值得期待华为Mate80屏幕方面

4

目前可以闭眼入的5款荣耀手机1、荣耀X70，8300mAh青海湖电池+十面抗

5

感觉荣耀Magic8Pro会彻底杀疯，直接掀了友商桌子，7100mAh电池+信

6

大疆预告降价已购买消费者退货维权刚买就降价，谁的钱是大风刮来的？早买早享受不该

7

我坚持：米17标准版，是17系列性价比最高、表现最水桶的一款。粮厂给了它三个优势

8

我发誓，我的Mate60Pro还没捂热乎呢，Mate80的消息就直接要上王

9

下半年大杯旗舰怎么选？这四款各有绝活！年底想换大杯旗舰看这四款就完事了！这四

10

在店里看见华为Mate80的宣传海报，标准版用的是普通铝合金，Pro版多了一道