图像转Markdown工具开源模型将PDF和图像转为Markdown想把PDF或

量子位看科技 2025-06-17 18:27:27

图像转Markdown工具开源模型将PDF和图像转为Markdown

想把PDF或图像转为Markdown文件？或许可以试试这个！

Nanonets-OCR-s是一款轻量的VLM模型，能够将PDF和图像转换为干净、结构化的Markdown，并且还是中文友好！

模型经过专门训练，能够准确理解文档结构和内容上下文，包括表格、公式、图像、图表、水印、复选框等元素。

具体来说，它能够实现以下功能：

- LaTeX公式识别：自动将数学方程和公式转换为正确格式的LaTeX语法。能够区分行内公式（ $...$ ）和显示公式（ $$...$$）。

- 智能图像描述：使用结构化标签描述文档中的图像，使其适合LLM处理。可以描述各种图像类型，包括徽标、图表、图形等，详细说明其内容、样式和上下文。

- 签名检测与隔离：识别并将签名与其他文本隔离，输出在标签内。

- 水印提取：检测并提取文档中的水印文本，将其放置在标签内。

- 智能复选框处理：将表单复选框和单选按钮转换为标准化的Unicode符号（☐、☑、☒），以实现一致可靠的处理。

- 复杂表格提取：准确从文档中提取复杂表格，并将其转换为markdown和HTML表格格式。

需要注意的是，目前这个模型还尚未针对手写文本进行训练，对手写文本的识别可能不到位，除此之外，模型可能会出现幻觉。

感兴趣的朋友，可以点击下方的链接进行尝试⬇️

代码仓库：

Huggingface地址：

0 阅读：0

量子位看科技

感谢大家的关注

作者最新文章

1

基因改造孢子靠性传播灭蚊科学家改造真菌基因用来灭蚊这种基因改造后的真菌，能悄无声

2

xAI一月烧掉10亿美元xAI寻求43亿股权融资xAI一个月就要烧掉10亿美元？

3

百轮优化过的Cursor提示词高效写代码提示词这套Cursor规则经过100多轮

4

AI编程我信不过AI写代码我可不敢上线AI编程工具虽快，但其实没什么用？开发者给

5

大模型学数学不再死记硬背AI拼好题只用45K数据提效18%学生只会背题，却忽略了

6

阿里新方法提醒大模型别点错AI操作有了紧急刹车大模型操控界面，常常出错。哪怕是G

7

她曾两次错过诺奖【东方居里夫人】她两次站在诺奖门口，却无缘登台。奥本海默也曾公开

8

图像转Markdown工具开源模型将PDF和图像转为Markdown想把PDF或

9

无需千亿参数合成高质量数据新开源框架让小模型组团提升无需蒸馏任何大规模语言模型，

10

GitHubCEO谈AI编程AI写代码快但人类要会改有AI编程工具加持，现在写起

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

这是iPhone17只看正面时你立马能区分升级的地方：灵动岛变小了

2

华为又放大招啦！8月15号，华为Pura80手机处理器，kirin9020惊艳

3

美团退款看了一下最近两笔账单，都退回来了，这种退款还是要确认一遍，有时候还真会忘

4

台积电创始人张忠谋在接受纽约时报专访时说：美国、荷兰、日本、韩国与台湾牢牢控制着

5

2025年，中国大陆制造的成熟芯片，占比全球产量28%，预计到2027年，占比将

6

国产7nm终于可以公开了！近日，华为Pura80系列通过HarmonyOS

7

手机圈来袭！9-10月新机扎堆亮相荣耀Magic8Pro主打超强AI，

8

李想谈供应商黑幕在《罗永浩的十字路口》节目中，提到有的供应商欺负他们，明明给理

9

华为用高通芯片，我不奇怪。手机参数页隐去处理器型号，我也不惊讶。实在没想

10

美团退款好像最近两年没有出现过退款异常的，主要还是2014-2018年囤积的未使

科技最新文章

1

据说今年的华为Mate80系列参数很猛，可以等一等已经看到有博主开始爆料华为

2

荣耀目前最火爆的三款新手表，怎么选择合适？荣耀Fit，荣耀手表5，荣耀手表5U

3

首款曲面iPhone如果是真的，我想看看以前那些喷曲面屏的人是怎么吹曲面有多好的

4

美团退款看了一下最近两笔账单，都退回来了，这种退款还是要确认一遍，有时候还真会忘

5

美团退款好像最近两年没有出现过退款异常的，主要还是2014-2018年囤积的未使

6

“中美差距究竟有多大？”DeepSeek创始人梁文锋再次语出惊人！他说：“我们经

7

这是iPhone17只看正面时你立马能区分升级的地方：灵动岛变小了

8

vivo进场啦！vivo开大了！果不其然，今年各大厂商都开始出小屏旗舰了，从

9

iPhone17ProMax和前代对比，有了显著的升级，不能再说挤牙膏了1

10

英伟达，承认了！据路透社消息，英伟达高层内部已经确定将为中国重新定制AI芯片