【OCR能力不止于文字!IBM开源多模态文档处理模型Granite-Doc

科技有点神经 2025-09-29 12:31:00

【OCR 能力不止于文字!IBM 开源多模态文档处理模型 Granite-Docling-258M,实现公式/表格/图片等结构化文档理解】 近期,IBM 开源轻量级多模态文档处理模型 Granite-Docling-258M,不仅能提取文字,更能清晰理解出表格、公式、图文排版布局等深层结构信息,为高效文档转换设计。 Granite-Docling-258M 在保持轻量参数的同时拥有卓越性能,支持多语言(包括阿拉伯语、中文和日语)处理,使用 DocTags 格式精准描述文档结构,避免信息丢失。该模型能与 Docling 库无缝集成,提供强大的定制化和错误处理能力,适用企业级文档处理,是文档处理领域的强大工具。 目前,「Granite-docling-258M:轻量多模态文档处理模型」已上线至 HyperAI 官网的「教程」板块,一键克隆即可快速体验! 在线教程:

0 阅读:0
科技有点神经

科技有点神经

感谢大家的关注