GLM 刚发了 Glyph 技术,和 DeepSeek-OCR 有点像啊。
都是将文本信息视觉化,将一维的文本序列转换为二维的图像,然后利用视觉语言模型进行处理,以实现对原始文本信息的压缩和高效处理。两者都认为用视觉Token来表示文本可以大幅降低处理长序列文本时带来的计算和内存成本。
可惜比deepseek发晚了一天[doge]
GLM 刚发了 Glyph 技术,和 DeepSeek-OCR 有点像啊。
都是将文本信息视觉化,将一维的文本序列转换为二维的图像,然后利用视觉语言模型进行处理,以实现对原始文本信息的压缩和高效处理。两者都认为用视觉Token来表示文本可以大幅降低处理长序列文本时带来的计算和内存成本。
可惜比deepseek发晚了一天[doge]
评论列表
猜你喜欢
【1评论】【5点赞】
【131评论】【275点赞】
【67评论】【118点赞】
作者最新文章
热门分类
科技TOP
科技最新文章
舒逸飞
有差距……