突破新领域,深度求索发布文字识别模型DeepSeek-OCR

新浪财经 2025-10-20 20:58:10

新京报贝壳财经讯(记者罗亦丹)北京时间10月20日,DeepSeek(深度求索)在开源社区HuggingFace上发布了新模型DeepSeek-OCR。据了解,OCR(OpticalCharacterRecognition,文字识别)模型是一种用来从图像中提取文本的技术。

DeepSeek还上传了与该模型相关的论文,在论文中,DeepSeek-OCR被描述为是“一项关于通过光学二维映射来压缩长上下文可行性的初步研究。”实验表明,当文本标记数量在视觉标记数量的10倍以内时(即压缩比

0 阅读:256