昨天,DeepSeek 发布了一个新模型 DeepSeek-OCR。 这是一个专门为 OCR(文字识别)微调的 6.6GB 模型,主要贡献在于首次量化 “视觉 - 文本 token 压缩比”,验证 10× 近无损压缩、20× 仍保有 60% 精度的可行性;提出 DeepEncoder,解决现有编码器 “高分辨率 - 低内存 - 少 ...
10 月海外 AI 圈热闹非凡,Google 在 AI Studio 推出了 AI Coding 构建 App 的功能,Claude Code 推出了 Web 版,Claude 推出了 桌面版,Gemini ...
近日,全球知名科技媒体marktechpost报道了一则重要消息,英伟达正式开源了其Open Code Reasoning(OCR)模型套装。该套装包含了三种不同规模的模型,分别是32B、14B和7B,均基于Apache 2.0许可证进行发布。用户现在可以在Hugging Face平台上轻松下载这些模型的权重和配置。
在长上下文大模型的演进路径中,OCR技术正从“识别工具”跃升为“语义压缩引擎”。DeepSeek-OCR提出的上下文光学压缩范式,不仅提升了文档解析效率,更为LLM的输入优化提供了新思路。本文将系统拆解该范式的技术逻辑、应用场景与未来潜力,探讨OCR如何成为 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果