📝 全部文章
小红书搞了个"万物皆可OCR":3B小模型干翻一众大模型
小红书hi lab联合华中科大白翔团队提出 MOCR,仅3B参数,统一图文解析为SVG,olmOCR-Bench SOTA 83.9分。
OCR已死?别急着下结论——深度解读+批判性分析
多模态大模型直接看图做文档信息抽取,能打平传统 OCR+LLM pipeline?结论很大胆,但事情没那么简单。
21款PDF表格解析器大比拼:LLM当裁判,谁才是真正的王者?
从 PyMuPDF 到 GPT-4o,21个解析器横评,LLM打分。最贵的不一定最好,开源方案也有惊喜。