opendataloader-project/opendataloader-pdf
github.com原文 ↗
OpenDataLoader-PDF 面向 AI 数据抽取,把 PDF 转成 Markdown、带 bounding boxes 的 JSON 和 HTML。README 索引声称 benchmark overall 0.907;它的实用点在于保留布局与结构信息,减少 RAG 或信息抽取时“PDF 变纯文本”造成的证据错位。
–浏览
github.com原文 ↗
评论 · Comments