每日 Harness 开源 · Source
返回本期 · Back to 2026-06-05

GitHub 热门 · GitHub Trending2026-06-05 · Friday, June 5, 2026

opendataloader-project/opendataloader-pdf

github.com原文 ↗

OpenDataLoader-PDF 面向 AI 数据抽取,把 PDF 转成 Markdown、带 bounding boxes 的 JSON 和 HTML。README 索引声称 benchmark overall 0.907;它的实用点在于保留布局与结构信息,减少 RAG 或信息抽取时“PDF 变纯文本”造成的证据错位。
浏览

评论 · Comments