每日 Harness 开源 · Source
返回本期 · Back to 2026-05-31

GitHub 热门 · GitHub Trending2026-05-31 · Sunday, May 31, 2026

PaddlePaddle/PaddleOCR

github.com原文 ↗

PaddleOCR 是 OCR 与 Document AI 工具包,把 PDF 和图片转为 LLM-ready JSON/Markdown。README 称 PaddleOCR-VL-1.6 是 0.9B 文档 VLM,在 OmniDocBench v1.6 达 96.3% accuracy,并支持 text、formula、table、古籍、稀有字符、印章、图表等结构化输出;PP-OCRv5 支持 100+语言混排识别。值得看的是它覆盖从场景文字到复杂文档解析的完整链路。
浏览

评论 · Comments