每日 Harness 开源 · Source
返回本期 · Back to 2026-06-02

GitHub 热门 · GitHub Trending2026-06-02 · Tuesday, June 2, 2026

run-llama/liteparse

github.com原文 ↗

LiteParse 是 LlamaIndex 团队的本地 OSS PDF/document parser,专注 fast、light spatial text parsing。它基于 Rust core、PDFium、可选 Tesseract/HTTP OCR,输出 JSON/text、bounding boxes 和页面 screenshots,并支持 Rust、Node/TypeScript、Python、WASM。README 明确复杂表格、多栏、图表、手写或扫描 PDF 仍建议用云端 LlamaParse。
浏览

评论 · Comments