run-llama/liteparse
github.com原文 ↗
LiteParse 是 LlamaIndex 团队的本地 OSS PDF/document parser,专注 fast、light spatial text parsing。它基于 Rust core、PDFium、可选 Tesseract/HTTP OCR,输出 JSON/text、bounding boxes 和页面 screenshots,并支持 Rust、Node/TypeScript、Python、WASM。README 明确复杂表格、多栏、图表、手写或扫描 PDF 仍建议用云端 LlamaParse。
–浏览
评论 · Comments