每日 Harness 开源 · Source
返回本期 · Back to 2026-06-02

开源 / 项目 · Projects2026-06-02 · Tuesday, June 2, 2026

UQLM

github.com原文 ↗

评测方法其他垂直
UQLM
UQLM 是 CVS Health 开源的 Python 库,用 uncertainty quantification 检测 LLM hallucination。它提供 response-level confidence scores,覆盖 black-box consistency、多生成语义熵、white-box token probability、LLM-as-judge panel、ensemble 和 long-text scorers;BlackBoxUQ 可对同一 prompt 生成 5 个响应并计算 semantic_negentropy。项目兼容 LangChain Chat Models,适合把 hallucination risk 作为模型输出后的可量化信号。
浏览

评论 · Comments