UQLM 是 CVS Health 开源的 Python 库,用 uncertainty quantification 检测 LLM hallucination。它提供 response-level confidence scores,覆盖 black-box consistency、多生成语义熵、white-box token probability、LLM-as-judge panel、ensemble 和 long-text scorers;BlackBoxUQ 可对同一 prompt 生成 5 个响应并计算 semantic_negentropy。项目兼容 LangChain Chat Models,适合把 hallucination risk 作为模型输出后的可量化信号。
–浏览
评论 · Comments