GitHub 热门 · GitHub Trending2026-06-05 · Friday, June 5, 2026

NVIDIA-NeMo/Gym

NeMo Gym 用“environment”统一评估和训练 agent：一个环境包含 dataset、agent harness、verifier 和 per-task state。README 强调可扩展到数千并发环境，并能在评估、agent optimization 和训练之间切换；它对应的是 agent benchmark 从静态问答向可执行环境迁移。

–浏览

NVIDIA-NeMo/Gym

评论 · Comments