- 地区
- 海外
- 定价
- 免费
- 是否开源
- 是
- GitHub Stars
- ★ 5.6k
- 收录来源
- GitHub
- 收录于
- 2026-06-06
- 最近确认可用
- 2026-06-06
- GitHub
- github.com/rllm-org/rllm

详细介绍
rLLM 是一个开源框架,用于训练强化学习 AI 智能体。它解决了在不同框架下训练智能体时需要大量代码改动的问题,支持多种现有的代理框架,并且只需少量的代码更改即可实现自动追踪和奖励函数定义。用户可以通过命令行或 Python API 快速开始使用 rLLM 来评估和训练模型。适合于希望简化强化学习过程的研究人员和开发者。
核心功能
- ▪兼容任何代理框架
- ▪几乎无需修改现有代码
- ▪提供50+内置基准测试
- ▪支持多种RL算法
- ▪两种训练后端可选
适用场景
快速原型开发大规模分布式训练性能优化实验
优点
- +易于集成现有项目
- +强大的社区支持
- +显著提高小模型性能
局限 / 注意
- -需要Python 3.11及以上版本
- -某些功能可能依赖特定硬件
适合谁
AI研究人员软件开发者数据科学家
以上介绍由 AI 基于公开资料整理,可能存在偏差,以官网为准。
常见问题
如何安装rLLM?
通过pip安装:uv pip install 'rllm @ git+https://github.com/rllm-org/rllm.git'
rLLM支持哪些RL算法?
包括GRPO, REINFORCE, RLOO等
相似智能体
信息有误?欢迎在 关于页 联系我们更正。