1
英伟达推出 AI 框架 Polar,让 Codex 跑分暴涨 594.74%
英伟达开源Polar框架,让Codex等智能体通过GRPO训练后性能暴涨594.74%,代码AI能力再上新台阶。
IT之家 5 月 28 日消息,英伟达研究团队本周发布开源框架 Polar,在不破坏原有工具调用、上下文组织和补丁提交方式的前提下,让 Codex、Claude Code、Qwen Code 等现有智能体框架接入 GRPO(广义相对策略优化)训练。 IT之家注:GRPO 是一种面向强化学习训练的优化…