1 📝 深度技术 OpenAI 官方博客 2026-05-20 💬 Variational option discovery algorithms OpenAI最新研究:用变分法发现强化学习中的可重用选项,提升智能体学习效率。 强化学习 变分选项发现 智能体 算法