牛哥精选 · 本月

🤖 AI·大模型 36氪 2026-05-26

机器人启蒙，需要一所能“犯错”的幼儿园

机器人启蒙像孩子成长，一所能“犯错”的幼儿园让AI在真实经验中持续学习

2024年，强化学习奠基人理查德·萨顿与他的导师安德鲁·巴托共同获得了图灵奖。这个奖项来得不算早。过去三十年，萨顿的理论支撑了AlphaGo、ChatGPT等系统的进化，但他三十年前写下的理论，直到今天才被具身智能行业真正理解：智能体要从试错中学习，要从真实经验里进化。 2023年，萨顿参与创办…

机器人启蒙需要一所能犯错的幼儿园触觉传感器