1
机器人启蒙,需要一所能“犯错”的幼儿园
机器人启蒙像孩子成长,一所能“犯错”的幼儿园让AI在真实经验中持续学习
2024年,强化学习奠基人理查德·萨顿与他的导师安德鲁·巴托共同获得了图灵奖。 这个奖项来得不算早。过去三十年,萨顿的理论支撑了AlphaGo、ChatGPT等系统的进化,但他三十年前写下的理论,直到今天才被具身智能行业真正理解: 智能体要从试错中学习,要从真实经验里进化。 2023年,萨顿参与创办…
机器人启蒙像孩子成长,一所能“犯错”的幼儿园让AI在真实经验中持续学习
2024年,强化学习奠基人理查德·萨顿与他的导师安德鲁·巴托共同获得了图灵奖。 这个奖项来得不算早。过去三十年,萨顿的理论支撑了AlphaGo、ChatGPT等系统的进化,但他三十年前写下的理论,直到今天才被具身智能行业真正理解: 智能体要从试错中学习,要从真实经验里进化。 2023年,萨顿参与创办…