OpenAI 开出最高 44.5 万美元年薪招聘研究员,要求有品位、有策略性
OpenAI 开出最高 44.5 万美元年薪,招募研究 AI 自我改进风险的安全研究员,要求有品位、有策略性。
IT之家 5 月 23 日消息,据《商业内幕》23 日(今天)下午报道,OpenAI 发布了安全研究员的招聘信息,研究当 AI 能够训练出自己的“更强版本”时可能出现的问题。 职位聚合网站显示,这则招聘信息面向 OpenAI Preparedness 安全团队,本月上线。该岗位年薪高达 29.5 万…
OpenAI 开出最高 44.5 万美元年薪,招募研究 AI 自我改进风险的安全研究员,要求有品位、有策略性。
IT之家 5 月 23 日消息,据《商业内幕》23 日(今天)下午报道,OpenAI 发布了安全研究员的招聘信息,研究当 AI 能够训练出自己的“更强版本”时可能出现的问题。 职位聚合网站显示,这则招聘信息面向 OpenAI Preparedness 安全团队,本月上线。该岗位年薪高达 29.5 万…
提出单向策略优化方法,让大模型在无外反馈下自我进化,提升推理与对齐能力。
arXiv:2605.22156v1 Announce Type: cross Abstract: Reinforcement Learning with Verifiable Rewards (RLVR) has become a promising paradigm for scaling re…
联邦学习下用合成表格数据自我优化大模型,Concordia框架有望提升隐私与效率。
arXiv:2605.09855v2 Announce Type: replace Abstract: Federated learning (FL) enables training large language models (LLMs) without sharing raw data, bu…
用迭代奖励引导后训练,让表格语言模型也能自我进化、持续提升性能。
arXiv:2604.18966v2 Announce Type: replace Abstract: Tabular language models can generate synthetic tables by modeling rows as token sequences, but the…
Schmidhuber新作:将“趣味性”形式化为未来压缩进步的归纳启发式,用Kolmogorov复杂度预判数据潜力,直指递归自我改进AI的核心瓶颈。
arXiv:2605.14831v1 Announce Type: new Abstract: One of the bottlenecks on the way towards recursively self-improving systems is the challenge of inter…