牛哥精选 · 本月

📋 全部 🤖 AI·大模型 ⚡ 效率工具 📝 深度技术 🚀 产品观察 💰 商业科技 🔓 开源项目 🎨 设计创意 📖 阅读推荐 🏷 资源合集 🌱 成长效率

🤖 AI·大模型 IT 之家 2026-05-24

OpenAI 开出最高 44.5 万美元年薪招聘研究员，要求有品位、有策略性

OpenAI 开出最高 44.5 万美元年薪，招募研究 AI 自我改进风险的安全研究员，要求有品位、有策略性。

IT之家 5 月 23 日消息，据《商业内幕》23 日（今天）下午报道，OpenAI 发布了安全研究员的招聘信息，研究当 AI 能够训练出自己的“更强版本”时可能出现的问题。职位聚合网站显示，这则招聘信息面向 OpenAI Preparedness 安全团队，本月上线。该岗位年薪高达 29.5 万…

开出最高万美元年薪招聘研究员要求有品位有策略性

🤖 AI·大模型 arXiv AI 2026-05-23

One-Way Policy Optimization for Self-Evolving LLMs

提出单向策略优化方法，让大模型在无外反馈下自我进化，提升推理与对齐能力。

arXiv:2605.22156v1 Announce Type: cross Abstract: Reinforcement Learning with Verifiable Rewards (RLVR) has become a promising paradigm for scaling re…

llm 策略优化自我进化强化学习大语言模型

📝 深度技术 arXiv 机器学习 2026-05-20

Concordia: Self-Improving Synthetic Tables for Federated LLMs

联邦学习下用合成表格数据自我优化大模型，Concordia框架有望提升隐私与效率。

arXiv:2605.09855v2 Announce Type: replace Abstract: Federated learning (FL) enables training large language models (LLMs) without sharing raw data, bu…

concordia 联邦学习合成数据大语言模型自我改进

📝 深度技术 arXiv 机器学习 2026-05-20

Self-Improving Tabular Language Models via Iterative Reward-Guided Post-Training

用迭代奖励引导后训练，让表格语言模型也能自我进化、持续提升性能。

arXiv:2604.18966v2 Announce Type: replace Abstract: Tabular language models can generate synthetic tables by modeling rows as token sequences, but the…

表格语言模型自我改进奖励引导后训练迭代优化

📝 深度技术 arXiv AI 2026-05-20

Interestingness as an Inductive Heuristic for Future Compression Progress

Schmidhuber新作：将“趣味性”形式化为未来压缩进步的归纳启发式，用Kolmogorov复杂度预判数据潜力，直指递归自我改进AI的核心瓶颈。

arXiv:2605.14831v1 Announce Type: new Abstract: One of the bottlenecks on the way towards recursively self-improving systems is the challenge of inter…

递归自我改进系统 kolmogorov 有趣性压缩归纳启发式

📅 日期

2026-05-20 2026-05-19