牛哥精选 · 所有

📋 全部 ☁️ 云服务 🤖 AI 平台 🔗 API 中转 🔐 安全/认证 💳 支付 📧 通讯 📊 数据分析 🖼 媒体处理 🌐 域名/DNS

🤖 AI·大模型 arXiv AI 2026-05-26

Reward-free Alignment for Conflicting Objectives

无需奖励信号，仅靠目标冲突就能实现高效对齐，ICML 2026 Oral 论文揭秘全新思路。

arXiv:2602.02495v3 Announce Type: replace-cross Abstract: Direct alignment methods are increasingly used to align large language models (LLMs) with hu…

reward-fre alignment 冲突目标 icml 2026 对齐方法

📝 深度技术 arXiv 机器学习 2026-05-20

Alignment Dynamics in LLM Fine-Tuning

揭秘LLM微调中对齐为何脆弱：从参数动态到输出分布的统一视角

arXiv:2605.18309v1 Announce Type: new Abstract: Although Large Language Models (LLMs) achieve strong alignment through supervised fine-tuning and rein…

llm fine-tunin alignment 机器学习深度学习

📅 日期

2026-05-20 2026-05-19

🐂 牛哥精选

Reward-free Alignment for Conflicting Objectives

Alignment Dynamics in LLM Fine-Tuning

📅 日期