牛哥精选 · 所有

📋 全部 ☁️ 云服务 🤖 AI 平台 🔗 API 中转 🔐 安全/认证 💳 支付 📧 通讯 📊 数据分析 🖼 媒体处理 🌐 域名/DNS

🤖 AI·大模型 arXiv AI 2026-06-08

SWE-IF: Aligning Code Evaluation with Human Preference

超越功能正确性，提出对齐人类偏好的代码评估框架SWE-IF，让AI生成的代码通过“感觉”检验

arXiv:2510.07315v2 Announce Type: replace-cross Abstract: Large Language Models (LLMs) have catalyzed vibe coding, where users leverage LLMs to genera…

swe-if 代码评估人类偏好大语言模型 vibe codin

📝 深度技术 arXiv 机器学习 2026-05-20

DARC: Disagreement-Aware Alignment via Risk-Constrained Decoding

大模型对齐新方法：通过风险约束解码感知人类偏好分歧，提升模型鲁棒性。

arXiv:2603.08145v2 Announce Type: replace Abstract: Preference-based alignment methods (e.g., RLHF, DPO) typically optimize a single scalar objective,…

分歧感知对齐风险约束解码大模型对齐人类偏好 arxiv论文

📅 日期

2026-05-20 2026-05-19

🐂 牛哥精选

SWE-IF: Aligning Code Evaluation with Human Preference

DARC: Disagreement-Aware Alignment via Risk-Constrained Decoding

📅 日期