牛哥精选 · 本周

📋 全部 🤖 AI·大模型 ⚡ 效率工具 📝 深度技术 🚀 产品观察 💰 商业科技 🔓 开源项目 🎨 设计创意 📖 阅读推荐 🏷 资源合集 🌱 成长效率

📝 深度技术 arXiv NLP 2026-05-22

Unified Data Selection for LLM Reasoning

提出统一数据选择框架，为LLM推理任务高效筛选高质量训练数据，显著提升推理能力。

arXiv:2605.22389v1 Announce Type: new Abstract: Effectively training Large Language Models (LLMs) for complex, long-CoT reasoning is often bottlenecke…

llm推理数据选择统一框架人工智能大语言模型

🤖 AI·大模型 arXiv 机器学习 2026-05-20

Difficulty-Based Preference Data Selection by DPO Implicit Reward Gap

新方法用DPO隐式奖励差距衡量样本难度，自动筛选高质量偏好数据，提升模型训练效率。

arXiv:2508.04149v2 Announce Type: replace-cross Abstract: Aligning large language models (LLMs) with human preferences is a critical challenge in AI r…

偏好数据选择 dpo 隐式奖励数据筛选难度评估

📝 深度技术 arXiv 机器学习 2026-05-20

Learning-Zone Energy: Online Data Selection for Efficient RL Post-Training

提出Learning-Zone Energy方法，在线选择数据以提升RL后训练效率，避免均匀分配浪费计算。

arXiv:2605.17003v1 Announce Type: new Abstract: Reinforcement Learning (RL) post-training has emerged as the dominant paradigm for eliciting mathemati…

数据选择强化学习后训练大语言模型计算优化

📝 深度技术 arXiv 机器学习 2026-05-20

Convex Dataset Valuation for Post-Training

提出凸数据集估值方法，解决LLM后训练中数据集选择的成本与性能权衡问题

arXiv:2605.16704v1 Announce Type: new Abstract: Improving LLM performance on downstream tasks sometimes requires leveraging auxiliary datasets during …

数据集估值后训练凸优化 llm 数据选择

📝 深度技术 arXiv AI 2026-05-20

Beyond What to Select: A Plug-and-play Oscillatory Data-Volume Scheduling for Efficient Model Training

论文提出即插即用的振荡式数据体积调度方法，超越传统样本选择，显著提升模型训练效率。

arXiv:2605.14773v1 Announce Type: cross Abstract: Data selection accelerates training by identifying representative training data while preserving mod…

数据选择模型训练效率振荡调度即插即用

📝 深度技术 arXiv 机器学习 2026-05-19

SEED: Targeted Data Selection by Weighted Independent Set

由相似图构建加权独立集，平衡样本质量与多样性，为高效数据选择提供新框架。

arXiv:2605.15691v1 Announce Type: new Abstract: Data selection seeks to identify a compact yet informative subset from large-scale training corpora, b…

数据选择加权独立集机器学习训练数据相似图

📅 日期

2026-05-20 2026-05-19