牛哥精选 · 本月

📋 全部 🤖 AI·大模型 ⚡ 效率工具 📝 深度技术 🚀 产品观察 💰 商业科技 🔓 开源项目 🎨 设计创意 📖 阅读推荐 🏷 资源合集 🌱 成长效率

🤖 AI·大模型 arXiv 机器学习 2026-05-25

Strong Teacher Not Needed? On Distillation in LLM Pretraining

颠覆认知？弱教师模型也能有效蒸馏LLM，预训练阶段教师强度并非关键。

arXiv:2605.23857v1 Announce Type: new Abstract: Knowledge distillation generally assumes a strong-to-weak relationship where stronger teachers yield b…

大语言模型知识蒸馏预训练模型压缩弱到弱蒸馏

🤖 AI·大模型 arXiv 机器学习 2026-05-20

Improving MLLM Training Efficiency via Stage-Aware Sparsity

多模态大模型训练新范式：阶段感知稀疏性动态消除冗余，大幅提升效率而保持性能。

arXiv:2509.18150v2 Announce Type: replace Abstract: Multimodal Large Language Models (MLLMs) have demonstrated outstanding performance across a variet…

mllm 训练效率稀疏性多模态阶段感知

📝 深度技术 arXiv NLP 2026-05-20

Efficient Pre-Training with Token Superposition

提出Token叠加技术，颠覆预训练效率瓶颈，大幅降低算力需求，LLM训练优化必读。

arXiv:2605.06546v2 Announce Type: replace Abstract: Pre-training of Large Language Models is often prohibitively expensive and inefficient at scale, r…

预训练 token supe 高效训练大语言模型机器学习

🤖 AI·大模型 arXiv 机器学习 2026-05-20

Heterogeneity-Aware Dataset Scheduling for Efficient Audio Large Language Model Training

提出异构感知数据集调度方法，提升音频大模型训练效率与效果的新方案。

arXiv:2605.19101v1 Announce Type: cross Abstract: Training general-purpose Audio Large Language Models (ALLMs) across diverse datasets is essential fo…

音频大语言模型数据集调度异构感知训练效率 ai训练优化

📝 深度技术 arXiv NLP 2026-05-20

Full Attention Strikes Back: Transferring Full Attention into Sparse within Hundred Training Steps

突破大模型长上下文推理瓶颈，百步内将全注意力高效转为稀疏，平衡效率与精度。

arXiv:2605.16928v1 Announce Type: new Abstract: Long-context inference in large language models is bottlenecked by the quadratic cost of full attentio…

大模型长上下文稀疏注意力训练效率推理优化

📝 深度技术 arXiv AI 2026-05-20

Beyond What to Select: A Plug-and-play Oscillatory Data-Volume Scheduling for Efficient Model Training

论文提出即插即用的振荡式数据体积调度方法，超越传统样本选择，显著提升模型训练效率。

arXiv:2605.14773v1 Announce Type: cross Abstract: Data selection accelerates training by identifying representative training data while preserving mod…

数据选择模型训练效率振荡调度即插即用

📝 深度技术 OpenAI 官方博客 2026-05-19

Efficient training of language models to fill in the middle

OpenAI 详解高效训练语言模型完成中间填充（FIM）的新方法，提升代码补全与文本生成能力

语言模型训练效率 fim 中间填充 openai

📝 深度技术 arXiv AI 2026-05-19

Autoguided Online Data Curation for Diffusion Model Training

最新研究用自动引导和在线数据筛选优化扩散模型训练，显著提升效率

arXiv:2509.15267v2 Announce Type: replace-cross Abstract: The costs of generative model compute rekindled promises and hopes for efficient data curati…

扩散模型数据筛选自动引导训练效率 jest

📅 日期

2026-05-20 2026-05-19

🐂 牛哥精选

📅 日期