牛哥精选 · 三个月

📋 全部 🤖 AI·大模型 ⚡ 效率工具 📝 深度技术 🚀 产品观察 💰 商业科技 🔓 开源项目 🎨 设计创意 📖 阅读推荐 🏷 资源合集 🌱 成长效率

🤖 AI·大模型 arXiv 机器学习 2026-06-23

ASCII Art Turns LLMs into VLA Controllers

将古老ASCII艺术作为桥梁，让大语言模型变身视觉-语言-动作控制器，探索多模态智能新路径。

arXiv:2606.21470v1 Announce Type: cross Abstract: Vision--Language--Action (VLA) controllers are often built by extending vision--language models (VLM…

ascii art llm vla contro 视觉语言动作多模态

🤖 AI·大模型 arXiv 计算机视觉 2026-05-21

VLANeXt: Recipes for Building Strong VLA Models

顶级会议ICML 2026收录，揭秘构建强视觉-语言-动作（VLA）模型的实用配方与技巧。

arXiv:2602.18532v2 Announce Type: replace Abstract: Following the rise of large foundation models, Vision-Language-Action models (VLAs) emerged, lever…

vlanext vla模型视觉语言动作 icml 2026 模型构建

📝 深度技术 arXiv 机器学习 2026-05-20

Universal Pose Pretraining for Generalizable Vision-Language-Action Policies

机器人基础模型新突破：通用姿态预训练让视觉-语言-动作策略泛化能力飙升，已被RSS 2026接收。

arXiv:2602.19710v2 Announce Type: replace-cross Abstract: Existing Vision-Language-Action (VLA) models often suffer from feature collapse and low trai…

通用姿态预训练视觉语言动作策略机器人基础模型 rss 2026 泛化性

📝 深度技术 arXiv AI 2026-05-19

UAM: A Dual-Stream Perspective on Forgetting in VLA Training

揭示VLA训练中VLM多模态能力系统退化的“具身税”现象，提出双流新视角UAM

arXiv:2605.15735v1 Announce Type: cross Abstract: Vision--language--action (VLA) models are typically built by fine-tuning a pretrained vision--langua…

uam vla 视觉语言动作遗忘多模态

🔗 导航合集 arXiv 机器学习 2026-05-19

Learn Where Outcomes Diverge: Efficient VLA RL via Probabilistic Chunk Masking

提出概率块掩码机制，直击VLA强化学习后训练计算瓶颈，显著提升效率。

arXiv:2605.16154v1 Announce Type: new Abstract: Reinforcement learning (RL) allows vision-language-action (VLA) policies to generalize beyond their tr…

vla 强化学习概率块掩码效率优化机器人

🤖 AI·大模型 arXiv AI 2026-05-19

PhysBrain 1.0 Technical Report

从人类自我中心视频提取物理常识监督，助力机器人学习更广物理理解的新方法

arXiv:2605.15298v1 Announce Type: cross Abstract: Vision-language-action models have advanced rapidly, but robot trajectories alone provide limited co…

physbrain 机器人学习自我中心视频物理常识视觉语言动作模型

📅 日期

2026-05-20 2026-05-19