牛哥精选 · 三个月

📋 全部 🤖 AI·大模型 ⚡ 效率工具 📝 深度技术 🚀 产品观察 💰 商业科技 🔓 开源项目 🎨 设计创意 📖 阅读推荐 🏷 资源合集 🌱 成长效率

🤖 AI·大模型 arXiv NLP 2026-06-01

"In\^{t}elegi Rom\^ane\c{s}te?'' A Recipe for Romanian Vision-Language Models

罗马尼亚语视觉语言模型的构建指南，教你如何为低资源语言打造多模态AI。

arXiv:2605.31401v1 Announce Type: new Abstract: Vision-Language Models (VLMs) largely follow the text-only LLM trajectory, excelling on English benchm…

vision-lan 低资源语言多模态罗马尼亚语机器学习

🤖 AI·大模型 arXiv 机器学习 2026-05-20

Hybrid Training for Vision-Language-Action Models

ICLR 2026论文提出混合训练框架，统一视觉-语言-动作模型，提升多模态具身智能表现。

arXiv:2510.00600v2 Announce Type: replace-cross Abstract: Using Large Language Models to produce intermediate thoughts, a.k.a. Chain-of-thought (CoT),…

vision-lan hybrid tra 多模态具身智能 iclr 2026

🤖 AI·大模型 arXiv AI 2026-05-19

VLRS-Bench: A Vision-Language Reasoning Benchmark for Remote Sensing

首个专为遥感领域复杂推理设计的视觉语言基准VLRS-Bench，从认知、决策、预测三维度构建2000个高难度问答对，揭示现有MLLM在遥感推理上的显著瓶颈，为多模态AI在遥感应用的发展提供关键方向。

arXiv:2602.07045v2 Announce Type: replace-cross Abstract: Recent advancements in Multimodal Large Language Models (MLLMs) have enabled complex reasoni…

vlrs-bench remote sen vision-lan reasoning benchmark

📅 日期

2026-05-20 2026-05-19

🐂 牛哥精选

"In\^{t}elegi Rom\^ane\c{s}te?'' A Recipe for Romanian Vision-Language Models

Hybrid Training for Vision-Language-Action Models

VLRS-Bench: A Vision-Language Reasoning Benchmark for Remote Sensing

📅 日期