1
李飞飞再出手,空间智能的ImageNet来了
一个专门用来评测具身空间智能的新基准
一个专门用来评测具身空间智能的新基准
用数据集+模型+基准全方位提升多模态大模型跨视图空间智能,突破单视角局限。
arXiv:2605.18621v1 Announce Type: new Abstract: Spatial intelligence requires multimodal large language models (MLLMs) to move beyond single-view perc…
多模态大模型在空间智能上的突破,赋予AI更强的视觉感知与推理能力。
arXiv:2505.23747v2 Announce Type: replace-cross Abstract: Recent advancements in Multimodal Large Language Models (MLLMs) have significantly enhanced …