1
On the Cultural Anachronism and Temporal Reasoning in Vision Language Models
视觉语言模型正被广泛应用于文化遗产领域,但一篇新研究揭示了其隐藏的硬伤:文化时代错位。模型难以准确理解历史文物中的时间语境,尤其在非西方视觉文化上表现糟糕。这项基准测试戳中了多模态AI无法跨越的文化盲区。
arXiv:2605.15071v1 Announce Type: cross Abstract: Vision-Language Models (VLMs) are increasingly applied to cultural heritage materials, from digital …