牛哥精选 · 本月

📋 全部 🤖 AI·大模型 ⚡ 效率工具 📝 深度技术 🚀 产品观察 💰 商业科技 🔓 开源项目 🎨 设计创意 📖 阅读推荐 🏷 资源合集 🌱 成长效率

🤖 AI·大模型 arXiv AI 2026-06-02

FeynmanBench: Benchmarking Multimodal LLMs on Diagrammatic Physics Reasoning

多模态大模型在物理图示推理上的首个专门基准，揭示模型读图理解物理学关键短板。

arXiv:2604.03893v2 Announce Type: replace Abstract: Current multimodal benchmarks for scientific reasoning primarily evaluate local information extrac…

多模态大模型图示推理物理推理基准测试 feynman图

📅 日期

2026-05-20 2026-05-19

🐂 牛哥精选

FeynmanBench: Benchmarking Multimodal LLMs on Diagrammatic Physics Reasoning

📅 日期