牛哥精选 · 三个月

📋 全部 🤖 AI·大模型 ⚡ 效率工具 📝 深度技术 🚀 产品观察 💰 商业科技 🔓 开源项目 🎨 设计创意 📖 阅读推荐 🏷 资源合集 🌱 成长效率

🤖 AI·大模型 arXiv AI 2026-06-15

Fractured Chain-of-Thought Reasoning

一篇最新论文探索了思维链推理中的“断裂”现象，揭示了大模型推理过程中的关键缺陷与改进方向。

arXiv:2505.12992v4 Announce Type: replace-cross Abstract: Inference-time scaling techniques have significantly bolstered the reasoning capabilities of…

思维链推理推理时扩展大型语言模型推理鲁棒性论文解读

🤖 AI·大模型 arXiv NLP 2026-05-22

Robust Reasoning Benchmark

AIME 2024数学题经13种文本扰动，测试大模型推理鲁棒性，揭示依赖格式的短板

arXiv:2604.08571v2 Announce Type: replace-cross Abstract: While Large Language Models (LLMs) achieve high performance on standard mathematical benchma…

大语言模型推理鲁棒性基准测试文本扰动 aime 2024

📝 深度技术 arXiv AI 2026-05-22

Lost in Fog: Sensor Perturbations Expose Reasoning Fragility in Driving VLAs

自动驾驶VLA模型在传感器扰动下推理脆弱性被揭穿，最新论文揭示其可靠性隐患

arXiv:2605.21446v1 Announce Type: cross Abstract: Interpretable autonomous driving planners depend not only on generating explanations, but also on th…

自动驾驶视觉-语言-动作模型传感器退化推理鲁棒性学术论文

📅 日期

2026-05-20 2026-05-19

🐂 牛哥精选

Fractured Chain-of-Thought Reasoning

Robust Reasoning Benchmark

Lost in Fog: Sensor Perturbations Expose Reasoning Fragility in Driving VLAs

📅 日期