牛哥精选 · 所有

📋 全部 ☁️ 云服务 🤖 AI 平台 🔗 API 中转 🔐 安全/认证 💳 支付 📧 通讯 📊 数据分析 🖼 媒体处理 🌐 域名/DNS

📝 深度技术 arXiv AI 2026-05-19

Large Language Models Could Be Rote Learners

大语言模型可能通过死记硬背在测试基准上虚高成绩，揭示评测漏洞

arXiv:2504.08300v5 Announce Type: replace-cross Abstract: Benchmark-based evaluation, e.g., multiple-choice questions (MCQs) and open-ended questions …

大语言模型基准污染机械学习评测可靠性 ai安全

📅 日期

2026-05-20 2026-05-19

🐂 牛哥精选

Large Language Models Could Be Rote Learners

📅 日期