牛哥精选 · 本月

今日本周本月三个月半年一年所有

📋 全部 🤖 AI·大模型 ⚡ 效率工具 📝 深度技术 🚀 产品观察 💰 商业科技 🔓 开源项目 🎨 设计创意 📖 阅读推荐 🏷 资源合集 🌱 成长效率

🤖 AI·大模型量子位 2026-05-29

Claude 4.8炸场！部分能力超过Mythos，支持数百子智能体并行

Claude 4.8重磅升级：长任务自主执行、数百子智能体并行，错误率暴降10倍，代码缺陷报告减少75%

可以长时间执行任务，人类不用经常回来检查它的工作

炸场部分能力超过支持数百子智能体并行 claude 4.8

🔐 安全/认证 IT 之家 2026-05-28

王传福：比亚迪在 L2 阶段率先承担起 L3、L4 的责任是技术自信，更是为用户负责

IT之家 5 月 28 日消息，在今天的比亚迪智能化战略发布会上，比亚迪集团董事长兼总裁王传福发表演讲。 IT之家在发布会现场了解到，王传福宣布比亚迪继智能泊车安全兜底后，再次率先承诺为城市领航安全兜底 1 年。王传福强调，比亚迪在 L2 阶段率先承担起 L3、L4 的责任是技术自信，更是为用…

王传福比亚迪在阶段率先承担的责任是技术自信

🤖 AI·大模型 arXiv AI 2026-05-27

Self-signals Driven Multi-LLM Debate for Efficient and Accurate Reasoning

多LLM辩论新范式：利用自信号驱动，在高效与准确推理间取得突破，节省算力并提升效果。

arXiv:2510.06843v2 Announce Type: replace-cross Abstract: Large Language Models (LLMs) have exhibited impressive capabilities across diverse applicati…

多llm辩论自信号推理效率准确推理大模型协作

📝 深度技术 arXiv AI 2026-05-26

Understanding and Mitigating Premature Confidence for Better LLM Reasoning

最新研究揭示LLM长思维链中“过早自信”导致的逻辑缺口，并提出基于过程奖励模型的缓解策略，提升推理质量。

arXiv:2605.24396v1 Announce Type: new Abstract: Long chains of thought (CoT) from current language models frequently contain logical gaps and unjustif…

llm推理过早自信思维链过程奖励模型逻辑缺口

📝 深度技术 arXiv 机器学习 2026-05-20

How do LLMs Compute Verbal Confidence

揭秘LLMs如何内部计算口头自信度：是即时响应还是自动生成？这项研究打开黑箱，深入模型推理过程。

arXiv:2603.17839v3 Announce Type: replace-cross Abstract: Verbal confidence -- prompting LLMs to state their confidence as a number or category -- is …

llm 自信度计算内部机制不确定性估计即时计算

📅 日期

2026-05-20 2026-05-19