1
Claude 通过率不到4%,SaaS-Bench撕碎了Computer-Use的「全自动办公」幻想
Claude Opus 4.7在106个真实办公任务中完全通过率仅3.8%,这场残酷评测撕碎了AI全自动办公的幻想。
UniPat AI 发布 SaaS-Bench 评测,Claude 等主流大模型在真实办公任务中完全通过率最高仅 3.8%,AI 全自动办公远未落地。
Claude Opus 4.7在106个真实办公任务中完全通过率仅3.8%,这场残酷评测撕碎了AI全自动办公的幻想。
UniPat AI 发布 SaaS-Bench 评测,Claude 等主流大模型在真实办公任务中完全通过率最高仅 3.8%,AI 全自动办公远未落地。
IT之家 5 月 25 日消息,美国机器人企业 Figure AI 旗下的 Figure 03 人形机器人,已完成长达 200 小时的全自动作业直播。 IT之家注意到,在此次作业期间,这些机器人累计分拣近 25 万个包裹,全程未出现任何硬件故障。 公司首席执行官布雷特 · 阿德科克表示,这次里程碑式…
中亚首条全自动无人驾驶轻轨通车,中企全套中国技术输出,连接机场与火车站,开启智能出行新篇章。
IT之家 5 月 16 日消息,据央视新闻今日报道,当地时间 5 月 16 日,哈萨克斯坦阿斯塔纳轻轨一期项目正式通车,这也是中亚地区首条全自动无人驾驶轻轨线路,该线路主要由中企承建,并采用中国装备、中国技术和中国标准。 阿斯塔纳轻轨一期项目全长约 22.4 公里,共 18 个车站。线路南起纳扎尔巴…