Wake-Up Call: Why AI Safety Guardrails Break Under Pressure
六大模型压力测试揭示AI安全护栏在持续追问下会失效,值得关注
This is a submission for the Google I/O Writing Challenge This is a submission for the Google I/O Writing Challenge We treat AI safety as a static sta…
六大模型压力测试揭示AI安全护栏在持续追问下会失效,值得关注
This is a submission for the Google I/O Writing Challenge This is a submission for the Google I/O Writing Challenge We treat AI safety as a static sta…
XBOX版《最终幻想7:重生》开发预载,169.36GB容量警告S系存储告急,系列新动态一并盘点。
IT之家 5 月 23 日消息,科技媒体 NotebookCheck 昨日(5 月 22 日)发布博文,报道称 XBOX 版 《最终幻想 7:重生》游戏已开放预载, 文件大小达到 169.36GB,比 2024 年 PS5 版(145GB)大约 16.8%。 该媒体指出 XBOX 版 《最终幻想 7…
5 月 23 日消息,蔚来举行一季度财报媒体交流会。针对市场关注的二季度毛利率和交付增长,蔚来创始人、董事长、CEO 李斌表示,二季度开始,蔚来面临的成本压力较一季度有所加大,单车成本上涨“大体上一万多块钱”,不同车型情况不同,“高的可能要到一万五”, 主要来自内存、碳酸锂、铜、铝等价格上涨 。 李…
压力会削弱大脑连接记忆的能力,一项新研究揭示了洞察力下降的生理机制
Nature, Published online: 22 May 2026; doi:10.1038/d41586-026-01644-z Imaging suggests why the ability to make inferences declines after an episode of…
蔚来李斌坦言原材料涨价压力大,表示将维持价格稳定,并对未来销量增长保持信心。
IT之家 5 月 21 日消息,今天(21 日)晚间,蔚来创始人、董事长、CEO 李斌在 2026 年一季度财报电话会上表示,今年整个原材料涨价,特别是内存芯片的涨价,对整个行业还是带来了非常大的压力。蔚来每辆车平均下来 有一万以上的成本压力 。 李斌表示,蔚来会 保持价格稳定 ,保持产品、服务的综…
多轮对话评估揭示AI在动物福利对齐上的隐蔽失败,压力下模型会背离初始立场。
arXiv:2605.16301v1 Announce Type: cross Abstract: Single-turn benchmarks such as AnimalHarmBench (AHB) have established important baselines for measur…
5个微分类器从压力、谄媚、幻觉实时监测LLM输出行为,基于心理学漏洞框架
Hey HN! We're Dr. Kashyap Thimmaraju and Giuseppe Canale from Silicon Psyche. We've built Posture Sequence Analysis (PSA), a behavioural health monito…
亚马逊强推AI,员工为凑指标竟编造任务——大厂AI落地的荒诞现实
Article URL: https://www.fastcompany.com/91541586/amazon-workers-pressured-to-up-ai-use-extraneous-tasks Comments URL: https://news.ycombinator.com/it…