宇瞻推出 GraTherX 内存条散热技术:每侧加厚 0.17mm,故障率降低 60%
IT之家 6 月 13 日消息,宇瞻 (Apacer) 近日宣布推出针对低气流设备设计的内存条散热解决方案 GraTherX,宣称其仅需在裸条模组两侧各加厚 0.17mm 即可 让内存故障率降低 60% 。 GraTherX 面向边缘 AI、工业电脑、嵌入式系统, 采用石墨烯-铜复合材料和一体式双面…
IT之家 6 月 13 日消息,宇瞻 (Apacer) 近日宣布推出针对低气流设备设计的内存条散热解决方案 GraTherX,宣称其仅需在裸条模组两侧各加厚 0.17mm 即可 让内存故障率降低 60% 。 GraTherX 面向边缘 AI、工业电脑、嵌入式系统, 采用石墨烯-铜复合材料和一体式双面…
开源项目通过独创“快照”机制,让AI编程成本直降98%,记忆力从30分钟跃升至3小时,登顶GitHub Hacker News。
文|李嘉星 编辑|周鑫雨 一句话介绍 context-mode 是一款专为 AI 编程打造的上下文优化 MCP(Anthropic 发布的模型上下文协议)插件。 它解决了开发者在长周期开发中遭遇的“模型失忆”与“Token 过多消耗”的核心痛点。 据团队表示,在编程场景下,context-mode …
ChatGPT个人用户新增锁定模式,限制联网功能防数据泄露,提升隐私安全。
IT之家 6 月 6 日消息,OpenAI 昨天宣布为所有 ChatGPT 个人用户开放“锁定模式”,启动后可限制多项需要互联网 / 外部服务的功能, 降低数据泄露风险 。 据IT之家此前报道 ,该功能早在今年 2 月就已推出,当时主要面向小部分企业用户、安全团队开放。如今该功能可供所有 Free、…
特锐德推出算力中心高压交直流预制舱供电站“算电岛”,重构智算中心供电底层架构,设备工厂模块化预制,可直入110/220kV高压,800V直流直供机房。建设周期缩至150天;依托碳化硅SST技术,供电效率98.5%;依托算电协同AI平台优化调度,Token用电成本下降约30%;800V母线直挂储能,实…
腾讯混元提出Stem稀疏注意力算法,从因果信息流革新块稀疏,首字延迟降低3.6倍,已被ICML-26收录。
IT之家 6 月 5 日消息,腾讯混元今日宣布提出 Stem 稀疏注意力算法,已被机器学习顶会 ICML-26 收录。 官方表示,Stem 稀疏注意力算法从“因果信息流”重新审视块级稀疏,用 Token 位置衰减(TPD)和输出感知度量(OAM)两大创新, 仅用 25% 算力就逼近稠密注意力的精度 …
谷歌实时音乐AI模型MRT2本地运行,延迟骤降至1/15,支持即兴合奏,大小两种规模可选。
IT之家 6 月 5 日消息, 谷歌 Magenta 团队昨日(6 月 4 日)发布 Magenta RealTime 2(MRT2)模型 ,并同步免费放出乐器应用 Jam 以及 DAW 插件 MRT2。 MRT2 定位是可与用户“即兴合奏”的本地实时音乐模型,共有 2 种规模,其一是高质量模型 m…
大语言模型在交互场景中如何主动提问降低不确定性?这篇论文提出对话感知贝叶斯实验设计方法。
arXiv:2606.01182v1 Announce Type: cross Abstract: Large Language Models (LLMs) excel at static reasoning tasks, yet their performance often degrades i…
IT之家 6 月 2 日消息,据彭博社今天报道,埃隆 · 马斯克旗下企业 SpaceX 正在与华尔街投行协商,希望以极低的承销费率完成上市交易。不过即便如此,这些华尔街银行仍有望从这场创纪录规模的 IPO 中, 获得约 5 亿美元(现汇率约合 33.9 亿元人民币)收入 。 知情人士透露,马斯克这家…
AI代理读取内容前自动压缩,最高减少90% token消耗,实现成本断崖式下降。
Article URL: https://pypi.org/project/headroom-ai/ Comments URL: https://news.ycombinator.com/item?id=48349275 Points: 1 # Comments: 0
小米首次公开MiMo模型推理系统全链路优化细节,Hybrid SWA等工程化实践将架构优势转化为真实效率提升,最高降价99%。
IT之家 5 月 30 日消息,5 月 27 日, 小米 MiMo-V2.5 系列 API 完成永久降价 , 最高降幅达 99% ,不区分输入长度。今日,小米正式公开 MiMo-V2.5 系列模型的推理系统全链路优化方案。 据介绍,该团队围绕 Hybrid SWA + MoE + 多模态的复合架构,…
开源LLM上下文优化工具,剔除95%无关token,将百万token知识库查询成本降到极致。
Article URL: https://github.com/zzorphcreator/knowa Comments URL: https://news.ycombinator.com/item?id=48328512 Points: 1 # Comments: 0
OpenAI广告业务转向小型企业,2030年千亿美元营收目标曝光,降低投放门槛的新策略值得关注。
IT之家 5 月 27 日消息,据 The Information 昨日报道,OpenAI 正转向小型企业,以实现其宏大的广告目标。 OpenAI 上月向投资者透露: 到 2030 年其广告业务收入将增长至 1000 亿美元 (IT之家注:现汇率约合 6798.71 亿元人民币)。 今年早些时候,O…
自动从源文件生成完整eBPF项目代码,让Linux内核开发更轻松
IT之家 5 月 26 日消息,科技媒体 Linuxiac 昨日(5 月 25 日)发布博文,报道称 KernelScript 0.1 首个公开版发布, 这是一个面向 eBPF 开发的开源新语言,采用 Apache 2.0 许可证。 IT之家注:eBPF(Extended Berkeley Pack…
IT之家 5 月 26 日消息,随着人工智能算力需求的持续攀升,高带宽内存(HBM)正加速向更多堆叠层数与更高运行速度迭代,但随之而来的发热问题也成为制约产品稳定性的关键瓶颈。 SK 海力士于 5 月 26 日宣布推出名为“iHBM”的控温散热存储技术,通过在高带宽内存封装内直接集成一体化冷却元件,…
DeepSeek V4新工具缓存命中率99.82%,长会话成本直降80%,2折玩转大模型。
原本4亿+token、61美元的账单,直降至12美元
游戏巨头Take-Two CEO直言:AI非但不能降低游戏制作成本,反而因创作诉求拓宽推高投入,揭示行业技术应用的现实规律。
IT之家 5 月 25 日消息,游戏巨头 Take-Two Interactive 公司首席执行官施特劳斯 · 泽尔尼克近期接受 CNBC 采访时表示,人工智能并未降低游戏制作开支,未来也难以实现这一效果。相反,为满足玩家需求,人工智能反而会推高研发成本。 泽尔尼克称,“娱乐产业的技术应用规律向来如…
OlmoEarth v1.1在训练和推理上分别节省1.7倍GPU时间和2.9倍MACs,效率大幅提升。
arXiv:2605.20804v1 Announce Type: cross Abstract: We present a set of improvements to the OlmoEarth family. These improvements allow us to cut compute…
GPT-5.5 驱动 Codex 在 NVIDIA 基础设施上运行,上万员工实测效率飙升,成本直降 35 倍
AI agents have revolutionized developer workflows, and their next frontier is knowledge work: processing information, solving complex problems, coming…
聚焦固态电池核心材料量产计划,目标成本降至1元/Wh,关键突破点在于硫化锂成本控制。
IT之家 5 月 17 日消息,据界面新闻今日报道,在 5 月 17 日举办的国轩高科科技大会上,国轩高科宣布,为解决固态电池价格高难题,计划实现固态电池关键材料的量产。 据国轩高科高级总监潘瑞军介绍, 硫化物固态电池成本的 70%-80% 来自硫化物电解质 ,而硫化物电解质成本的 70%-80% …