牛哥精选 · 本月

1

🤖 AI·大模型 IT 之家 2026-06-13

宇瞻推出 GraTherX 内存条散热技术：每侧加厚 0.17mm，故障率降低 60%

IT之家 6 月 13 日消息，宇瞻 (Apacer) 近日宣布推出针对低气流设备设计的内存条散热解决方案 GraTherX，宣称其仅需在裸条模组两侧各加厚 0.17mm 即可让内存故障率降低 60% 。 GraTherX 面向边缘 AI、工业电脑、嵌入式系统，采用石墨烯-铜复合材料和一体式双面…

宇瞻推出内存条散热技每侧加厚故障率降低

2

🔓 开源项目 36氪 2026-06-09

登顶GitHub Hacker News，这个开源项目让AI编程成本降低 98%｜涌现新项目

开源项目通过独创“快照”机制，让AI编程成本直降98%，记忆力从30分钟跃升至3小时，登顶GitHub Hacker News。

文｜李嘉星编辑｜周鑫雨一句话介绍 context-mode 是一款专为 AI 编程打造的上下文优化 MCP（Anthropic 发布的模型上下文协议）插件。它解决了开发者在长周期开发中遭遇的“模型失忆”与“Token 过多消耗”的核心痛点。据团队表示，在编程场景下，context-mode …

登顶这个开源项目编程成本降低涌现新项目 ai编程

3

🚀 产品观察 IT 之家 2026-06-06

OpenAI 为所有 ChatGPT 个人用户开放锁定模式，启用后可降低数据泄露风险

ChatGPT个人用户新增锁定模式，限制联网功能防数据泄露，提升隐私安全。

IT之家 6 月 6 日消息，OpenAI 昨天宣布为所有 ChatGPT 个人用户开放“锁定模式”，启动后可限制多项需要互联网 / 外部服务的功能，降低数据泄露风险。据IT之家此前报道，该功能早在今年 2 月就已推出，当时主要面向小部分企业用户、安全团队开放。如今该功能可供所有 Free、…

为所有个人用户开放锁定模式启用后可降低数据泄露风险

4

🤖 AI·大模型 36氪 2026-06-06

特锐德：推出算力中心供电站“算电岛” Token成本可降低30%

特锐德推出算力中心高压交直流预制舱供电站“算电岛”，重构智算中心供电底层架构，设备工厂模块化预制，可直入110/220kV高压，800V直流直供机房。建设周期缩至150天；依托碳化硅SST技术，供电效率98.5%；依托算电协同AI平台优化调度，Token用电成本下降约30%；800V母线直挂储能，实…

特锐德推出算力中心供电站算电岛成本可降低

5

🤖 AI·大模型 IT 之家 2026-06-05

腾讯混元提出 Stem 稀疏注意力算法，首字延迟降低 3.6 倍

腾讯混元提出Stem稀疏注意力算法，从因果信息流革新块稀疏，首字延迟降低3.6倍，已被ICML-26收录。

IT之家 6 月 5 日消息，腾讯混元今日宣布提出 Stem 稀疏注意力算法，已被机器学习顶会 ICML-26 收录。官方表示，Stem 稀疏注意力算法从“因果信息流”重新审视块级稀疏，用 Token 位置衰减（TPD）和输出感知度量（OAM）两大创新，仅用 25% 算力就逼近稠密注意力的精度 …

腾讯混元提出稀疏注意力算首字延迟降低腾讯混元 stem稀疏注意力

6

🤖 AI·大模型 IT 之家 2026-06-05

谷歌推出 Magenta RealTime 2 本地实时音乐 AI 模型：延迟降低至 1/15

谷歌实时音乐AI模型MRT2本地运行，延迟骤降至1/15，支持即兴合奏，大小两种规模可选。

IT之家 6 月 5 日消息，谷歌 Magenta 团队昨日（6 月 4 日）发布 Magenta RealTime 2（MRT2）模型，并同步免费放出乐器应用 Jam 以及 DAW 插件 MRT2。 MRT2 定位是可与用户“即兴合奏”的本地实时音乐模型，共有 2 种规模，其一是高质量模型 m…

谷歌推出本地实时音乐模型延迟降低至谷歌

7

🤖 AI·大模型 arXiv AI 2026-06-02

CA-BED: Conversation-Aware Bayesian Experimental Design

大语言模型在交互场景中如何主动提问降低不确定性？这篇论文提出对话感知贝叶斯实验设计方法。

arXiv:2606.01182v1 Announce Type: cross Abstract: Large Language Models (LLMs) excel at static reasoning tasks, yet their performance often degrades i…

大语言模型贝叶斯实验设计交互式推理不确定性降低问题选择

8

🤖 AI·大模型 IT 之家 2026-06-02

消息称 SpaceX 要求投行降低 IPO 承销费率，压低至 0.75% 以下

IT之家 6 月 2 日消息，据彭博社今天报道，埃隆 · 马斯克旗下企业 SpaceX 正在与华尔街投行协商，希望以极低的承销费率完成上市交易。不过即便如此，这些华尔街银行仍有望从这场创纪录规模的 IPO 中，获得约 5 亿美元（现汇率约合 33.9 亿元人民币）收入。知情人士透露，马斯克这家…

消息称要求投行降低承销费率压低至以下

9

⚡ 效率工具 Hacker News AI 2026-06-01

Headroom compresses everything your AI agent reads before it reaches the LLM

AI代理读取内容前自动压缩，最高减少90% token消耗，实现成本断崖式下降。

Article URL: https://pypi.org/project/headroom-ai/ Comments URL: https://news.ycombinator.com/item?id=48349275 Points: 1 # Comments: 0

ai代理 token压缩成本优化 llm应用开源工具

10

📝 深度技术 IT 之家 2026-05-30

最高降价 99%，小米 MiMo 首次公开模型推理系统全链路优化技术细节

小米首次公开MiMo模型推理系统全链路优化细节，Hybrid SWA等工程化实践将架构优势转化为真实效率提升，最高降价99%。

IT之家 5 月 30 日消息，5 月 27 日，小米 MiMo-V2.5 系列 API 完成永久降价，最高降幅达 99% ，不区分输入长度。今日，小米正式公开 MiMo-V2.5 系列模型的推理系统全链路优化方案。据介绍，该团队围绕 Hybrid SWA + MoE + 多模态的复合架构，…

最高降价小米首次公开模型推理系统全链路优化技术细

11

🔓 开源项目 Hacker News LLM 2026-05-30

Knowa – Open-Source LLM Context Optimizer

开源LLM上下文优化工具，剔除95%无关token，将百万token知识库查询成本降到极致。

Article URL: https://github.com/zzorphcreator/knowa Comments URL: https://news.ycombinator.com/item?id=48328512 Points: 1 # Comments: 0

knowa 开源 llm 上下文优化成本降低

12

💰 商业科技 IT 之家 2026-05-27

OpenAI 被曝广告业务新策略：吸引小型企业，降低投放门槛

OpenAI广告业务转向小型企业，2030年千亿美元营收目标曝光，降低投放门槛的新策略值得关注。

IT之家 5 月 27 日消息，据 The Information 昨日报道，OpenAI 正转向小型企业，以实现其宏大的广告目标。 OpenAI 上月向投资者透露：到 2030 年其广告业务收入将增长至 1000 亿美元（IT之家注：现汇率约合 6798.71 亿元人民币）。今年早些时候，O…

被曝广告业务新策略吸引小型企业降低投放门槛 openai

13

🔧 开发工具 IT 之家 2026-05-26

KernelScript 0.1 开源新语言发布，降低 Linux 内核 eBPF 开发门槛

自动从源文件生成完整eBPF项目代码，让Linux内核开发更轻松

IT之家 5 月 26 日消息，科技媒体 Linuxiac 昨日（5 月 25 日）发布博文，报道称 KernelScript 0.1 首个公开版发布，这是一个面向 eBPF 开发的开源新语言，采用 Apache 2.0 许可证。 IT之家注：eBPF（Extended Berkeley Pack…

开源新语言发降低内核开发门槛 ebpf

14

🎨 设计工具 IT 之家 2026-05-26

不换设计直接降温：SK 海力士发布控温散热存储技术“iHBM”，降低热阻超 30%

IT之家 5 月 26 日消息，随着人工智能算力需求的持续攀升，高带宽内存（HBM）正加速向更多堆叠层数与更高运行速度迭代，但随之而来的发热问题也成为制约产品稳定性的关键瓶颈。 SK 海力士于 5 月 26 日宣布推出名为“iHBM”的控温散热存储技术，通过在高带宽内存封装内直接集成一体化冷却元件，…

不换设计直接降温海力士发布控温散热存储技降低热阻超

15

🤖 AI·大模型量子位 2026-05-25

DeepSeek V4还能更省！新工具缓存命中率高达99.82%，2折稳定到手

DeepSeek V4新工具缓存命中率99.82%，长会话成本直降80%，2折玩转大模型。

原本4亿+token、61美元的账单，直降至12美元

还能更省新工具缓存命中率高达折稳定到手 deepseek v

16

💰 商业科技 IT 之家 2026-05-25

Take-Two CEO 泽尔尼克：AI 未能降低游戏制作成本，反而会推高成本

游戏巨头Take-Two CEO直言：AI非但不能降低游戏制作成本，反而因创作诉求拓宽推高投入，揭示行业技术应用的现实规律。

IT之家 5 月 25 日消息，游戏巨头 Take-Two Interactive 公司首席执行官施特劳斯 · 泽尔尼克近期接受 CNBC 采访时表示，人工智能并未降低游戏制作开支，未来也难以实现这一效果。相反，为满足玩家需求，人工智能反而会推高研发成本。泽尔尼克称，“娱乐产业的技术应用规律向来如…

泽尔尼克未能降低游戏制作成本反而会推高成 take-two

17

🤖 AI·大模型 arXiv 机器学习 2026-05-21

OlmoEarth v1.1: A more efficient family of OlmoEarth models

OlmoEarth v1.1在训练和推理上分别节省1.7倍GPU时间和2.9倍MACs，效率大幅提升。

arXiv:2605.20804v1 Announce Type: cross Abstract: We present a set of improvements to the OlmoEarth family. These improvements allow us to cut compute…

olmoearth 模型效率计算成本降低推理优化大模型

18

🤖 AI·大模型 NVIDIA 官方博客 2026-05-20

OpenAI’s New GPT-5.5 Powers Codex on NVIDIA Infrastructure — and NVIDIA Is Already Putting It to Work

GPT-5.5 驱动 Codex 在 NVIDIA 基础设施上运行，上万员工实测效率飙升，成本直降 35 倍

AI agents have revolutionized developer workflows, and their next frontier is knowledge work: processing information, solving complex problems, coming…

gpt-5.5 codex nvidia ai agents gb200 nvl7

19

💰 商业科技 IT 之家 2026-05-19

国轩高科拟量产硫化锂及固态电解质，目标推动固态电池成本降至 1 元 / Wh

聚焦固态电池核心材料量产计划，目标成本降至1元/Wh，关键突破点在于硫化锂成本控制。

IT之家 5 月 17 日消息，据界面新闻今日报道，在 5 月 17 日举办的国轩高科科技大会上，国轩高科宣布，为解决固态电池价格高难题，计划实现固态电池关键材料的量产。据国轩高科高级总监潘瑞军介绍，硫化物固态电池成本的 70%-80% 来自硫化物电解质，而硫化物电解质成本的 70%-80% …

固态电池硫化锂固态电解质成本降低国轩高科

🐂 牛哥精选