牛哥精选 · 所有

1

📝 深度技术 arXiv 机器学习 2026-06-24

EnerInfer: Energy-Aware On-Device LLM Inference

端侧大模型推理的能耗难题有了新解法，EnerInfer提出能源感知优化框架，兼顾性能与功耗，适合部署在手机等边缘设备。

arXiv:2606.23001v1 Announce Type: cross Abstract: On-device LLM inference is increasingly attractive for privacy-preserving, reliable, and cost-effect…

能源感知端侧推理大模型优化 llm 能耗优化

2

📝 深度技术 arXiv AI 2026-06-23

The Language-Energy Divide: Measuring Energy Costs of Multilingual LLM Inference

首次系统量化不同语言在LLM推理中的能耗差异，揭示语言鸿沟对AI可持续性的影响

arXiv:2606.21869v1 Announce Type: cross Abstract: Large language models (LLMs) are increasingly deployed in multilingual settings, yet the energy cost…

能耗多语言大模型推理效率能源鸿沟 llm

3

📝 深度技术 Hacker News LLM 2026-06-11

Tweaking GPU Clock Frequency Cuts LLM Training Energy

调整GPU时钟频率，可在不影响性能前提下节省LLM训练能耗高达14%。

Article URL: https://spectrum.ieee.org/llm-training-energy-saving-trick Comments URL: https://news.ycombinator.com/item?id=48478848 Points: 3 # Commen…

gpu 时钟频率 llm训练能耗优化性能优化

4

💰 商业科技量子位 2026-06-09

内蒙跑通AI逆袭新解法

能源与算力破壁融合，内蒙古探路“AI+能源”新解法，破解数据中心天量耗电难题。

全行业的Token焦虑何解？

内蒙跑通逆袭新解法 ai能耗数据中心能源效率

5

🚀 产品观察 IT 之家 2026-06-07

IT早报 0607：字节跳动否认造车传闻；比亚迪腾势 Z 超跑“黑武士”实车曝光；减少礼貌用语可让 AI 能耗降低 25%；曝苹果 iOS 27 将改善 iPhone 17 等机型续航...

字节跳动紧急辟谣造车传闻，比亚迪腾势Z超跑“黑武士”曝光，AI省电新招：少说“谢谢”可降耗25%，苹果iOS 27或为iPhone 17续航加码——今日科技看点一网打尽。

“IT早报”时间，大家好，现在是 2026 年 6 月 7 日星期日，今天的重要科技资讯有： 1、字节跳动：没有造车或推出汽车品牌的计划，和赛豆没有股权合作字节跳动发布声明，明确否认有造车或推出“豆包汽车”品牌的计划，并澄清与“赛豆”无股权合作。公司强调其汽车业务核心是向行业伙伴提供豆包大模型、火…

早报字节跳动否认造车传闻比亚迪腾势超跑

6

🤖 AI·大模型 IT 之家 2026-06-06

联合国大学报告：精简 AI 指令中“谢谢”等礼貌用语，可让 ChatGPT 能耗降低 25%

联合国大学研究显示，删除ChatGPT提示中的“请”“谢谢”等客气话，每年可节省近100吉瓦时电能，相当于非洲76万人全年用电量。

IT之家 6 月 6 日消息，据中国科学报昨日报道，联合国大学水、环境与健康研究所（UNU-INWEH）近日发布的一份报告显示，精简提示中的礼貌用语，可让 ChatGPT 能耗降低 25% 。报告测算，删掉指令中“请”“谢谢”等不必要的礼貌用语，每年可节约 87 至 98 吉瓦时的电能。这相…

联合国大学报精简指令中谢谢等礼貌用语

7

💰 商业科技 IT 之家 2026-06-04

欧盟将出台数据中心最低能效标准，应对 AI 浪潮下的能耗激增

欧盟为应对AI带来数据中心能耗飙升，将出台最低能效标准，政策落地时间表明确，行业影响深远。

IT之家 6 月 4 日消息，据路透社报道，欧盟于当地时间周三宣布，鉴于数据中心耗电量快速攀升引发多方担忧，欧盟将出台数据中心最低能效标准。未来数年，欧盟数据中心装机容量预计将翻倍以上，从去年的 12 吉瓦增至 2030 年的 28 吉瓦，届时数据中心用电量在欧盟总耗电量中的占比将突破目前 2.5…

欧盟将出台数据中心最低能效标准应对浪潮下的能耗

8

📝 深度技术 arXiv AI 2026-05-22

PALS: Power-Aware LLM Serving for Mixture-of-Experts Models

MoE模型功耗优化新方案，将GPU功率从静态约束变为可控资源，提升能效

arXiv:2605.21427v1 Announce Type: new Abstract: Large language model (LLM) inference has become a dominant workload in modern data centers, driving si…

moe llm推理能耗优化 gpu 数据中心

9

🤖 AI·大模型 arXiv NLP 2026-05-20

Sustainability via LLM Right-sizing

评估11款专有模型，揭示何时小模型更优，兼顾可持续性与成本效益

arXiv:2504.13217v3 Announce Type: replace Abstract: Large language models (LLMs) have become increasingly embedded in organizational workflows. This h…

llm right- 能源效率成本控制数据主权模型选择

10

🚀 产品观察 Hacker News 最佳 2026-05-19

Apple Silicon costs more than OpenRouter

实测对比：本地M5 MacBook Pro运行LLM每百万token成本约$1.5，而OpenRouter同类模型价格仅1/3且速度翻倍，揭示本地推理的真实经济账。

Article URL: https://www.williamangel.net/blog/2026/05/17/offline-llm-energy-use.html Comments URL: https://news.ycombinator.com/item?id=48168198 Poin…

apple sili openrouter llm成本本地推理能耗

11

📝 深度技术 Hacker News AI 2026-05-19

The software fix that could shrink AI's energy bill without new hardware

无需新硬件，软件优化就能大幅降低AI能耗，绿色计算新思路来了。

Article URL: https://thenewstack.io/streaming-ai-energy-efficiency/ Comments URL: https://news.ycombinator.com/item?id=48161187 Points: 1 # Comments: …

ai能耗软件优化绿色计算效率提升

🐂 牛哥精选