牛哥精选 · 半年

📋 全部 🤖 AI·大模型 ⚡ 效率工具 📝 深度技术 🚀 产品观察 💰 商业科技 🔓 开源项目 🎨 设计创意 📖 阅读推荐 🏷 资源合集 🌱 成长效率

📝 深度技术 arXiv 机器学习 2026-06-24

EnerInfer: Energy-Aware On-Device LLM Inference

端侧大模型推理的能耗难题有了新解法，EnerInfer提出能源感知优化框架，兼顾性能与功耗，适合部署在手机等边缘设备。

arXiv:2606.23001v1 Announce Type: cross Abstract: On-device LLM inference is increasingly attractive for privacy-preserving, reliable, and cost-effect…

能源感知端侧推理大模型优化 llm 能耗优化

📝 深度技术 Hacker News LLM 2026-06-11

Tweaking GPU Clock Frequency Cuts LLM Training Energy

调整GPU时钟频率，可在不影响性能前提下节省LLM训练能耗高达14%。

Article URL: https://spectrum.ieee.org/llm-training-energy-saving-trick Comments URL: https://news.ycombinator.com/item?id=48478848 Points: 3 # Commen…

gpu 时钟频率 llm训练能耗优化性能优化

🤖 AI·大模型 IT 之家 2026-06-06

联合国大学报告：精简 AI 指令中“谢谢”等礼貌用语，可让 ChatGPT 能耗降低 25%

联合国大学研究显示，删除ChatGPT提示中的“请”“谢谢”等客气话，每年可节省近100吉瓦时电能，相当于非洲76万人全年用电量。

IT之家 6 月 6 日消息，据中国科学报昨日报道，联合国大学水、环境与健康研究所（UNU-INWEH）近日发布的一份报告显示，精简提示中的礼貌用语，可让 ChatGPT 能耗降低 25% 。报告测算，删掉指令中“请”“谢谢”等不必要的礼貌用语，每年可节约 87 至 98 吉瓦时的电能。这相…

联合国大学报精简指令中谢谢等礼貌用语

📝 深度技术 arXiv AI 2026-05-22

PALS: Power-Aware LLM Serving for Mixture-of-Experts Models

MoE模型功耗优化新方案，将GPU功率从静态约束变为可控资源，提升能效

arXiv:2605.21427v1 Announce Type: new Abstract: Large language model (LLM) inference has become a dominant workload in modern data centers, driving si…

moe llm推理能耗优化 gpu 数据中心

📅 日期

2026-05-20 2026-05-19

🐂 牛哥精选

EnerInfer: Energy-Aware On-Device LLM Inference

Tweaking GPU Clock Frequency Cuts LLM Training Energy

联合国大学报告：精简 AI 指令中“谢谢”等礼貌用语，可让 ChatGPT 能耗降低 25%

PALS: Power-Aware LLM Serving for Mixture-of-Experts Models

📅 日期