牛哥精选 · 本月

📋 全部 🤖 AI·大模型 ⚡ 效率工具 📝 深度技术 🚀 产品观察 💰 商业科技 🔓 开源项目 🎨 设计创意 📖 阅读推荐 🏷 资源合集 🌱 成长效率

🤖 AI 工具 IT 之家 2026-06-11

谷歌推出 DiffusionGemma 文本扩散模型：本地 AI 推理速度提升 4 倍

基于文本扩散的开放AI模型，本地推理速度提升4倍，高效处理文本生成任务

IT之家 6 月 11 日消息，谷歌今天（6 月 11 日）发布公告，宣布推出 DiffusionGemma，是基于文本扩散机制的开放 AI 模型，相比较自回归模型在本地推理速度上提升了 4 倍。 IT之家注：自回归模型（Autoregressive Model）是当前主流的大语言模型架构（如 G…

谷歌推出文本扩散模型本地推理速度提升文本扩散

📝 深度技术 arXiv 机器学习 2026-06-10

SpenseGPT: Practical One-shot Pruning Enabling Sparse and Dense GEMMs for LLM Inference

一种实用的一次性剪枝方法，同时支持稀疏与密集GEMM运算，显著降低LLM推理成本。

arXiv:2606.10445v1 Announce Type: new Abstract: Semi-structured 2:4 sparsity is widely supported by modern accelerators, providing up to a 2x theoreti…

spensegpt 一次性剪枝 llm推理稀疏矩阵 gemm

🔓 开源项目 Hacker News LLM 2026-06-09

Bonsai: Human->LLM->Web with LLM interface using Gemma4 12B locally on Windows

本地运行Gemma4实现人-LLM-Web交互，Bonsai项目让AI操作浏览器门槛大降

Article URL: https://drive.google.com/drive/folders/1QsdOvsBKIavXDhwikouzQMOc8H_94bQd Comments URL: https://news.ycombinator.com/item?id=48461245 Poin…

bonsai llm接口 gemma4 本地运行 windows

🤖 AI·大模型 Hacker News LLM 2026-06-08

Gemma 4 E4B as a primary local LLM (replaced Qwen)

从Qwen换到Gemma 4 E4B：本地大模型的新选择，性能与易用性如何？

Article URL: https://digg.com/ai/bfr4bqhh Comments URL: https://news.ycombinator.com/item?id=48437537 Points: 2 # Comments: 0

gemma 4 本地llm qwen 模型对比本地部署

🔓 开源项目 Hacker News Ask 2026-06-06

MCemm a GEMM (General Matrix Multiply) Kernel Generato

专为Apple Metal优化的GEMM内核生成器开源发布，支持自定义tile、warp、数据类型与激活函数，加速Metal计算性能。

Released mCemm a GEMM (General Matrix Multiply) kernel generator for Apple Metal which generates optimized Metal shaders with configurable tile sizes,…

gemm apple meta 内核生成器 metal shad 矩阵乘法优化

🤖 AI·大模型 Product Hunt 2026-06-03

Google Gemma 4 12B

Google 最新多模态模型 Gemma 4 12B 无需编码器即可本地运行，开源灵活且高效。

Run multimodal AI locally with an encoder-free architecture Discussion | Link

google gem 12b 多模态ai 本地运行无编码器架构

🤖 AI·大模型 IT 之家 2026-05-29

谷歌推出 Coral Board 单板计算机：1 TOPS 算力，本地运行 Gemma 3 模型

谷歌推出Coral Board单板计算机，1 TOPS算力即可本地运行Gemma 3模型，专为边缘AI场景设计。

IT之家 5 月 29 日消息，在 2026 年 I/O 开发者大会期间，谷歌推出 Coral Board，是可以本地运行 Gemma 3 模型的小型单板计算机。 Coral Board 最大的亮点，在于搭载 Coral NPU，该机器学习单元由 Google Research 研发，基于 RIS…

谷歌推出单板计算机算力本地运行模型

🤖 AI·大模型 Dev.to 2026-05-25

Gemma 4: The 128K Multimodal Powerhouse in Your Terminal

揭秘长上下文推理的内存陷阱：即便模型量化后塞入显存，注意力KV缓存也可能比模型本身更吃内存。

A raw, developer-first look at Google’s new open-weight Gemma 4 family—featuring a hands-on local Python setup, a comparison of the 2B, 9B, and 31B va…

gemma 4 128k上下文多模态终端运行 kv缓存

🤖 AI·大模型 Dev.to 2026-05-19

Bidet AI — on-device Gemma 4 turns a messy brain-dump into clean writing

非程序员教师利用Gemma 4打造全离线Android App，将混乱语音自动转为整洁文字，专为ADD人群设计。

This is a submission for the Gemma 4 Challenge: Build with Gemma 4 What I Built I'm Mark. I'm a middle-school teacher, and I'm not a coder. A few time…

bidet ai gemma 4 离线ai android应用语音转写

📅 日期

2026-05-20 2026-05-19

🐂 牛哥精选

📅 日期