谷歌推出 DiffusionGemma 文本扩散模型:本地 AI 推理速度提升 4 倍
基于文本扩散的开放AI模型,本地推理速度提升4倍,高效处理文本生成任务
IT之家 6 月 11 日消息,谷歌今天(6 月 11 日)发布公告,宣布推出 DiffusionGemma,是基于文本扩散机制的开放 AI 模型, 相比较自回归模型在本地推理速度上提升了 4 倍。 IT之家注:自回归模型(Autoregressive Model)是当前主流的大语言模型架构(如 G…
基于文本扩散的开放AI模型,本地推理速度提升4倍,高效处理文本生成任务
IT之家 6 月 11 日消息,谷歌今天(6 月 11 日)发布公告,宣布推出 DiffusionGemma,是基于文本扩散机制的开放 AI 模型, 相比较自回归模型在本地推理速度上提升了 4 倍。 IT之家注:自回归模型(Autoregressive Model)是当前主流的大语言模型架构(如 G…
一种实用的一次性剪枝方法,同时支持稀疏与密集GEMM运算,显著降低LLM推理成本。
arXiv:2606.10445v1 Announce Type: new Abstract: Semi-structured 2:4 sparsity is widely supported by modern accelerators, providing up to a 2x theoreti…
本地运行Gemma4实现人-LLM-Web交互,Bonsai项目让AI操作浏览器门槛大降
Article URL: https://drive.google.com/drive/folders/1QsdOvsBKIavXDhwikouzQMOc8H_94bQd Comments URL: https://news.ycombinator.com/item?id=48461245 Poin…
从Qwen换到Gemma 4 E4B:本地大模型的新选择,性能与易用性如何?
Article URL: https://digg.com/ai/bfr4bqhh Comments URL: https://news.ycombinator.com/item?id=48437537 Points: 2 # Comments: 0
专为Apple Metal优化的GEMM内核生成器开源发布,支持自定义tile、warp、数据类型与激活函数,加速Metal计算性能。
Released mCemm a GEMM (General Matrix Multiply) kernel generator for Apple Metal which generates optimized Metal shaders with configurable tile sizes,…
Google 最新多模态模型 Gemma 4 12B 无需编码器即可本地运行,开源灵活且高效。
Run multimodal AI locally with an encoder-free architecture Discussion | Link
谷歌推出Coral Board单板计算机,1 TOPS算力即可本地运行Gemma 3模型,专为边缘AI场景设计。
IT之家 5 月 29 日消息,在 2026 年 I/O 开发者大会期间,谷歌推出 Coral Board, 是可以本地运行 Gemma 3 模型的小型单板计算机。 Coral Board 最大的亮点,在于搭载 Coral NPU,该机器学习单元由 Google Research 研发,基于 RIS…
揭秘长上下文推理的内存陷阱:即便模型量化后塞入显存,注意力KV缓存也可能比模型本身更吃内存。
A raw, developer-first look at Google’s new open-weight Gemma 4 family—featuring a hands-on local Python setup, a comparison of the 2B, 9B, and 31B va…
非程序员教师利用Gemma 4打造全离线Android App,将混乱语音自动转为整洁文字,专为ADD人群设计。
This is a submission for the Gemma 4 Challenge: Build with Gemma 4 What I Built I'm Mark. I'm a middle-school teacher, and I'm not a coder. A few time…