牛哥精选 · 半年

📋 全部 🤖 AI·大模型 ⚡ 效率工具 📝 深度技术 🚀 产品观察 💰 商业科技 🔓 开源项目 🎨 设计创意 📖 阅读推荐 🏷 资源合集 🌱 成长效率

🤖 AI·大模型 Dev.to 2026-05-25

Gemma 4: The 128K Multimodal Powerhouse in Your Terminal

揭秘长上下文推理的内存陷阱：即便模型量化后塞入显存，注意力KV缓存也可能比模型本身更吃内存。

A raw, developer-first look at Google’s new open-weight Gemma 4 family—featuring a hands-on local Python setup, a comparison of the 2B, 9B, and 31B va…

gemma 4 128k上下文多模态终端运行 kv缓存

📅 日期

2026-05-20 2026-05-19

🐂 牛哥精选

Gemma 4: The 128K Multimodal Powerhouse in Your Terminal

📅 日期