AGZO: Activation-Guided Zeroth-Order Optimization for LLM Fine-Tuning
创新激活指导的零阶优化方法,大幅提升大模型微调效率。
arXiv:2601.17261v4 Announce Type: replace Abstract: Zeroth-Order (ZO) optimization has emerged as a promising solution for fine-tuning LLMs under stri…
创新激活指导的零阶优化方法,大幅提升大模型微调效率。
arXiv:2601.17261v4 Announce Type: replace Abstract: Zeroth-Order (ZO) optimization has emerged as a promising solution for fine-tuning LLMs under stri…
单GPU实现凸优化方法,高效解决LLM偏好对齐难题,降低RLHF计算成本。
arXiv:2605.23244v1 Announce Type: new Abstract: Fine-tuning large language models (LLMs) to align with human preferences has driven the success of sys…
揭秘长上下文推理的内存陷阱:即便模型量化后塞入显存,注意力KV缓存也可能比模型本身更吃内存。
A raw, developer-first look at Google’s new open-weight Gemma 4 family—featuring a hands-on local Python setup, a comparison of the 2B, 9B, and 31B va…
面向存内计算架构的数据中心编译方法,从数据流角度优化机器学习内核,突破内存墙瓶颈。
arXiv:2511.15503v2 Announce Type: replace-cross Abstract: High-performance Host processors can integrate Processing-In-Memory (PIM) devices, which can…
Muon优化器新突破,基于重尾谱校正解决噪声方向过量问题,助力大模型高效训练
arXiv:2603.10067v2 Announce Type: replace-cross Abstract: Muon has recently shown promising results in LLM training. In this work, we study how to fur…
针对长时LLM Agent的上下文溢出问题,提出并行压缩方法,减少数十秒推理阻塞。
arXiv:2605.23296v1 Announce Type: new Abstract: Long-horizon LLM agents accumulate growing conversation histories that eventually exceed the model's c…
上传或粘贴文本后一键检测和消除“AI味”,支持自定义禁用句式与高频词,让你的写作回归真人风格。
图源:公众号「有三思 U Sense」 做个测试。读一下这段话: “熊猫是最可爱的动物,它最爱吃竹子,样子最憨态可掬,是世界上最珍贵的宝藏。” 如果你笑了,或者皱了眉,很明显,你的 “鉴AI雷达” 已经觉醒。 近期把网友笑到打鸣的“豆包体”里,“最”是高频词汇。大…
DeepSeek V4新工具缓存命中率99.82%,长会话成本直降80%,2折玩转大模型。
原本4亿+token、61美元的账单,直降至12美元
苹果watchOS 27将专注于稳定性与优化,并深度融合AI提升交互体验,同时iOS 27因欧盟法规将开放第三方投屏协议。
IT之家 5 月 24 日消息,今日,彭博社马克 · 古尔曼在最新一期 Power On 节目中提到,苹果 watchOS 27 更新将主要关注稳定性、较小优化, 而不是引入重大新功能 。尽管如此,心率追踪的改进即将到来。 IT之家注意到,苹果定于 6 月 9 日举办 2026 年全球开发者大会(W…
《黑旗》重制版不止画面升级,结局将有大改动,育碧暗示新增终章「没有黄金的世界」
IT之家 5 月 25 日消息,据游戏媒体 Gamerant 前天报道,《刺客信条:黑旗记忆重置》将有与原版不同的结局,虽然游戏整体将保留原作的大部分核心剧情,但会对结局部分进行调整和扩展。 IT之家从原报道获悉, 育碧此前强调《刺客信条:黑旗记忆重置》并非“一比一复刻” ,而是基于原作进行现代化升…
当别人抱怨AI配额不够用时,这位开发者只用了30%,快来学习怎么高效用AI或换个思路。
I only use it for my ruby on rails app, I wonder why u all keep complaining about opus token usage, is it just means that I use AI/LLM wrong, any tips…
在小型芯片上部署AI模型,Edge Impulse让你从云端到边缘一步到位,专为低功耗设备优化。
Article URL: https://www.easelinktech.com/why-every-electronic-product-may-need-to-be-rebuilt-for-on-device-ai-the-chip-layer-will-decide-the-next-har…
GitHub开源项目,让LLM应用拥有长期记忆,同时将输入token平均削减68%,大幅降低API成本。
Article URL: https://github.com/Tem-Degu/streetai-memory Comments URL: https://news.ycombinator.com/item?id=48249509 Points: 1 # Comments: 0
提出极简优化器设计,大幅降低大模型预训练内存占用,已被ICML 2026接收。
arXiv:2506.16659v3 Announce Type: replace-cross Abstract: Training large language models (LLMs) relies on adaptive optimizers such as Adam, which intr…
Claude是Anthropic推出的AI助手,擅长长文撰写与精准传播,助你高效产出专业内容,打响品牌声量
IT之家 5 月 23 日消息,科技媒体 Business Insider 昨日(5 月 22 日)发布博文,报道称 Anthropic 正在扩招高薪写作岗位,从而强化品牌叙事和市场沟通, 尤其重视把复杂产品能力转化为清晰、具体且有吸引力的表达。 根据官方招聘信息显示,Anthropic 正在招募一…
将Agent工作流编译进LLM权重,以极低成本实现接近前沿的质量,提出了一种颠覆性的模型优化路径。
arXiv:2605.22502v1 Announce Type: new Abstract: Agent orchestration frameworks have proliferated, collectively exceeding 290,000 GitHub stars across L…
突破传统统一学习率,重尾分布指导LLM逐层自适应学习,大幅提升训练效率与模型性能。
arXiv:2605.22297v1 Announce Type: cross Abstract: Learning rate configuration is a fundamental aspect of modern deep learning. The prevailing practice…
GRPO新变体F-TIS:通过多模型协作提升LLM后训练奖励信号多样性,突破单一策略局限。
arXiv:2605.22537v1 Announce Type: new Abstract: Reinforcement learning methods such as GRPO have seen great popularity in LLM post-training. In GRPO, …
提出自进化元认知策略优化方法,让LLM红队测试更智能高效地发现安全漏洞。
arXiv:2605.10067v3 Announce Type: replace-cross Abstract: Red teaming is critical for uncovering vulnerabilities in Large Language Models (LLMs). Whil…
Pynear 2.3 发布,带来快速余弦索引与高召回近似搜索,性能甚至超越 Faiss,值得 Python 开发者一试。
• cosine indices (exact + approximate) • drop-in for scikit-learn (metric='cosine') • Incredibly fast approximate IndexBinaryMultiHash with high recal…