AGZO: Activation-Guided Zeroth-Order Optimization for LLM Fine-Tuning
创新激活指导的零阶优化方法,大幅提升大模型微调效率。
arXiv:2601.17261v4 Announce Type: replace Abstract: Zeroth-Order (ZO) optimization has emerged as a promising solution for fine-tuning LLMs under stri…
创新激活指导的零阶优化方法,大幅提升大模型微调效率。
arXiv:2601.17261v4 Announce Type: replace Abstract: Zeroth-Order (ZO) optimization has emerged as a promising solution for fine-tuning LLMs under stri…
颠覆认知?弱教师模型也能有效蒸馏LLM,预训练阶段教师强度并非关键。
arXiv:2605.23857v1 Announce Type: new Abstract: Knowledge distillation generally assumes a strong-to-weak relationship where stronger teachers yield b…
最新一期热门工具排行榜,汇集剪贴板同步、查词、桌面启动器等10余款实用工具,开源免费居多。
最近10日,来自小众软件论坛的发现频道的热门排行榜,由系统自动生成,直接列出来: 序号 主题 1️⃣ Moeli 阅读:轻量易用的漫画小说阅读器 2️⃣ 一个剪贴板实时同步工具 | 五端支持 | P2P | 跨网络 | UniClipboard 3️⃣ 【开源…
程序员日常AI工具堆栈公开,从LLM到代码审查,一份实用参考清单。
Which AI tools benefiting you most in day-day work? Which tool you stopped using? Let's share so that we can each learn from other experience and use …
从awk到cut,50个必备Linux命令详解,DevOps工程师日常工作的效率加速器。
If you're working in DevOps, Linux is not optional—it's your daily workspace. Whether you're troubleshooting production issues, deploying applications…
全息3D打印技术重大突破:仅需150毫瓦激光2分钟打印人耳模型,效率提升70倍。
IT之家 5 月 25 日消息,瑞士洛桑联邦理工学院(EPFL)的一支研究团队实现了新型全息 3D 打印技术突破,论文于 5 月 19 日发表于 《Light: Science & Applications》。 该团队首次将一种名为相位光调制器的新型 MEMS 器件引入体积打印系统, 成功将…
用极简计算机或专注模式,帮你摆脱干扰实现无分心编程,提升工作效率。
With the age of AI agents giving everyone a heightened sense of speed in shipping code, it is valuable for engineers to focus deeply on technical work…
全国首个开源鸿蒙机器人操作系统,兼容ROS1/ROS2等主流中间件,应用迁移成本直降80%,加速机器人开发。
IT之家 5 月 24 日消息,深开鸿官方昨日宣布,在开源鸿蒙智能物联网生态大会上, 深开鸿发布了全国首个基于开源鸿蒙打造的机器人操作系统 —— M-Robots OS 2.0 版本 。 据介绍,M-Robots OS 是以开源鸿蒙为核心底座的分布式异构多机协同机器人统一操作系统,具备多机实时协同、…
3秒扫描任何代码库,验证AI构建结果,开源神器助你掌控项目全貌
Article URL: https://github.com/anatomia-dev/anatomia Comments URL: https://news.ycombinator.com/item?id=48253446 Points: 2 # Comments: 0
GitHub开源项目,让LLM应用拥有长期记忆,同时将输入token平均削减68%,大幅降低API成本。
Article URL: https://github.com/Tem-Degu/streetai-memory Comments URL: https://news.ycombinator.com/item?id=48249509 Points: 1 # Comments: 0
一键整理代码库,让 Claude 和 ChatGPT 秒懂你的项目结构!
Turn codebases into a clean file for Claude and ChatGPT Discussion | Link
企业强推AI提效反遭打脸:月耗近900万元词元成本,效果仅10倍投入换2倍产出
IT之家 5 月 24 日消息,众多科技企业督促员工使用人工智能工具提升工作效率,但这项举措已然开始产生反效果。据 The Verge 报道,微软要求员工改用自家的 Copilot CLI,而非 Claude Code 工具,原因是企业倾向采用内部自研工具,而非第三方产品。不过有消息人士透露,核心缘…
突破传统统一学习率,重尾分布指导LLM逐层自适应学习,大幅提升训练效率与模型性能。
arXiv:2605.22297v1 Announce Type: cross Abstract: Learning rate configuration is a fundamental aspect of modern deep learning. The prevailing practice…
Codex周活破400万,官方使用指南来了:大神教你用Command键一键切换线程,还能自动监控Slack审阅。
13k星开源库作者解锁Codex-maxxing!
新框架SkillWeave通过模块化技能包让大模型高效专业化,成本低、兼容多领域
arXiv:2605.22205v1 Announce Type: new Abstract: Large language models increasingly require specialization across diverse domains, yet existing approac…
AI代码助手,基于上下文智能补全代码,支持多种语言,提升编程效率,但需开发者保持思考。
IT之家 5 月 23 日消息,在 Linux 基金会北美开源峰会上, Linus Torvalds 直言,AI 已开始改变 Linux 内核开发节奏。 Torvalds 指出自 Git 确立发布流程以来, 内核发布长期稳定了约 20 年,但过去 6 个月开始出现明显变化。 IT之家援引博文介绍,T…
算力成本反超人力薪酬,企业“AI替代员工”的经济账可能算错了。
IT之家 5 月 23 日消息,据《财富》杂志 22 日报道,越来越多企业正在要求员工“尽可能多用 AI”,希望借此提升效率、压缩成本。但现实情况开始显示,大规模 AI 化本身也正在 带来新的成本压力 。 微软最近已经开始取消大部分员工对 Claude Code 的直接授权,并转向推广自家的第一方 …
多仓库编程时用Claude Code保持上下文,避免重复解释代码库信息,提升效率。
Originally published at claudeguide.io/claude-code-workflow-multi-repo Running Claude Code across multiple repos without losing context If you work on…
按能力和用例查找AI模型,非技术用户也能轻松找到合适的LLM,告别枯燥的技术列表
As an Enterprise Architect I work with Capabilities, Use Cases and Value Maps amongst other things. Hugging Face is a great resource for tracking down…
AI一键生成客服工单草稿,支持邮件、Discord等多渠道,集成Stripe/Shopify,1秒审批。
Letterbook ( https://letterbook.ai ) helps growing companies manage and solve customer support tickets across email, app, Discord, and website forms. …