牛哥精选 · 所有

1

🚀 产品观察 IT 之家 2026-07-15

OPPO 回应获端侧 AI 服务备案：后续目标实现更个性化的主动智能体验

OPPO旗下AndesGPT大模型完成端侧AI备案，未来将打造更个性化的主动智能体验。

IT之家 7 月 15 日消息，今日，网信办发布 7 款手机端侧生成式人工智能服务备案信息，包括 Apple、华为、OPPO 等端侧模型在列。据《科创板日报》报道，针对 OPPO AndesGPT 大模型完成端侧生成式人工智能服务备案，OPPO 方面回应《科创板日报》称：端侧 AI 是 OPPO …

回应获端侧服务备案后续目标实现更个性化的主动智能体验

2

💰 商业科技 36氪 2026-07-15

OPPO回应完成端侧AI备案：是适配监管要求的一项常规合规动作

OPPO完成端侧AI备案，回应称是适配监管的常规动作

7月15日，7款提供手机端侧生成式人工智能服务完成备案，其中华为、OPPO等品牌机型在列。对此，OPPO方面向记者回应，此次备案是OPPO主动适配国家人工智能大模型监管要求、依法合规推进相关业务的一项常规合规动作。（证券时报）

回应完成端侧备案是适配监管要求的一项常规合规动作

3

🚀 产品观察 IT 之家 2026-07-06

消息称某厂 Ultra 迭代旗舰机评估 200Mp 主摄、微云台结构，预计为 OPPO Find X10 Ultra

OPPO Find X10 Ultra 爆料：200MP 主摄+微云台，哈苏双2亿像素，影像旗舰再升级。

IT之家 7 月 6 日消息，博主 @数码闲聊站今日发布某厂 Ultra 迭代旗舰机超前瞻爆料，预计为 OPPO Find X10 Ultra。据其爆料，这款旗舰新机的影像除了主摄评估 200Mp 1/1.12" LOFIC Sensor，镜组同步评估微云台结构，光学防抖角度更大。在此之前…

消息称某厂迭代旗舰机评主摄微云台结构预计为

4

🚀 产品观察 IT 之家 2026-06-26

优必选发布轮式工业人形机器人 Cruzr Y1，在 OPPO 供应链技术展首秀

优必选轮式工业人形机器人Cruzr Y1首秀OPPO供应链展，开放SDK支持二次开发，瞄准工厂拆码垛场景。

IT之家 6 月 26 日消息，OPPO 技术发布会暨供应链技术展昨日举行，优必选旗下 Cruzr Y1 轮式工业人形机器人迎来首次公开亮相，展示料箱拆垛、码垛全流程。官方表示，这款机器人重点攻克各类料箱、纸箱、物料上下料和分拣等柔性作业难点，直击传统自动化设备物料轻微偏移即停机、换产调试周期漫长…

优必选发布轮式工业人形机器人供应链技术展首秀

5

📝 深度技术 Hacker News LLM 2026-06-21

Train LLM from Scratch

从零开始训练大模型，详解预训练、SFT与PPO全流程。

Article URL: https://FareedKhan-dev.github.io/train-llm-from-scratch/ Comments URL: https://news.ycombinator.com/item?id=48615416 Points: 2 # Comments…

llm 从头训练预训练 sft ppo

6

📝 文本处理 IT 之家 2026-06-16

消息称 OPPO ColorOS 17 支持全新凝光动效、光感描边等特性，有望 8 月前后开启 Beta 测试

快速获取OPPO ColorOS 17等最新科技资讯，IT之家一手爆料及时更新，帮你掌握数码动态。

IT之家 6 月 16 日消息，博主 @数码闲聊站发文，透露 OPPO ColorOS 17 将支持全新凝光动效、光感描边、质感模糊、圆角设计等特性。除此之外，该博主此前还透露 ColorOS 17 将于 8 月前后开启 Beta 内测。另参考IT之家先前报道，有消息称 OPPO 将效仿苹果 2…

消息称支持全新凝光动效光感描边等特有望

7

📝 深度技术 arXiv AI 2026-06-11

APPO: Agentic Procedural Policy Optimization

全新智能体策略优化方法APPO，推动强化学习前沿发展

arXiv:2606.12384v1 Announce Type: cross Abstract: Recent advances in agentic Reinforcement Learning (RL) have substantially improved the multi-turn to…

强化学习策略优化智能体 appo agentic po

8

🚀 产品观察 IT 之家 2026-06-05

飞牛 fnOS：ARM 设备飞牛相册更新，支持 OPPO / 一加设备互联

飞牛相册ARM版重大更新，新增OPPO/一加设备互联及智能分类功能，NAS与手机生态进一步打通。

IT之家 6 月 5 日消息，飞牛 fnOS 官方今日宣布，ARM 设备飞牛相册迎来重大更新，支持 OPPO / 一加设备互联（ X86 已支持）。据介绍，OPPO 与飞牛互联支持以下功能：无感发现：手机可以自动识别局域网飞牛设备，快速完成连接与初始化系统级入口：控制中心直达，飞牛设…

飞牛设备飞牛相册更新支持一加设备互联

9

🤖 AI·大模型 arXiv 机器学习 2026-06-02

S-SPPO: Semantic-Calibrated Self-Play Preference Optimization

ICML 2026收录，S-SPPO用语义校准提升自对弈偏好优化，为AI对齐训练提供新思路。

arXiv:2606.01561v1 Announce Type: cross Abstract: Aligning Large Language Models (LLMs) with human preferences is often formulated via Direct Preferen…

s-sppo 语义校准自对弈偏好优化 icml2026 大模型对齐

10

📝 深度技术 arXiv NLP 2026-06-02

StepPO: Step-Aligned Policy Optimization for Agentic Reinforcement Learning

提出Step-aligned策略优化方法，解决代理强化学习中的信用分配难题，实验验证显著提升性能。

arXiv:2604.18401v2 Announce Type: replace Abstract: Agentic reinforcement learning (RL) is emerging as a critical post-training paradigm for improving…

steppo 策略优化强化学习智能体信用分配

11

⚡ 效率工具 IT 之家 2026-06-02

腾讯客服：微信正与华为、荣耀、小米、OPPO、vivo 等合作，通过手机语音助理发起音视频通话或向指定好友发送消息

微信联手五大国产手机品牌，语音助理直接发起音视频通话，操作更便捷。

IT之家 6 月 2 日消息，据IT之家小伙伴今日反馈，腾讯客服最新回复显示，微信正在与华为、荣耀、小米、OPPO、vivo 等手机厂商合作推出 A2A 助手能力。用户可以通过手机语音助理发起微信音视频通话或向指定好友发送消息。该功能基于 A2A（Agent-to-Agent）协作机制，由厂…

腾讯客服微信正与华为荣耀小米等合作

12

🚀 产品观察 36氪 2026-05-29

科氪 | OPPO Reno16系列发布，“3D悬浮星球+实况随心贴”引领潮流手机新风向

OPPO Reno16系列携3D悬浮星球设计与实况随心贴登场，IP69K防水+铝合金中框，游戏体验再升级。

2026 年 5 月 25 日，OPPO 举办 “Reno Land 奇幻夜”新品发布会，重磅发布多款新品，全新一代 OPPO Reno16 系列潮流手机、OPPO Pad 6 全能平板、 OPPO Pad Air5 学习平板、OPPO Enco Air5s 真无线降噪耳机、OPPO Bubble潮…

科氪系列发布悬浮星球实况随心贴引领潮流手机

13

🚀 产品观察 IT 之家 2026-05-26

【IT之家开箱】OPPO Reno16 Pro 怦然星动图赏：3D 悬浮星球，辨识度拉满

独家3D冰透悬浮工艺，裸眼3D星球效果让手机颜值拉满，轻薄机身实测数据一并奉上。

5 月 25 日，OPPO 发布了 Reno 数字系列的新一代产品，OPPO Reno16 系列，新品定位于超好玩的实况神机，主打实况影像的品质和玩法。目前IT之家已经拿到了其中怦然星动版本的 OPPO Reno16 Pro，现在话不多说，先为大家送上开箱图赏，让我们一起看看这款手机的颜值如何。首…

之家开箱怦然星动图赏悬浮星球辨识度拉满 oppo reno1

14

📝 深度技术 arXiv NLP 2026-05-22

Value-Gradient Hypothesis of RL for LLMs

从价值梯度假说揭秘PPO和GRPO为何有效，为LLM后训练提供新理论框架。

arXiv:2605.21654v1 Announce Type: cross Abstract: Reinforcement learning substantially improves pretrained language models, but it remains understudie…

llm 强化学习 ppo grpo 价值梯度

15

🤖 AI·大模型 arXiv NLP 2026-05-20

Reinforcement Learning for LLM Post-Training: A Survey

一篇系统梳理LLM后训练中强化学习的综述，涵盖RLHF、DPO、RLVR等前沿方法

arXiv:2407.16216v4 Announce Type: replace Abstract: Large language models (LLMs) trained via pretraining and supervised fine-tuning (SFT) can still pr…

强化学习 llm 后训练 rlhf dpo

16

🤖 AI·大模型 arXiv 机器学习 2026-05-20

CheckSupport: A Local LLM-Powered Tool for Automated Manuscript Submission Checklist Selection and Completion

本地LLM驱动，自动完成学术手稿提交检查清单，提升投稿效率。

arXiv:2605.16377v1 Announce Type: cross Abstract: Transparent and standardized reporting is essential for reproducible scientific research, yet adhere…

checksuppo 本地llm 自动检查清单论文提交效率工具

17

📝 深度技术 arXiv 机器学习 2026-05-19

What Is Preference Optimization Doing, and Why?

揭示DPO与PPO本质差异，挑战“监督学习vs强化学习”传统认知的深度技术论文。

arXiv:2512.00778v2 Announce Type: replace Abstract: Preference optimization (PO) is indispensable for large language models (LLMs), with methods such …

偏好优化大语言模型 dpo ppo 机器学习

18

📝 深度技术 OpenAI 官方博客 2026-05-19

Proximal Policy Optimization

OpenAI发布新强化学习算法PPO，简单易调优且性能卓越，已成为默认算法。

We’re releasing a new class of reinforcement learning algorithms, Proximal Policy Optimization (PPO), which perform comparably or better than state-of…

强化学习 ppo openai 算法

19

🤖 AI·大模型 OpenAI 官方博客 2026-05-19

Learning Montezuma’s Revenge from a single demonstration

单个人类演示教会AI狂揽74,500分，刷新《蒙提祖马的复仇》最高分记录。

We’ve trained an agent to achieve a high score of 74,500 on Montezuma’s Revenge from a single human demonstration, better than any previously publishe…

montezuma' 强化学习 ppo openai 单样本学习

🐂 牛哥精选