牛哥精选 · 所有

📋 全部 🤖 AI·大模型 ⚡ 效率工具 📝 深度技术 🚀 产品观察 💰 商业科技 🔓 开源项目 🎨 设计创意 📖 阅读推荐 🏷 资源合集 🌱 成长效率

📝 深度技术 arXiv AI 2026-06-02

TRACE: Trajectory Risk-Aware Compression for Long-Horizon Agent Safety

新方法TRACE通过风险感知压缩轨迹，提升长时域智能体运行安全性。

arXiv:2606.00611v1 Announce Type: new Abstract: Long-horizon LLM agents produce safety evidence across long trajectories, where sparse, delayed, and c…

轨迹压缩风险感知智能体安全长时间规划 arxiv论文

📝 深度技术 arXiv 机器学习 2026-05-19

Pessimistic Risk-Aware Policy Learning in Contextual Bandits

离线数据下的风险感知策略学习新框架，用悲观原则优化高风险场景的决策效果

arXiv:2605.15620v1 Announce Type: cross Abstract: We study risk-aware offline policy learning, aiming to learn a decision rule from logged data that i…

离线策略学习风险感知上下文赌博机悲观原则机器学习

📅 日期

2026-05-20 2026-05-19

🐂 牛哥精选

TRACE: Trajectory Risk-Aware Compression for Long-Horizon Agent Safety

Pessimistic Risk-Aware Policy Learning in Contextual Bandits

📅 日期