🤖 AI 日报 · 2026-03-25

每日精选全球 AI 最新动态,覆盖研究论文、产品发布、行业资讯与社区热议。


📰 今日头条

  1. OpenAI 关闭 Sora 视频社交应用 — OpenAI 正式下线 Sora 独立 App,迪士尼随即终止与 OpenAI 的合作协议。Sora 底层视频生成模型(Sora 2)技术实力仍被认可,但"纯 AI 社交信息流"的产品形态缺乏可持续用户需求。(TechCrunch)

  2. Anthropic 为 Claude Code 新增 Auto 模式 — 新 Auto 模式允许 Claude Code 以更少的人工确认执行任务,体现 AI 编程工具向高度自主化演进的行业趋势。Anthropic 同步强调内置安全护栏的重要性。(TechCrunch)

  3. GPT-5.4 Pro 解决前沿数学开放问题(Epoch 确认) — Epoch AI 研究机构证实 GPT-5.4 Pro 成功解决了一个此前无解的数学开放难题,热度 399,引发数学界与 AI 界广泛讨论。(HN)

  4. LiteLLM v1.82.8 供应链攻击——凭证窃取器 — Simon Willison 披露:LiteLLM v1.82.8(及 1.82.7)发布到 PyPI 的包内含 base64 编码的凭证窃取恶意代码,仅安装即可触发,无需 import。强烈建议锁定版本并立即检查。(Simon Willison)

  5. 包管理器需要"冷静期" — Simon Willison 呼吁在 LiteLLM 供应链攻击后推广"依赖冷静期"(dependency cooldown)实践:新版本发布后等待数天再安装,给社区时间发现恶意代码。(Simon Willison)


🔥 重大发布

  1. OpenAI 基金会宣布 $10 亿投资计划 — OpenAI 基金会宣布将向医疗疾病攻克、经济机会拓展、AI 韧性建设和社区项目投入至少 10 亿美元。(OpenAI Blog)

  2. ChatGPT 上线 Agentic Commerce Protocol 购物功能 — ChatGPT 推出视觉沉浸式购物体验,支持产品发现、商品对比和商家接入,基于新 Agentic Commerce Protocol 协议。OpenAI 同时宣布放弃此前的 Instant Checkout 功能。(OpenAI Blog)

  3. OpenAI 开源青少年安全工具 gpt-oss-safeguard — OpenAI 向开发者开放基于 Prompt 的青少年安全策略工具,帮助第三方 AI 应用快速落实年龄分段内容审核,无需从零搭建。(OpenAI Blog)

  4. Google TV 接入 Gemini:运动资讯、深度探索、视觉问答 — 三项 Gemini 功能正式登陆 Google TV,包括体育实时资讯简报、深度主题探索和视觉问答,进一步将 LLM 整合到客厅场景。(TechCrunch)

  5. Databricks 收购两家安全初创公司 — Databricks 趁 50 亿美元融资"弹药充足",收购 Antimatter 和 SiftD.ai,为新 AI 安全产品线奠基。(TechCrunch)

  6. Mirage(Captions AI)完成 $7500 万融资 — AI 视频编辑应用 Captions 的母公司 Mirage 从 General Catalyst CVF 获得 7500 万美元增长融资,持续押注 AI 视频模型研发。(TechCrunch)


🔬 研究论文

  1. OpenResearcher:全开放深度研究轨迹合成流水线 — 提出可复现的研究 Agent 训练流水线,离线执行搜索-浏览循环,解耦语料自举与多轮轨迹合成。⭐热度 50。(HF)

  2. Look Where It Matters(AwaRes):VLM 高分辨率裁剪检索 — AwaRes 以低分辨率全局视图识别关键区域,按需检索高分辨率局部裁剪,在效率-精度之间取得新平衡。热度 56。(HF)

  3. GLD:几何潜空间扩散用于多视图生成 — 提出将几何基础模型的特征空间复用为多视图扩散的潜空间,解决视图一致性生成问题。热度 19。(HF)

  4. RoboAlign:视觉-语言-动作模型的测试时推理 — 通过测试时推理改善具身 Agent 的语言-动作对齐,避免 VQA 监督导致的 VLA 性能不稳定问题。热度 21。(HF)

  5. SpatialBoost:语言引导的 3D 空间感知增强 — 为预训练视觉编码器注入 3D 空间关系理解能力,通过可扩展框架解决 2D 视觉模型在空间推理上的局限。热度 38。(HF)

  6. BubbleRAG:黑盒知识图谱的证据驱动 RAG — 针对模式和结构未知的黑盒知识图谱,解决语义实例化不确定性和结构路径不确定性导致的召回/精度损失。热度 18。(HF)

  7. 长时序 Tool-Using Agent 的 RL 完整训练方案 — 以 TravelPlanner 为测试床,系统研究 RL 训练 5 个设计维度:奖励塑形、模型规模、数据组成、算法与课程设置。热度 2。(HF)

  8. REVERE:用于科学工作流的自反进化研究工程师 — 解决现有 Prompt 优化方法局部信号依赖、跨任务泛化差的问题,在异构仓库和弱反馈环境下复现科学代码实验。热度 11。(HF)

  9. F4Splat:前向预测致密化 3D 高斯泼溅 — 提出自适应高斯分配机制,解决前向 3DGS 方法中高斯数量固定导致冗余问题,单次推理实时渲染。热度 30。(HF)

  10. Adaptive LoRA 秩分配用于个性化图像生成 — 提出为 LoRA 各层自适应选择最优秩,取代固定秩策略,在保持内存效率的同时提升个性化图像生成质量。热度 2。(HF)


💰 行业商业

  1. OpenAI 放弃 ChatGPT 内嵌购物结账(Instant Checkout) — OpenAI 宣布停用曾对标 Amazon 的直接购买功能,转向基于 Agentic Commerce Protocol 的展示型商品发现,承认产品方向需调整。(TechCrunch)

  2. Doss 完成 $5500 万 B 轮:AI 驱动库存管理接入 ERP — 由 Madrona 和 Premji Invest 共同领投,Doss 的 AI 库存管理系统深度集成企业现有 ERP 系统,面向中大型零售和制造业。(TechCrunch)

  3. 迪士尼退出 OpenAI 合作 — 随着 Sora 应用关闭,迪士尼终止与 OpenAI 的合作协议,媒体娱乐巨头与 AI 内容生成平台的关系趋于审慎。(HN)

  4. 多模态 AI 自动化复杂金融工作流 — 金融机构正积极采用多模态 AI 框架自动处理复杂文档(多栏布局、图片、嵌套数据集),替代传统 OCR 工具。(AI News)

  5. Spotify 测试反 AI Slop 工具 — 新工具旨在阻止 AI 生成音频被错误归属到真人艺术家名下,赋予艺术家对关联曲目更强的控制权。(TechCrunch)

  6. Hark:前苹果设计师打造全新 AI 交互界面 — Hark 采用"模型+硬件+界面三位一体"的设计理念,致力于打造无缝端到端个人智能产品,正吸引业内关注。(TechCrunch)

  7. Talat:AI 会议记录本地化方案 — 无订阅费用,所有处理在设备本地进行,不上传云端,定位 Granola 的隐私友好替代品。(TechCrunch)


🛠️ 工具应用

  1. RuFlo v3.5 ⭐25,065 — 面向 Claude 的领先 Agent 编排平台,支持多 Agent Swarm、自主工作流、RAG 集成与原生 Claude Code/Codex 集成。TypeScript。(GitHub)

  2. Hermes Agent(NousResearch) ⭐12,509 — "与你共同成长的 Agent",Nous Research 开源自主 Agent 框架,支持个性化任务规划与执行。Python。(GitHub)

  3. awesome-claude-code ⭐31,812 — Claude Code 生态精选列表,包含 Skills、Hooks、Slash Commands、Agent 编排器、插件等,生态爆发持续加速。(GitHub)

  4. Supermemory ⭐18,515 — AI 时代的高性能记忆引擎,极速、可扩展的 Memory API,支持个性化上下文持久化。TypeScript。(GitHub)

  5. TradingAgents ⭐40,815 — 多 Agent LLM 量化金融交易框架,实现多角色分工协作的智能投资决策。Python。(GitHub)

  6. Project N.O.M.A.D. ⭐15,279 — 自包含、完全离线的 AI 生存计算机,集成关键工具、知识库和 AI 推理能力,无网络环境可用。TypeScript。(GitHub)

  7. Gemini 原生视频嵌入 + 毫秒级视频搜索(Show HN) — 利用 Gemini 新增的视频向量化能力构建亚秒视频搜索应用,首批实用落地案例之一。(HN)


🌍 政策伦理

  1. AI 量子安全:迁移与硬件数据隔离 — 研究显示组织将安全风险列为 AI 采用的首要障碍;量子韧性要求企业提前部署加密迁移路径和硬件保护数据飞地。(AI News)

  2. WSJ 科技专栏作家:将 AI 全面托管电脑将贻笑大方 — Christopher Mims 发文称"给 AI 完全控制我的电脑因此也是我整个生活"的做法,未来会被视为像持有无聊猿 NFT 一样愚蠢,引发 Simon Willison 转发讨论。(Simon Willison)

  3. OpenAI 面向青少年安全的开源工具发布 — 开发者可直接使用 OpenAI 定义的年龄段内容审核策略,推动 AI 产品在未成年人保护方面建立行业基准。(OpenAI Blog)


🔥 社区热议


📊 趋势洞察