📅 2026-06-22 · 数据来源 AI HOT × Hermes Agent 自动采集加工 本文每日23:00自动更新,汇集今日AI行业最值得关注的动态。
⚡ 今日速览
- 微信Agent小微灰度内测:主入口发消息红包,子入口可读聊天记录
- Anthropic 工程负责人:Claude Code 让程序员更孤独
- PP-OCRv6 on Hugging Face:50 语言 OCR,参数规模 1.5M 至 34.5M
- 美团tabbit国际版免费接入GPT-5.5/Claude Opus 4.8等旗舰模型
- 腾讯元宝父亲节活动:上传照片生成与年轻爸爸的合影
- 开源教程《Deep Agents 实战》发布
- 微软双向转售GPT与DeepSeek成全球最大AI中间商
- NVIDIA Research 发布 SpatialClaw:免训练空间推理框架
🧠 大模型发布
PP-OCRv6 on Hugging Face:50 语言 OCR,参数规模 1.5M 至 34.5M
PP-OCRv6 是 PaddleOCR 最新一代通用 OCR 模型族,提供 tiny(1.5M)、small(7.7M)和 medium(34.5M)三级。medium 和 small 支持 50 种语言(简体/繁体中文、英文、日文及 46 种拉丁语系)。在官方多场景基准上,medium 检测 Hmean 86.2%,识别准确率 83.2%,较 PP-OCRv5_server 分别提升 +4.6…
来源: Hugging Face:Blog(RSS) 链接: https://huggingface.co/blog/PaddlePaddle/pp-ocrv6
🚀 AI产品发布
微信Agent小微灰度内测:主入口发消息红包,子入口可读聊天记录
微信Agent小微灰度内测已开始,主入口位于微信首页左上角,支持给好友发消息和红包(需确认),但无法读取聊天记录或向群聊发消息。群聊和私聊的”问小微”子入口则可读取聊天记录并支持群发。小微可创建日程提醒、待办、总结朋友圈,打通公众号和视频号进行问答。收藏仅可读取小微自建笔记。内置”小工具”功能,支持语音创建简易小程序(暂不可发布),还可调用第三方小程序。
来源: 公众号:数字生命卡兹克 链接: https://mp.weixin.qq.com/s/qVdfx01e9C9r5mGi0jh2BA
美团tabbit国际版免费接入GPT-5.5/Claude Opus 4.8等旗舰模型
美团近期上线tabbit国际版应用,免费集成多家顶级AI模型的最新旗舰版,包括GPT-5.5、Claude Opus 4.8、Gemini 3.5 Flash,以及国内Kimi-2.6、GLM-5.1、MiniMax-M3。用户无需单独订阅即可使用这些模型。需注意:只有国际版包含海外模型,国内版仅提供国内模型。该应用旨在抢占AI入口,目前处于免费推广阶段。
来源: X:阿易 AI Notes (@AYi_AInotes) 链接: https://x.com/AYi_AInotes/status/2068637890247016607
NVIDIA Research 发布 SpatialClaw:免训练空间推理框架
NVIDIA Research 发布 SpatialClaw,一个免训练的空间推理框架。它通过将代码作为动作接口,让智能体调用感知工具(Depth Anything 3、SAM 3)并自由组合输出,解决视觉语言模型在 3D 空间判断上的弱点。在 20 项基准测试中平均准确率达 59.9%,比近期智能体 SpaceTools 高 11.2 个百分点,比无工具基线高 6.5 点,比结构化工具调用高 3…
来源: MarkTechPost(RSS) 链接: https://www.marktechpost.com/2026/06/19/nvidia-ai-introduce-spatialclaw-a-training-free-agent-that-treats-code-as-the-action-interface-for-spatial-reasoning
Cloudflare 为 AI 智能体推出临时账户
Cloudflare 在 Workers 上推出临时账户(Temporary Accounts),允许 AI 智能体直接运行
wrangler deploy --temporary,在数秒内获取一个可用的实时 Worker,无需绕开面向人类设计的部署流程。该功能旨在降低智能体部署门槛。
来源: Cloudflare Blog 链接: https://blog.cloudflare.com/temporary-accounts
阿里开源向量数据库Zvec,UCSD黄碧薇教授提出因果AI第四代范式
阿里开源内部向量数据库Zvec,pip install zvec免费使用,对标Pinecone每月70美元能力。支持十亿向量毫秒级检索,无需单独起服务,全平台兼容;v0.5.0新增原生全文混合搜索。UCSD黄碧薇教授(causal-learn作者)提出AI四代范式:相关性小模型→因果小模型→相关性大模型(LLM)→因果大模型,认为当前正站在第四代门口。其创立的Aether AI完成首轮融资,致力于…
来源: X:阿易 AI Notes (@AYi_AInotes) 链接: https://x.com/AYi_AInotes/status/2067832098816250346
AI 员工 Viktor 登陆 Microsoft Teams,年化收入达 2000 万美元
AI 员工 Viktor 在 Slack 上实现 2000 万美元年化收入(无销售团队、未大规模推广),现已正式进驻 Microsoft Teams。Viktor 定位为零门槛 AI:用户无需学习、无需提示词,像 @同事 一样提及即可获得完整工作成果,甚至无需主动 @ 也能自动完成。产品面向 Teams 的 3.2 亿用户,助力企业内部运营和管理人员零学习成本使用 AI。即日起免费试用,含 100…
来源: X:Rohan Paul (@rohanpaul_ai) 链接: https://x.com/rohanpaul_ai/status/2067755504613613699
企业版新用量分析与更新的支出控制
OpenAI 为 ChatGPT Enterprise 推出信用额度用量分析与更新的支出控制功能。全局管理控制台(Global Admin Console)统一展示 ChatGPT 和 Codex 的信用消耗,支持按时间、用户、产品、模型追踪用量趋势。管理员可为整个工作区设置默认限额,按群组配置额度,并为个人设置叠加限制。员工可查看个人用量并申请增加额度(附工作上下文)。这些功能即日起可用。
来源: OpenAI:官网动态(RSS · 排除企业/客户案例) 链接: https://openai.com/index/chatgpt-enterprise-spend-controls
📊 行业动态
微软双向转售GPT与DeepSeek成全球最大AI中间商
彭博社报道,微软已成为全球最大AI模型中转站,既将ChatGPT卖给中国企业,也反向将DeepSeek模型卖给西方客户。报道称微软正在测试DeepSeek-R1和DeepSeek-V4,计划向西方客户提供这些中国模型。这一模式构建起跨中美AI模型的双向贸易网络。
来源: X:阿易 AI Notes (@AYi_AInotes) 链接: https://x.com/AYi_AInotes/status/2068218661710512231
Figure机器人数首超人类员工
我们已超越理论阶段。
有史以来第一次,Figure的机器人数量超过了人类员工数量。
来源: X:Rohan Paul (@rohanpaul_ai) 链接: https://x.com/rohanpaul_ai/status/2068089038213693800
JAWBONE Act:一项打击政府为压制合法网络言论而施压的新法案
上周,参议员Ted Cruz和Ron Wyden提出两党法案JAWBONE Act,为受政府胁迫的广播商、互动计算机服务商及AI提供商创建针对政府官员的联邦诉讼权,并建立政府与中间方就用户表达问题沟通的透明度体系。法案旨在应对政府施压私营公司审查受第一修正案保护的言论。EFF支持该法案,并举证:2025年6月联邦高官威胁起诉ICEBlock创建者,同年10月司法部长要求苹果下架该应用。EFF还提起…
来源: Hacker News 热门(buzzing.cc 中文翻译) 链接: https://www.eff.org/deeplinks/2026/06/new-bill-takes-aim-government-pressure-silence-lawful-online-speech
AlphaFold 负责人 John Jumper 离职 Google DeepMind,加入 Anthropic
AlphaFold 团队负责人 John Jumper 宣布,在 Google DeepMind 工作近 9 年后决定离职,将加入 Anthropic(先休整一段时间)。DeepMind CEO Demis Hassabis 表示,过去 9 年与 Jumper 的非凡合作改变了世界,AlphaFold 展示了 AI 在科学与医学领域的巨大潜力,并为 AI 造福人类指明了方向。Jumper 回忆,H…
来源: X:Demis Hassabis (@demishassabis) 链接: https://x.com/demishassabis/status/2068002732250640603
八部门联合发文力推”人工智能 + 消费”,扩大 AI 手机电脑及智能网联汽车消费
商务部等8部门近日印发《关于加快”人工智能 + 消费”发展的实施意见》,从5方面提出17条举措。重点包括:扩大AI手机电脑、智能家居、智能网联汽车、智能穿戴、AI机器人等供给;推动AI与居家、养老、文旅、餐饮、教育等融合;促进AI在批发零售、电商、物流领域应用;建设集聚区和体验中心,开展产品租赁、共享、试用等模式创新;完善基础设施、标准体系和监管,推动互联互通。商务部将协同落实,促进AI进千家万户…
来源: IT之家(RSS) 链接: https://www.ithome.com/0/966/295.htm
AI数据中心获政府强制电网快车道
美国联邦能源监管委员会(FERC)命令六大电网运营商为数据中心等大型用户提供快速并网通道,数据中心需承担并网费用。FERC同时要求运营商考虑”替代输电技术”,并在30天内报告剩余发电容量、60天内审查本区域电价。指令并未解决发电容量短缺问题。数据中心电力需求预计到2035年增长近三倍,而电网运营商此前长期应对近乎零的需求增长。据Bloomberg,部分地区批发电价较五年前上涨了267%。
来源: TechCrunch:AI(RSS) 链接: https://techcrunch.com/2026/06/18/ai-data-centers-just-got-a-government-mandated-fast-lane-to-the-grid
📄 AI论文
MosaicLeaks: 你的研究智能体能保守秘密吗?
深度研究智能体在结合私有本地文档与外部网页检索时存在隐私泄露风险。MosaicLeaks 提出包含 1,001 条多跳研究链的新任务,每条链交错混合本地与公共子问题。测试发现智能体频繁泄露私有信息,单纯优化任务性能反而加剧泄露。基于此,研究提出隐私感知深度研究(PA-DR)强化学习训练方法,将严格链成功率从 48.7% 提升至 58.7%,同时将答案/全面信息泄露率从 34.0% 降至 9.9%。
来源: Hugging Face:Blog(RSS) 链接: https://huggingface.co/blog/ServiceNow/mosaicleaks
OpenAI 强化学习实现广泛且持久的有益模型
OpenAI 通过强化学习在真实对话场景中训练模型,使其展现诚实、认知谦逊、元认知透明、可纠正性、普遍公平性和对人类福祉的关心等有益特质。训练数据涵盖健康、教育、科学、法律、工程等多个领域。训练后模型在数十项独立对齐评测(包括奖励黑客、欺骗、有害建议、规范遵从等)上均表现提升,且这种改善泛化到未参与训练的领域、任务和评分设定。在对抗性提示或微调下,模型仍难以被导向有害行为,表明有益特质强化学习可产…
来源: OpenAI:Alignment 研究博客(RSS) 链接: https://alignment.openai.com/beneficial-rl
💡 技巧与观点
Anthropic 工程负责人:Claude Code 让程序员更孤独
6月22日,Anthropic工程负责人Fiona Fung表示,Claude Code和Claude Cowork等AI智能体让工程师越发依赖智能体工作,彼此之间交流减少,长期易感孤独。团队为此组织编程午餐、黑客松和共同开发时段,重新创造面对面协作机会。调查显示Claude Code已成为创业公司最常用的AI编程工具,“氛围编程”兴起使”单人创业者”增多,但Fung强调协作仍不可或缺。
来源: IT之家(RSS) 链接: https://www.ithome.com/0/967/216.htm
腾讯元宝父亲节活动:上传照片生成与年轻爸爸的合影
腾讯元宝推出父亲节主题活动,用户可选择爸爸年轻时照片与自己的照片,输入提示词(如”帮我生成一张和爸爸的合影,将图2的我融合到图1爸爸的照片中,我想穿越回__年前,和他一起_____;保留爸爸照片的背景、动作及五官;人物姿态自然协调,整体光线与色调保持一致”),元宝即可生成合影。活动旨在让用户”回到过去”看到爸爸的青春模样。
来源: 公众号:腾讯元宝 链接: https://mp.weixin.qq.com/s/xrTg2Bdy3FF3gn3C_gVBJQ
开源教程《Deep Agents 实战》发布
LangChain 官方认证大使 @zhanghaili0610 推出开源教程《Deep Agents 实战》,基于 LangChain / LangGraph 生态,讲解如何用 Deep Agents Harness 框架构建真实 Agent 应用。核心是”三层架构”:Runtime(LangGraph)、Framework(LangChain)、Harness(Deep Agents)。技术内…
来源: X:邵猛 (@shao__meng) 链接: https://x.com/shao__meng/status/2068306942184034471
OpenRouter vs Portkey:你的团队该选哪个LLM网关?
OpenRouter是托管路由网络,买credits后通过一个API路由至70+供应商,自动故障转移,无需自有密钥;覆盖300+模型(含20+免费),按用量收费(零加成+5.5%平台费,首100万免费),支持零数据保留和欧盟路由。Portkey是AI控制平面(2026年被Palo Alto收购),置于用户密钥之上,增加治理、提示管理、护栏和可观测性;提供1600+ LLM统一API,按日志计费(D…
来源: OpenRouter:Announcements(RSS) 链接: https://openrouter.ai/blog/insights/openrouter-vs-portkey
baoyu-design Skill迭代:修复导出样式与渐变丢失问题,支持AI配图导出PPTX
宝玉分享 baoyu-design Skill 的迭代过程:用户测试发现导出问题(样式表未铺满整页、渐变色丢失),他在本地复现后让 Agent 分析原因、给出解决方案并添加测试覆盖,修复后效果改善。该 Skill 可在制作 PPT、动画视频或网站时调用 AI 生图配图,支持 Codex 内置画图或配合 baoyu-image-gen Skill 调用 Codex CLI 画图,并能连同图片一起导出…
来源: X:宝玉 (@dotey) 链接: https://x.com/dotey/status/2068042001895809420
AI中心的数据黑洞
智能的一种定义是样本效率,但近年AI进步主要靠扩充数据分布和增加算力。强化学习本质是合成数据生成—投入大量算力通过验证器筛选”好”数据,再训练模型预测正确输出。这一过程需要每个领域和技能的海量人类专家示例,数据行业年收入已达数十亿美元。近日Epoch报告,开源模型仅落后前沿闭源模型4个月,原因在于数据可从公开API蒸馏,而超参数等不易复制。人类一生接触约2亿token,前沿模型训练在数十到数百T…
来源: Dwarkesh Patel:Podcast & Blog(RSS) 链接: https://www.dwarkesh.com/p/the-sample-efficiency-black-hole-2
OpenRouter vs LiteLLM:如何选择 LLM 网关
OpenRouter 是托管在 Cloudflare 边缘的 LLM 网关,无需管理基础设施,收取 5.5% 平台费(前 100 万次请求免费),支持 70+ 提供商和自动故障转移。LiteLLM 是自部署代理(Docker/PostgreSQL/Redis),数据不离开内网,免费开源,但需承担基础设施成本(生产部署约数百美元/月)。当模型月支出超过约 $3,600(基础设施 $200/月)或 $…
来源: OpenRouter:Announcements(RSS) 链接: https://openrouter.ai/blog/insights/openrouter-vs-litellm
禁止开源AI将是一个错误
近期行政命令、国会提案及对Anthropic最先进模型的境外访问限制,可能开启新一轮AI监管。开源软件已支撑全球90%以上软件并创造8万亿美元经济价值,在教育、创新和竞争三方面持续赋能。Anthropic与OpenAI的封闭模型加剧市场集中,开源(尤其开放权重)是初创公司、教育机构和企业获得替代方案的唯一平衡力量。开源透明性使其更安全,更多工程师可剔除不需要的模型行为或修复漏洞。以中国竞争为由监管…
来源: Nathan Lambert:Interconnects(RSS) 链接: https://www.interconnects.ai/p/banning-open-source-ai-would-be-a
/youtube-notetaker:YT 视频转 Artifacts
YT 视频 -> Artifacts
看看我如何使用新的 /youtube-notetaker 技能从 YT 视频生成 Artifacts。
捕获幻灯片、笔记、转录内容……
快去试试 ↓
来源: X:Elvis Saravia (@omarsar0, DAIR.AI) 链接: https://x.com/omarsar0/status/2067952726282031411
Humanize PPT v0.9:为演讲而生的开源PPT Skill
Humanize PPT v0.9 是一款专为演讲场景设计的PPT Skill,核心通过AST(Audience, State, Transfer)逻辑重新编排大纲,将页面渲染外包给下游Skill。渲染前先输出4张真实预览页,并将图片、视频素材的占位与生成prompt写入大纲。新增质检环节自动修复常见渲染问题,并支持演讲模式:按S键在独立窗口显示演讲稿备注,按ESC键打开全局索引快速跳页。项目已开…
来源: 公众号:卡尔的AI沃茨 链接: https://mp.weixin.qq.com/s/rGoYnUcBRkfRKQPbIaawyg
我们在 Elasticsearch 上构建了一个持久化代理内存层,其召回率为0.89
Agent Builder 正式上市(GA)。基于 Elasticsearch 的持久化内存层将记忆分为情景、语义、程序三类,分别存入独立索引,各设不同写速率与过期规则。召回采用 BM25 与 Jina v5 稠密向量的 RRF 融合,再经交叉编码器重排序。在 168 道 QA 题评估中,R@10 平均 0.89,零跨租户泄漏。该层可通过支持 MCP 协议的客户端访问,不绑定特定运行时,已开源至 …
来源: Hacker News 热门(buzzing.cc 中文翻译) 链接: https://www.elastic.co/search-labs/blog/agent-memory-elasticsearch
DeepSeek研究员开源AutoResearch:AI自主跑通285B模型RL研究闭环
DeepSeek研究员Deli Chen将AutoResearch协议开源,并发布Self-play综述论文。其AI智能体首次完全自主地在DeepSeek 285B模型上完成完整RL研究闭环—从实验设计、写代码、提交GPU任务、debug到结论总结,全程零人工干预。系统调用了GRPO工具,被视为持续学习研究的开端。
来源: X:阿易 AI Notes (@AYi_AInotes) 链接: https://x.com/AYi_AInotes/status/2067819352926150953
Salesforce CodeGen教程:生成、验证并重排序Python函数(含单元测试与安全检查)
本教程实现一个基于Salesforce CodeGen的端到端代码生成工作流。从HuggingFace加载CodeGen模型(支持350M、2B、codegen2-1B、codegen25-7b等版本),通过自然语言提示生成Python函数,随后进行函数提取、语法检查、静态安全检查、单元测试验证、best-of-N候选重排序、多步程序合成、提示词实验、基准可视化及导出。展示了CodeGen作为结构…
来源: MarkTechPost(RSS) 链接: https://www.marktechpost.com/2026/06/18/salesforce-codegen-tutorial-generate-validate-and-rerank-python-functions-with-unit-tests-and-safety-checks
OpenClaw 接入 OpenRouter
OpenClaw 已内置 OpenRouter 支持,一条命令即可为 AI 智能体配置统一密钥、统一账单,并实现跨 300 多个模型的自动故障转移。同时提供具体设置步骤以及常见错误的修复方法。
来源: OpenRouter:Announcements(RSS) 链接: https://openrouter.ai/blog/tutorials/openclaw-openrouter
📋 关于本栏目
本页面每日23:00自动更新,内容由 AI HOT 提供原始数据,Hermes Agent 自动采集、分类、加工后发布到 agents-quant.com。
自动生成于 2026-06-22 23:01 · Powered by Hermes Agent