AI周报第1期：GLM-5.2开源发布，DeepSeek完成500亿融资刷新纪录

本周AI大事速览

创刊号。2026年6月15日—22日，全球AI进入”六月发布潮”的密集窗口期：闭源与开源、国内与国外、模型层与资金层同时发生重大变化。对AI量化交易从业者而言，最值得关注的不是某个跑分数字，而是Agent能力、上下文窗口和推理速度这三个直接决定量化流水线效率的维度，本周集体跨过临界点。

日期	事件	影响等级
6月17日	智谱AI正式上线并开源GLM-5.2（MIT许可，1M上下文，强化Agent与长程任务）	⭐⭐⭐⭐⭐
6月16日	DeepSeek完成超500亿元首轮融资，估值破500亿美元，刷新中国AI单轮融资纪录	⭐⭐⭐⭐⭐
6月10日	Anthropic发布Claude Fable 5 / Mythos 5，首个公开的Mythos级模型	⭐⭐⭐⭐
6月（蓄势）	OpenAI GPT-5.6（代号iris-alpha，150万token上下文）预计本月发布	⭐⭐⭐⭐
6月（蓄势）	Google Gemini 3.5 Pro（2M token、Deep Think）迈向正式GA	⭐⭐⭐⭐
6月15日	小米MiMo-V2.5-Pro-UltraSpeed：通用GPU上推理首破1000 tokens/s	⭐⭐⭐
6月18日	Google Gemini Code Assist个人版停止服务，免费编码助手格局生变	⭐⭐⭐
6月	欧盟AI Act高风险条款全面生效，中国生成式AI管理办法升级为正式条例	⭐⭐⭐⭐

🔥 重大事件详解

1. 智谱AI开源GLM-5.2：MIT许可的1M上下文Agent模型

事件：6月17日，智谱AI正式上线并开源新一代旗舰模型GLM-5.2。该模型延续GLM系列在Coding、Agent和复杂工程任务方向的技术路线，权重采用MIT许可（可免费商用），支持100万token上下文窗口，提供Anthropic兼容API。此前6月13日，GLM-5.2已面向GLM Coding Plan全量用户（Lite/Pro/Max/团队版）开放。评测显示其编程能力在开源模型中登顶，直接对标GPT-5.5。
影响：这是本周对开发者生态最具实质意义的事件。MIT许可意味着量化团队可以零授权成本私有化部署，不必担心商用条款；1M上下文则意味着可以把整个策略代码库、数年的研报和行情日志一次性喂给模型，做”全局推理”而非”片段拼接”。Anthropic兼容API降低了迁移成本——原来用Claude写的Agent，改个endpoint就能切到GLM-5.2。
对量化的启示：AgentQuant一直在强调”AI Agent + 量化”的闭环。GLM-5.2的两个特性恰好踩中痛点：长上下文解决因子开发中”跨文件、跨周期、跨策略”的代码理解问题；MIT开源让团队敢于把核心策略代码放进本地Agent，而不必把敏感逻辑发往云端。建议优先用它替换私有化部署中的闭源模型，把API调用成本和合规风险同时降下来。一个务实的起步路径：用GLM-5.2本地部署做”策略代码审计Agent”，自动扫描因子库中的前视偏差和数据泄漏。

2. DeepSeek完成超500亿元融资：国产AI最大单轮，五年锁仓

事件：6月16日，据The Information报道，DeepSeek完成成立以来的首轮外部融资，募资总额超500亿元人民币（约74亿美元），投后估值突破500亿美元，双双刷新中国AI行业纪录。创始人梁文锋个人出资200亿元为最大出资方，国家人工智能产业投资基金出资10亿元（唯一享投票权的直接股东），腾讯、宁德时代、京东、网易、IDG资本等参投。交易结构特殊：外部投资者通过梁文锋管理的有限合伙企业间接投入，且设置五年锁定期。
影响：这笔融资传递了三个信号。一是国产大模型赛道进入”超级资本”阶段，算力军备竞赛的资金门槛已被抬高到百亿量级；二是创始人通过LP架构和锁仓牢牢守住控制权，意味着技术路线不会因资本短视而动摇；三是国家队（国家AI产业投资基金）直接入场，政策护航意味浓厚。
对量化的启示：DeepSeek一直是A股量化圈（梁文锋本人即出身量化）最熟悉的大模型。500亿弹药意味着V4.1及后续版本会在多模态、工具调用和企业级部署上持续投入，量化团队可押注DeepSeek作为长期主力模型——它的API定价激进、开源彻底，且团队天然理解金融场景。但五年锁仓也提示一点：初创模型的长期服务稳定性仍需用多云/多模型架构来对冲，不要把整条交易链路绑死在单一供应商上。

3. Claude Fable 5：首个公开的Mythos级模型

事件：6月10日，Anthropic发布第五代Claude系列——面向通用市场的Claude Fable 5和面向专业领域的Claude Mythos 5。Fable 5是首个对公众开放的Mythos级模型，官方称其能力超越此前所有公开模型，编程能力卓越，擅长处理长周期、自主推进的复杂项目，并能”自我检验工作”。
影响：Anthropic把原本只在Project Glasswing中给50家合作伙伴（含JPMorgan Chase）使用的顶级能力下放到通用市场，标志着”前沿Agent能力民主化”。Fable 5强调自主性、长程任务和自我测试，这三个词几乎就是金融自动化流水线的需求清单。
对量化的启示：Fable 5的”自我检验”特性对量化尤其宝贵——策略代码上线前的自动回测验证、边界条件测试、过拟合检查，都可以交给它作为”第二双眼睛”。值得在因子挖掘和回测引擎开发中做对照实验：用同一批因子，分别让Fable 5和GLM-5.2生成代码，比较夏普比率和最大回撤的稳定性。多模型交叉验证正在成为降低”AI幻觉型策略”风险的标准动作。

4. GPT-5.6 与 Gemini 3.5 Pro：上下文窗口的”军备升级”

事件：OpenAI的GPT-5.6（代号iris-alpha）5月底在Codex后端日志中被开发者发现，支持150万token上下文（较GPT-5.5提升约43%），预计本月发布，并配合OpenAI的IPO进程。Google则在5月19日I/O上预览的Gemini 3.5 Pro正迈向正式GA，目标2M token上下文窗口与Deep Think推理。同期，Google宣布Gemini Code Assist个人版于6月18日停止服务。
影响：上下文窗口正成为前沿模型竞争的核心指标。150万到200万token意味着可以一次性容纳整本招股书、数年逐笔成交数据或完整策略代码库。这对需要处理海量非结构化信息（财报、研报、新闻）的金融场景是实质性利好。Code Assist个人版停服，则提醒免费午餐正在减少，开发者需为AI编码助手做预算规划。
对量化的启示：超长上下文直接改变量化研究的工作方式——全市场因子库的批量诊断、跨年度财报的横向对比、长周期事件的归因分析，都能在单次推理中完成，减少因截断造成的信息丢失。但要注意：上下文越长，越容易触发”中间遗忘”（lost in the middle）问题，关键信息最好放在上下文首尾。建议把超长上下文用于离线深度研究，实时交易仍用小窗口低延迟模型。

5. 小米MiMo推理破1000 tokens/s：速度维度的新标杆

事件：6月15日前后，小米上线的MiMo-V2.5-Pro-UltraSpeed模式通过全链路工程优化，成为全球首个在通用GPU上推理速度突破1000 tokens/s的模型，同步推出MiMo Code进军Coding Agent领域。
影响：推理速度突破四位数意味着LLM开始逼近传统风控系统的响应门槛。对需要毫秒到秒级决策的高频和统计套利场景，这是从”能用”到”敢用”的分水岭。
对量化的启示：1000 tokens/s的实战价值不在生成长文，而在事件驱动场景的实时解读——突发公告、异动新闻、龙虎榜数据的秒级结构化抽取。低延迟推理让”AI盯盘Agent”从概念走向生产。但要清醒：通用GPU上的极速推理往往伴随精度取舍，实盘前务必做延迟与输出质量的联合压测。

6. 欧盟AI Act高风险条款全面生效 + 中国生成式AI管理办法升级

事件：2026年6月，欧盟《人工智能法案》对高风险AI系统的监管条款全面生效，违规罚款最高可达全球年营收的7%。同期，中国将生成式AI管理办法从暂行规定升级为正式条例，合规要求趋严。美国方面则延续”去监管”基调，特朗普政府正探讨对AI公司的政府股权参与。
影响：全球AI监管出现明显分化——欧盟收紧、中国规范化、美国放手。这种分化会直接影响跨境金融AI应用的合规边界。
对量化的启示：如果你的量化策略涉及欧洲市场或使用境外模型服务，务必把”模型合规”纳入风控清单。7%全球营收的罚金不是小数。国内团队则要注意：生成式AI用于投研输出、客户触达时，需符合内容标识和数据出境新规。监管合规正在成为Alpha之外的”生存Alpha”。

📊 本周AI模型排行（量化场景适用性）

排名	模型	本周动态	量化场景适用性
1	GLM-5.2	6/17开源，MIT许可，1M上下文	⭐⭐⭐⭐⭐ 策略代码审计、私有化Agent、因子库全局推理
2	DeepSeek（V4.1在途）	6/16完成500亿融资	⭐⭐⭐⭐⭐ 主力推理模型，金融场景原生理解，定价激进
3	Claude Fable 5	6/10发布，Mythos级	⭐⭐⭐⭐ 复杂Agent编排、策略自我检验、长程任务
4	GPT-5.6	150万token，蓄势待发	⭐⭐⭐⭐ 超长研报/财报分析、多模态事件解读
5	Gemini 3.5 Pro	2M token迈向GA	⭐⭐⭐⭐ 海量数据批处理、Deep Think深度归因
6	MiMo-V2.5-Pro-UltraSpeed	1000 tokens/s	⭐⭐⭐ 实时事件驱动、低延迟盯盘Agent

💡 AgentQuant观察

本周最深刻的感受是：AI Agent + 量化交易的三大基础设施瓶颈，正在同一周内被集中突破。

第一是”记忆”瓶颈——GLM-5.2的1M上下文和GPT-5.6的150万token，让Agent终于能”记住”整个因子库和历史研报，而不必靠脆弱的外部检索拼接上下文。第二是”成本/合规”瓶颈——GLM-5.2的MIT开源把私有化部署的法律和财务门槛降到接近零，敏感的策略代码不必再发往云端。第三是”速度”瓶颈——MiMo的1000 tokens/s让实时事件解读从”分钟级”逼近”秒级”，AI盯盘开始具备实战意义。

与此同时，DeepSeek的500亿融资传递了更宏大的信号：国产AI已拿到与全球巨头同台竞技的资本弹药，而梁文锋的量化出身意味着这家公司会比任何人都更懂金融场景。当模型能力、开源生态和超级资本三者叠加，2026年下半年很可能是”AI量化Agent”从实验走向生产的关键窗口。

对从业者的建议很朴素：不要再把大模型当成”写两段代码的助手”，而要开始用Agent的视角重构整条研究-回测-执行流水线。先把GLM-5.2本地跑起来做代码审计，再用Fable 5做策略交叉验证，最后在事件驱动场景里测试低延迟推理——这三步，就是从”用AI”到”构建AI量化操作系统”的起点。

❓ 常见问题

Q1：GLM-5.2开源了，我可以直接用在自己公司的量化系统里吗？ 可以。GLM-5.2采用MIT许可，允许免费商用和修改。但要注意：模型权重开源≠训练数据合规无瑕疵，金融场景建议在私有化部署基础上，对输出做独立的合规审查。API调用则需遵循智谱的服务条款。

Q2：DeepSeek拿到500亿融资，会涨价吗？ 短期看不会。DeepSeek一贯以激进取价抢占市场，500亿弹药更可能投入算力和下一代模型（V4.1），而非提价。但作为对冲，建议生产系统采用多云多模型架构，避免单点依赖。

Q3：上下文窗口动辄百万token，是不是就不用RAG了？ 不是简单的替代关系。超长上下文适合”一次性深度分析”（如审一份招股书），RAG更适合”持续增量检索”（如每日新闻流）。生产级量化系统通常是两者结合：长上下文做离线研究，RAG做实时更新，各取所长。

风险提示：本文内容仅供参考，不构成投资建议。AI模型存在不确定性，量化交易有风险，入市需谨慎。