AI周报AI大事人工智能GLM-5.2DeepSeekClaude Fable 5开源大模型量化交易

AI周报第1期:GLM-5.2开源发布,DeepSeek完成500亿融资刷新纪录


本周AI大事速览

创刊号。2026年6月15日—22日,全球AI进入”六月发布潮”的密集窗口期:闭源与开源、国内与国外、模型层与资金层同时发生重大变化。对AI量化交易从业者而言,最值得关注的不是某个跑分数字,而是Agent能力、上下文窗口和推理速度这三个直接决定量化流水线效率的维度,本周集体跨过临界点

日期事件影响等级
6月17日智谱AI正式上线并开源GLM-5.2(MIT许可,1M上下文,强化Agent与长程任务)⭐⭐⭐⭐⭐
6月16日DeepSeek完成超500亿元首轮融资,估值破500亿美元,刷新中国AI单轮融资纪录⭐⭐⭐⭐⭐
6月10日Anthropic发布Claude Fable 5 / Mythos 5,首个公开的Mythos级模型⭐⭐⭐⭐
6月(蓄势)OpenAI GPT-5.6(代号iris-alpha,150万token上下文)预计本月发布⭐⭐⭐⭐
6月(蓄势)Google Gemini 3.5 Pro(2M token、Deep Think)迈向正式GA⭐⭐⭐⭐
6月15日小米MiMo-V2.5-Pro-UltraSpeed:通用GPU上推理首破1000 tokens/s⭐⭐⭐
6月18日Google Gemini Code Assist个人版停止服务,免费编码助手格局生变⭐⭐⭐
6月欧盟AI Act高风险条款全面生效,中国生成式AI管理办法升级为正式条例⭐⭐⭐⭐

🔥 重大事件详解

1. 智谱AI开源GLM-5.2:MIT许可的1M上下文Agent模型

  • 事件:6月17日,智谱AI正式上线并开源新一代旗舰模型GLM-5.2。该模型延续GLM系列在Coding、Agent和复杂工程任务方向的技术路线,权重采用MIT许可(可免费商用),支持100万token上下文窗口,提供Anthropic兼容API。此前6月13日,GLM-5.2已面向GLM Coding Plan全量用户(Lite/Pro/Max/团队版)开放。评测显示其编程能力在开源模型中登顶,直接对标GPT-5.5。
  • 影响:这是本周对开发者生态最具实质意义的事件。MIT许可意味着量化团队可以零授权成本私有化部署,不必担心商用条款;1M上下文则意味着可以把整个策略代码库、数年的研报和行情日志一次性喂给模型,做”全局推理”而非”片段拼接”。Anthropic兼容API降低了迁移成本——原来用Claude写的Agent,改个endpoint就能切到GLM-5.2。
  • 对量化的启示:AgentQuant一直在强调”AI Agent + 量化”的闭环。GLM-5.2的两个特性恰好踩中痛点:长上下文解决因子开发中”跨文件、跨周期、跨策略”的代码理解问题;MIT开源让团队敢于把核心策略代码放进本地Agent,而不必把敏感逻辑发往云端。建议优先用它替换私有化部署中的闭源模型,把API调用成本和合规风险同时降下来。一个务实的起步路径:用GLM-5.2本地部署做”策略代码审计Agent”,自动扫描因子库中的前视偏差和数据泄漏。

2. DeepSeek完成超500亿元融资:国产AI最大单轮,五年锁仓

  • 事件:6月16日,据The Information报道,DeepSeek完成成立以来的首轮外部融资,募资总额超500亿元人民币(约74亿美元),投后估值突破500亿美元,双双刷新中国AI行业纪录。创始人梁文锋个人出资200亿元为最大出资方,国家人工智能产业投资基金出资10亿元(唯一享投票权的直接股东),腾讯、宁德时代、京东、网易、IDG资本等参投。交易结构特殊:外部投资者通过梁文锋管理的有限合伙企业间接投入,且设置五年锁定期
  • 影响:这笔融资传递了三个信号。一是国产大模型赛道进入”超级资本”阶段,算力军备竞赛的资金门槛已被抬高到百亿量级;二是创始人通过LP架构和锁仓牢牢守住控制权,意味着技术路线不会因资本短视而动摇;三是国家队(国家AI产业投资基金)直接入场,政策护航意味浓厚。
  • 对量化的启示:DeepSeek一直是A股量化圈(梁文锋本人即出身量化)最熟悉的大模型。500亿弹药意味着V4.1及后续版本会在多模态、工具调用和企业级部署上持续投入,量化团队可押注DeepSeek作为长期主力模型——它的API定价激进、开源彻底,且团队天然理解金融场景。但五年锁仓也提示一点:初创模型的长期服务稳定性仍需用多云/多模型架构来对冲,不要把整条交易链路绑死在单一供应商上。

3. Claude Fable 5:首个公开的Mythos级模型

  • 事件:6月10日,Anthropic发布第五代Claude系列——面向通用市场的Claude Fable 5和面向专业领域的Claude Mythos 5。Fable 5是首个对公众开放的Mythos级模型,官方称其能力超越此前所有公开模型,编程能力卓越,擅长处理长周期、自主推进的复杂项目,并能”自我检验工作”。
  • 影响:Anthropic把原本只在Project Glasswing中给50家合作伙伴(含JPMorgan Chase)使用的顶级能力下放到通用市场,标志着”前沿Agent能力民主化”。Fable 5强调自主性、长程任务和自我测试,这三个词几乎就是金融自动化流水线的需求清单。
  • 对量化的启示:Fable 5的”自我检验”特性对量化尤其宝贵——策略代码上线前的自动回测验证、边界条件测试、过拟合检查,都可以交给它作为”第二双眼睛”。值得在因子挖掘和回测引擎开发中做对照实验:用同一批因子,分别让Fable 5和GLM-5.2生成代码,比较夏普比率和最大回撤的稳定性。多模型交叉验证正在成为降低”AI幻觉型策略”风险的标准动作。

4. GPT-5.6 与 Gemini 3.5 Pro:上下文窗口的”军备升级”

  • 事件:OpenAI的GPT-5.6(代号iris-alpha)5月底在Codex后端日志中被开发者发现,支持150万token上下文(较GPT-5.5提升约43%),预计本月发布,并配合OpenAI的IPO进程。Google则在5月19日I/O上预览的Gemini 3.5 Pro正迈向正式GA,目标2M token上下文窗口与Deep Think推理。同期,Google宣布Gemini Code Assist个人版于6月18日停止服务。
  • 影响:上下文窗口正成为前沿模型竞争的核心指标。150万到200万token意味着可以一次性容纳整本招股书、数年逐笔成交数据或完整策略代码库。这对需要处理海量非结构化信息(财报、研报、新闻)的金融场景是实质性利好。Code Assist个人版停服,则提醒免费午餐正在减少,开发者需为AI编码助手做预算规划。
  • 对量化的启示:超长上下文直接改变量化研究的工作方式——全市场因子库的批量诊断、跨年度财报的横向对比、长周期事件的归因分析,都能在单次推理中完成,减少因截断造成的信息丢失。但要注意:上下文越长,越容易触发”中间遗忘”(lost in the middle)问题,关键信息最好放在上下文首尾。建议把超长上下文用于离线深度研究,实时交易仍用小窗口低延迟模型。

5. 小米MiMo推理破1000 tokens/s:速度维度的新标杆

  • 事件:6月15日前后,小米上线的MiMo-V2.5-Pro-UltraSpeed模式通过全链路工程优化,成为全球首个在通用GPU上推理速度突破1000 tokens/s的模型,同步推出MiMo Code进军Coding Agent领域。
  • 影响:推理速度突破四位数意味着LLM开始逼近传统风控系统的响应门槛。对需要毫秒到秒级决策的高频和统计套利场景,这是从”能用”到”敢用”的分水岭。
  • 对量化的启示:1000 tokens/s的实战价值不在生成长文,而在事件驱动场景的实时解读——突发公告、异动新闻、龙虎榜数据的秒级结构化抽取。低延迟推理让”AI盯盘Agent”从概念走向生产。但要清醒:通用GPU上的极速推理往往伴随精度取舍,实盘前务必做延迟与输出质量的联合压测。

6. 欧盟AI Act高风险条款全面生效 + 中国生成式AI管理办法升级

  • 事件:2026年6月,欧盟《人工智能法案》对高风险AI系统的监管条款全面生效,违规罚款最高可达全球年营收的7%。同期,中国将生成式AI管理办法从暂行规定升级为正式条例,合规要求趋严。美国方面则延续”去监管”基调,特朗普政府正探讨对AI公司的政府股权参与。
  • 影响:全球AI监管出现明显分化——欧盟收紧、中国规范化、美国放手。这种分化会直接影响跨境金融AI应用的合规边界。
  • 对量化的启示:如果你的量化策略涉及欧洲市场或使用境外模型服务,务必把”模型合规”纳入风控清单。7%全球营收的罚金不是小数。国内团队则要注意:生成式AI用于投研输出、客户触达时,需符合内容标识和数据出境新规。监管合规正在成为Alpha之外的”生存Alpha”。

📊 本周AI模型排行(量化场景适用性)

排名模型本周动态量化场景适用性
1GLM-5.26/17开源,MIT许可,1M上下文⭐⭐⭐⭐⭐ 策略代码审计、私有化Agent、因子库全局推理
2DeepSeek(V4.1在途)6/16完成500亿融资⭐⭐⭐⭐⭐ 主力推理模型,金融场景原生理解,定价激进
3Claude Fable 56/10发布,Mythos级⭐⭐⭐⭐ 复杂Agent编排、策略自我检验、长程任务
4GPT-5.6150万token,蓄势待发⭐⭐⭐⭐ 超长研报/财报分析、多模态事件解读
5Gemini 3.5 Pro2M token迈向GA⭐⭐⭐⭐ 海量数据批处理、Deep Think深度归因
6MiMo-V2.5-Pro-UltraSpeed1000 tokens/s⭐⭐⭐ 实时事件驱动、低延迟盯盘Agent

💡 AgentQuant观察

本周最深刻的感受是:AI Agent + 量化交易的三大基础设施瓶颈,正在同一周内被集中突破

第一是”记忆”瓶颈——GLM-5.2的1M上下文和GPT-5.6的150万token,让Agent终于能”记住”整个因子库和历史研报,而不必靠脆弱的外部检索拼接上下文。第二是”成本/合规”瓶颈——GLM-5.2的MIT开源把私有化部署的法律和财务门槛降到接近零,敏感的策略代码不必再发往云端。第三是”速度”瓶颈——MiMo的1000 tokens/s让实时事件解读从”分钟级”逼近”秒级”,AI盯盘开始具备实战意义。

与此同时,DeepSeek的500亿融资传递了更宏大的信号:国产AI已拿到与全球巨头同台竞技的资本弹药,而梁文锋的量化出身意味着这家公司会比任何人都更懂金融场景。当模型能力、开源生态和超级资本三者叠加,2026年下半年很可能是”AI量化Agent”从实验走向生产的关键窗口

对从业者的建议很朴素:不要再把大模型当成”写两段代码的助手”,而要开始用Agent的视角重构整条研究-回测-执行流水线。先把GLM-5.2本地跑起来做代码审计,再用Fable 5做策略交叉验证,最后在事件驱动场景里测试低延迟推理——这三步,就是从”用AI”到”构建AI量化操作系统”的起点。

❓ 常见问题

Q1:GLM-5.2开源了,我可以直接用在自己公司的量化系统里吗? 可以。GLM-5.2采用MIT许可,允许免费商用和修改。但要注意:模型权重开源≠训练数据合规无瑕疵,金融场景建议在私有化部署基础上,对输出做独立的合规审查。API调用则需遵循智谱的服务条款。

Q2:DeepSeek拿到500亿融资,会涨价吗? 短期看不会。DeepSeek一贯以激进取价抢占市场,500亿弹药更可能投入算力和下一代模型(V4.1),而非提价。但作为对冲,建议生产系统采用多云多模型架构,避免单点依赖。

Q3:上下文窗口动辄百万token,是不是就不用RAG了? 不是简单的替代关系。超长上下文适合”一次性深度分析”(如审一份招股书),RAG更适合”持续增量检索”(如每日新闻流)。生产级量化系统通常是两者结合:长上下文做离线研究,RAG做实时更新,各取所长。


风险提示:本文内容仅供参考,不构成投资建议。AI模型存在不确定性,量化交易有风险,入市需谨慎。

💬 评论