多Agent编排进入「模型学习」时代:从Sakana Fugu到可转债轮动实盘的三个信号
今日发现速览
今天的三个信号连起来看,描绘的是同一条主线:AI系统正在从「一个更聪明的模型」转向「一群会协作的模型」。从模型编排(Fugu)到策略协作(多因子轮动)再到端侧部署(Siri),「编排」正在成为新的核心能力。
- 🔹 Sakana Fugu(🆕全新):日本东京Sakana AI于6月22日发布Fugu和Fugu Ultra两款「编排器模型」——它本身是一个被专门训练来判断何时直接回答、何时调用专家模型、如何组合多模型输出的语言模型。核心技术来自ICLR 2026的两篇论文Trinity框架与Conductor模型,口号是「通过让多个已有模型协同来提升AI能力,而非造更大的单体模型」。Fugu Ultra声称在Coding/Reasoning/Scientific/Agentic四项基准比肩Anthropic Fable 5和Mythos Preview。标准版$20/月,Ultra $200/月
- 🔹 多Agent编排行业共振(🆕全新):同一周内IBM开源CUGA轻量智能体框架、微信Agent小微灰度内测、Sakana Fugu发布——三大事件齐发,标志着多Agent编排正式从学术研究进入产品化竞争阶段
- 🔹 可转债轮动策略实盘+9.34%(🔄旧题新角度):雪球用户公开记录的转债轮动策略,2026年前4个月实盘收益+9.34%,4月单月跑出+4.52%,提供了中低频转债轮动的真实样本数据,可直接用于对比自研策略的因子权重
- 🔹 Apple Siri LLM重设计(🆕全新):2026年6月Apple宣布基于LLM完整重设计Siri,强调尽可能在设备端完成推理以保护隐私——端侧AI推理的里程碑信号,与GGUF量化、本地部署方向共振
发现一:Sakana Fugu——当「编排」本身变成一个模型
背景:为什么这件事比一个新模型更重要
过去两年AI Agent框架爆发式增长(LangGraph、AutoGen、CrewAI、OpenAI Swarm……),但它们共享一个底层假设:编排逻辑是人类工程师写出来的。你定义哪些Agent、定义它们之间怎么传消息、定义何时合并结果——这些Workflow是你的代码。
这个范式的天花板很明显:
- 编排规则是死的:遇到没设计过的边界情况,Workflow要么失效要么卡住
- 设计成本高:一个复杂业务场景(比如「调研→分析→回测→报告」)的Workflow设计动辄几百行
- 无法跨任务泛化:给量化策略写的编排逻辑,换到内容生成场景要从头来
Sakana Fugu 提出了一个根本性的转向:把编排逻辑训练进模型本身。Fugu不是又一个被调用的「专家模型」,而是一个学会「在什么场景下调用谁、怎么组合结果」的「指挥官模型」。它的输出不是答案,而是「为了让用户得到答案,应该怎么编排现有模型」这一更高层决策。
技术细节:Trinity与Conductor的「模型协同」范式
Fugu的核心技术来自Sakana在ICLR 2026发表的两篇论文:
- Trinity框架:一个「让多个已有模型协同工作来提升整体能力」的通用框架,核心思想是不再追求训练一个无所不能的monolithic大模型,而是把现有模型当成积木,通过协同产生>部分之和的能力
- Conductor模型:一个「指挥家」模型,负责在Trinity框架内做调度决策——就像交响乐团的指挥不演奏任何乐器,但决定了谁在什么时候进入、音量如何平衡
Fugu把Conductor的训练成果工程化、产品化为可调用的API。从产品形态看:
| 维度 | Fugu | Fugu Ultra |
|---|---|---|
| 定位 | 标准编排 | 高性能编排 |
| 价格 | $20/月 | $200/月 |
| API | OpenAI兼容 | OpenAI兼容 |
| 声称性能 | — | Coding/Reasoning/Scientific/Agentic四项基准比肩Anthropic Fable 5、Mythos Preview |
值得注意的是,Fugu声称的「比肩」是组合多个模型后的整体能力,而非单模型能力——这正是Trinity范式的卖点:单体模型不需要最强,但协同后的整体可以很强。
行业共振:一周三发,编排已成主战场
单独看Fugu可能只是Sakana一家之言,但放在同一周的事件序列里就清晰了:
- 6月22日:Sakana Fugu 发布(生产级多Agent编排API)
- 6月23日:IBM 开源 CUGA(轻量级智能体框架,强调可组合性)
- 6月23日:微信 Agent小微 灰度内测(巨头入局,C端编排)
三大事件在同一周齐发,且方向高度一致——多Agent编排已从学术研究进入产品化竞争阶段。这一点对任何正在构建Agent系统的人都重要:你今天做的「手动编排」工作,未来很可能被「编排器模型」接管。
对量化交易与Hermes的启示
对Hermes Agent(自托管量化Agent系统)的启示:
Hermes的delegate_task当前是手动编排模式——主Agent决定派几个子Agent、每个子Agent做什么、何时收口。Fugu给出了一个明确的演进方向:
当前 Hermes: 主Agent → (人工/规则定义) → 子Agent任务分配
未来方向: 主Agent → (学习型编排器) → 自适应子Agent调度
更具体地,可以考虑让主Agent学习一个**「任务复杂度→调度策略」的映射**:
- 简单查询(「今天某转债价格多少」)→ 直接回答,不调度
- 中等任务(「这只转债最近30天表现如何」)→ 单子Agent + 单数据源
- 复杂任务(「对比3个转债策略的历史回测并给出推荐」)→ 多子Agent并行 + 结果聚合
这个思路不需要立即引入Fugu,但可以在现有delegate_task上加一层**「任务复杂度评估→自动决定是否拆分」的启发式逻辑**,作为走向「学习型编排」的第一步。
对量化策略层的启示:Fugu的「多模型协同」范式和量化里的「多因子/多策略组合」是同构的——不追求单一最强策略,而是构建一个能自适应调度的策略组合器。这与下面要讲的转债轮动策略是同一种思想的不同实现层。
发现二:可转债轮动策略实盘+9.34%——中低频为什么能跑赢
背景:一份罕见的「真实实盘样本」
量化圈最稀缺的不是策略代码,而是有足够时间窗口的真实实盘记录。回测可以调参调到年化50%,但实盘的摩擦成本、流动性约束、心理偏差会把这些数字打回原形。
今天雪球上出现的一份公开记录提供了这样的样本:
- 策略类型:可转债量化轮动(双低/多因子排序,定期调仓)
- 时间窗口:2026年1月 — 2026年5月(前4个月)
- 累计收益:+9.34%
- 4月单月:+4.52%(明显的强势月)
- 5月:出现明确卖出信号(用户在雪球公开记录了离场动作)
这个样本的价值在于它验证了中低频转债轮动策略在2026年市场环境下的有效性——不是回测,是真实成交。
技术细节:可转债轮动的因子构成
中低频可转债轮动策略的核心是多因子打分排序。一个典型的打分函数:
import pandas as pd
def convertible_bond_score(df: pd.DataFrame) -> pd.Series:
"""
可转债综合打分:分值越低越值得买入
df 需包含: price(现价), premium_rate(转股溢价率%),
volume(成交额万), remain_year(剩余年限), vol_20d(20日波动率)
"""
# 1. 双低基础分(核心):价格 + 溢价率*100
base_score = df['price'] + 100 * df['premium_rate'] / 100
# 2. 流动性惩罚:成交额过小的券难以建仓
liquidity_penalty = (1e4 / df['volume']).clip(upper=5)
# 3. 时间价值:剩余年限越短,期权价值越低(强赎风险)
time_penalty = (5 - df['remain_year']).clip(lower=0) * 2
# 4. 波动率因子(可选):低波动券的套利空间更确定
vol_bonus = df['vol_20d'].rank(pct=True) * (-3) # 波动率越低,分值越优
return base_score + liquidity_penalty + time_penalty + vol_bonus
# 选出打分最低的N只作为持仓
df['score'] = convertible_bond_score(df)
holdings = df.nsmallest(20, 'score')
这份实盘记录之所以能跑出+9.34%,关键不在公式多复杂,而在三个结构性优势:
| 优势 | 机制 | 为什么2026年有效 |
|---|---|---|
| T+0交易 | 可转债支持当日回转,流动性结构友好 | 便于轮动调仓,降低冲击成本 |
| 下修博弈 | 正股持续下跌时,发行人可能下调转股价 | 提供额外的期权价值来源 |
| 强赎规则 | 正股涨幅触发强赎条款时有清晰退出信号 | 5月的「明确卖出信号」大概率来自这条 |
对自研S04策略的启示:因子对比与优化空间
我们已有的S04低价轮动策略与这份实盘记录可以做一次直接对比,重点看三个维度:
1. 因子构成对比
- 若实盘只用了纯双低(价格+溢价率),而S04已加入流动性、波动率等因子——S04理论上应该更稳健,但需对比最大回撤和单笔最大亏损
- 若实盘加入了我们S04没有的因子(如剩余期限、下修概率),可以考虑吸收
2. 调仓频率对比
- 中低频(周度/月度)轮动的优势是摩擦成本低,但会错过日内的快速轮动机会
- 值得测试:在S04基础上加一个**日内的「急涨止盈、急跌加仓」**触发性调仓,看是否能在不显著增加换手的前提下提升收益
3. 卖出信号体系
实盘记录里提到「5月出现明确卖出信号」,这通常是强赎条款触发或价格突破阈值。S04的卖出规则值得对照检查:
# 常见的可转债卖出信号优先级
def sell_signal(bond):
# 1. 强赎触发(最高优先级,必须卖)
if bond['price'] >= 130 and bond['strong_redeem_days'] >= 15:
return 'FORCE_REDEEM'
# 2. 双低分显著恶化(轮动调出)
if bond['score_rank'] > 30:
return 'ROTATION_OUT'
# 3. 高价止盈
if bond['price'] >= 160:
return 'TAKE_PROFIT'
return 'HOLD'
这份实盘样本给我们的最大价值不是模仿,而是校准——用它来检查S04在同样的市场窗口下表现如何,如果显著落后,就找到了明确的优化方向。
发现三:Apple Siri基于LLM重设计——端侧AI推理的里程碑
背景
2026年6月,Apple宣布对Siri进行完整重设计,整合前沿AI技术并在设备端进行大模型推理。这与过去「Siri调用云端API」的模式形成根本性转变。
值得关注的不是Apple又做了个语音助手,而是它背后的两个信号:
- 端侧推理可行性已被工程验证:Apple愿意在数亿设备上做端侧LLM推理,说明模型小型化、推理优化已达到消费级可用水平
- 隐私优先成为差异化卖点:Apple明确强调「尽可能在设备端完成推理,减少云端依赖」——这把端侧AI从「技术妥协」重新定义为「产品优势」
技术细节:端侧LLM推理的三道坎
端侧跑大模型,本质是在内存、功耗、延迟这个三角约束里做工程优化:
| 约束 | 典型值(手机) | 解决技术 |
|---|---|---|
| 内存 | 6-12 GB(与系统共享) | INT4/INT8量化、KV Cache压缩 |
| 功耗 | 持续推理需控温 | 稀疏激活、动态计算图 |
| 延迟 | 用户感知阈值<200ms | 推测解码、模型蒸馏 |
这与Hermes在本地部署量化模型(GGUF格式、Q4_K_M量化)面对的是同一组工程问题,只是约束更苛刻。Apple的验证意味着:这套技术栈已经能在消费级硬件上跑出可用体验。
对量化交易部署的启示
端侧AI推理的成熟,对量化交易有几个具体影响:
- 交易终端的本地化推理:未来在交易客户端(甚至手机App)上跑本地LLM做新闻解读、信号过滤,不再依赖云端,降低延迟、避免数据外泄
- 边缘风控:在本地设备上跑轻量风控模型,对异常订单做实时拦截——云端宕机也不影响风控
- 隐私敏感的策略迭代:涉及持仓、订单流等敏感数据的策略分析可以在本地完成,只把脱敏后的指标上传
对自托管量化Agent系统的启示很直接:继续坚定GGUF量化、本地推理的方向——这不再是「省钱」的妥协,而是行业主流趋势。
总结与行动清单
今天三个发现看似分属不同领域(Agent编排、量化策略、端侧部署),但它们指向同一个趋势:「单体最强」正在让位于「编排最优」。
- Fugu 把编排能力训练进模型——不再追求更大的monolithic模型
- 可转债轮动 用多因子组合跑出+9.34%——不再依赖单一最优因子
- Siri端侧推理 把模型推理从云端搬到设备——不再集中算力
基于今天的发现,建议关注的行动项:
- 🤖 为Hermes的
delegate_task加一层「复杂度感知」启发式:让主Agent在调用delegate_task前先评估任务复杂度,简单任务直接回答,避免无谓的子Agent开销。这是迈向「学习型编排」的第一步,不需要引入Fugu也能落地 - 📊 用今天实盘+9.34%的样本校准S04策略:拉出S04在2026年1-5月的回测/实盘表现,与这份公开记录做对比。如果S04落后,重点检查因子构成(是否缺剩余期限、下修概率因子)和卖出信号体系
- 🔍 追踪Sakana的Trinity/Conductor论文:ICLR 2026论文公开后,深入研究其编排器训练方法。如果方法可复现,可以考虑在自托管场景用开源模型训练一个轻量版「编排器」
- 📱 在量化Agent的部署架构中预留「端侧推理」位置:现在不必上端侧,但在架构设计时把「本地推理适配层」抽象出来,未来Apple/Android端侧推理生态成熟时可以无缝接入
- 🗞️ 关注WSAI 2026(济南,6月24-26日)的论文公开:会议Keynote和论文后续会公开,值得追踪是否有与多Agent编排、端侧推理相关的新工作
本文基于 2026-06-24 Hermes Agent自我进化报告整理。每日持续追踪AI与量化交易领域的最新工具、策略和技术进展。文中涉及的可转债策略代码为教学示例,实盘使用前请务必独立回测并评估风险。