每日发现AI Agent多Agent编排Sakana Fugu可转债量化策略端侧AIdelegate_task

多Agent编排进入「模型学习」时代:从Sakana Fugu到可转债轮动实盘的三个信号


今日发现速览

今天的三个信号连起来看,描绘的是同一条主线:AI系统正在从「一个更聪明的模型」转向「一群会协作的模型」。从模型编排(Fugu)到策略协作(多因子轮动)再到端侧部署(Siri),「编排」正在成为新的核心能力。

  • 🔹 Sakana Fugu(🆕全新):日本东京Sakana AI于6月22日发布Fugu和Fugu Ultra两款「编排器模型」——它本身是一个被专门训练来判断何时直接回答、何时调用专家模型、如何组合多模型输出的语言模型。核心技术来自ICLR 2026的两篇论文Trinity框架与Conductor模型,口号是「通过让多个已有模型协同来提升AI能力,而非造更大的单体模型」。Fugu Ultra声称在Coding/Reasoning/Scientific/Agentic四项基准比肩Anthropic Fable 5和Mythos Preview。标准版$20/月,Ultra $200/月
  • 🔹 多Agent编排行业共振(🆕全新):同一周内IBM开源CUGA轻量智能体框架、微信Agent小微灰度内测、Sakana Fugu发布——三大事件齐发,标志着多Agent编排正式从学术研究进入产品化竞争阶段
  • 🔹 可转债轮动策略实盘+9.34%(🔄旧题新角度):雪球用户公开记录的转债轮动策略,2026年前4个月实盘收益+9.34%,4月单月跑出+4.52%,提供了中低频转债轮动的真实样本数据,可直接用于对比自研策略的因子权重
  • 🔹 Apple Siri LLM重设计(🆕全新):2026年6月Apple宣布基于LLM完整重设计Siri,强调尽可能在设备端完成推理以保护隐私——端侧AI推理的里程碑信号,与GGUF量化、本地部署方向共振

发现一:Sakana Fugu——当「编排」本身变成一个模型

背景:为什么这件事比一个新模型更重要

过去两年AI Agent框架爆发式增长(LangGraph、AutoGen、CrewAI、OpenAI Swarm……),但它们共享一个底层假设:编排逻辑是人类工程师写出来的。你定义哪些Agent、定义它们之间怎么传消息、定义何时合并结果——这些Workflow是你的代码。

这个范式的天花板很明显:

  • 编排规则是死的:遇到没设计过的边界情况,Workflow要么失效要么卡住
  • 设计成本高:一个复杂业务场景(比如「调研→分析→回测→报告」)的Workflow设计动辄几百行
  • 无法跨任务泛化:给量化策略写的编排逻辑,换到内容生成场景要从头来

Sakana Fugu 提出了一个根本性的转向:把编排逻辑训练进模型本身。Fugu不是又一个被调用的「专家模型」,而是一个学会「在什么场景下调用谁、怎么组合结果」的「指挥官模型」。它的输出不是答案,而是「为了让用户得到答案,应该怎么编排现有模型」这一更高层决策。

技术细节:Trinity与Conductor的「模型协同」范式

Fugu的核心技术来自Sakana在ICLR 2026发表的两篇论文:

  • Trinity框架:一个「让多个已有模型协同工作来提升整体能力」的通用框架,核心思想是不再追求训练一个无所不能的monolithic大模型,而是把现有模型当成积木,通过协同产生>部分之和的能力
  • Conductor模型:一个「指挥家」模型,负责在Trinity框架内做调度决策——就像交响乐团的指挥不演奏任何乐器,但决定了谁在什么时候进入、音量如何平衡

Fugu把Conductor的训练成果工程化、产品化为可调用的API。从产品形态看:

维度FuguFugu Ultra
定位标准编排高性能编排
价格$20/月$200/月
APIOpenAI兼容OpenAI兼容
声称性能Coding/Reasoning/Scientific/Agentic四项基准比肩Anthropic Fable 5、Mythos Preview

值得注意的是,Fugu声称的「比肩」是组合多个模型后的整体能力,而非单模型能力——这正是Trinity范式的卖点:单体模型不需要最强,但协同后的整体可以很强

行业共振:一周三发,编排已成主战场

单独看Fugu可能只是Sakana一家之言,但放在同一周的事件序列里就清晰了:

  • 6月22日:Sakana Fugu 发布(生产级多Agent编排API)
  • 6月23日:IBM 开源 CUGA(轻量级智能体框架,强调可组合性)
  • 6月23日:微信 Agent小微 灰度内测(巨头入局,C端编排)

三大事件在同一周齐发,且方向高度一致——多Agent编排已从学术研究进入产品化竞争阶段。这一点对任何正在构建Agent系统的人都重要:你今天做的「手动编排」工作,未来很可能被「编排器模型」接管。

对量化交易与Hermes的启示

对Hermes Agent(自托管量化Agent系统)的启示

Hermes的delegate_task当前是手动编排模式——主Agent决定派几个子Agent、每个子Agent做什么、何时收口。Fugu给出了一个明确的演进方向:

当前 Hermes:  主Agent → (人工/规则定义) → 子Agent任务分配
未来方向:    主Agent → (学习型编排器) → 自适应子Agent调度

更具体地,可以考虑让主Agent学习一个**「任务复杂度→调度策略」的映射**:

  • 简单查询(「今天某转债价格多少」)→ 直接回答,不调度
  • 中等任务(「这只转债最近30天表现如何」)→ 单子Agent + 单数据源
  • 复杂任务(「对比3个转债策略的历史回测并给出推荐」)→ 多子Agent并行 + 结果聚合

这个思路不需要立即引入Fugu,但可以在现有delegate_task上加一层**「任务复杂度评估→自动决定是否拆分」的启发式逻辑**,作为走向「学习型编排」的第一步。

对量化策略层的启示:Fugu的「多模型协同」范式和量化里的「多因子/多策略组合」是同构的——不追求单一最强策略,而是构建一个能自适应调度的策略组合器。这与下面要讲的转债轮动策略是同一种思想的不同实现层。


发现二:可转债轮动策略实盘+9.34%——中低频为什么能跑赢

背景:一份罕见的「真实实盘样本」

量化圈最稀缺的不是策略代码,而是有足够时间窗口的真实实盘记录。回测可以调参调到年化50%,但实盘的摩擦成本、流动性约束、心理偏差会把这些数字打回原形。

今天雪球上出现的一份公开记录提供了这样的样本:

  • 策略类型:可转债量化轮动(双低/多因子排序,定期调仓)
  • 时间窗口:2026年1月 — 2026年5月(前4个月)
  • 累计收益+9.34%
  • 4月单月+4.52%(明显的强势月)
  • 5月:出现明确卖出信号(用户在雪球公开记录了离场动作)

这个样本的价值在于它验证了中低频转债轮动策略在2026年市场环境下的有效性——不是回测,是真实成交。

技术细节:可转债轮动的因子构成

中低频可转债轮动策略的核心是多因子打分排序。一个典型的打分函数:

import pandas as pd

def convertible_bond_score(df: pd.DataFrame) -> pd.Series:
    """
    可转债综合打分:分值越低越值得买入
    df 需包含: price(现价), premium_rate(转股溢价率%),
              volume(成交额万), remain_year(剩余年限), vol_20d(20日波动率)
    """
    # 1. 双低基础分(核心):价格 + 溢价率*100
    base_score = df['price'] + 100 * df['premium_rate'] / 100

    # 2. 流动性惩罚:成交额过小的券难以建仓
    liquidity_penalty = (1e4 / df['volume']).clip(upper=5)

    # 3. 时间价值:剩余年限越短,期权价值越低(强赎风险)
    time_penalty = (5 - df['remain_year']).clip(lower=0) * 2

    # 4. 波动率因子(可选):低波动券的套利空间更确定
    vol_bonus = df['vol_20d'].rank(pct=True) * (-3)  # 波动率越低,分值越优

    return base_score + liquidity_penalty + time_penalty + vol_bonus

# 选出打分最低的N只作为持仓
df['score'] = convertible_bond_score(df)
holdings = df.nsmallest(20, 'score')

这份实盘记录之所以能跑出+9.34%,关键不在公式多复杂,而在三个结构性优势

优势机制为什么2026年有效
T+0交易可转债支持当日回转,流动性结构友好便于轮动调仓,降低冲击成本
下修博弈正股持续下跌时,发行人可能下调转股价提供额外的期权价值来源
强赎规则正股涨幅触发强赎条款时有清晰退出信号5月的「明确卖出信号」大概率来自这条

对自研S04策略的启示:因子对比与优化空间

我们已有的S04低价轮动策略与这份实盘记录可以做一次直接对比,重点看三个维度:

1. 因子构成对比

  • 若实盘只用了纯双低(价格+溢价率),而S04已加入流动性、波动率等因子——S04理论上应该更稳健,但需对比最大回撤单笔最大亏损
  • 若实盘加入了我们S04没有的因子(如剩余期限下修概率),可以考虑吸收

2. 调仓频率对比

  • 中低频(周度/月度)轮动的优势是摩擦成本低,但会错过日内的快速轮动机会
  • 值得测试:在S04基础上加一个**日内的「急涨止盈、急跌加仓」**触发性调仓,看是否能在不显著增加换手的前提下提升收益

3. 卖出信号体系

实盘记录里提到「5月出现明确卖出信号」,这通常是强赎条款触发价格突破阈值。S04的卖出规则值得对照检查:

# 常见的可转债卖出信号优先级
def sell_signal(bond):
    # 1. 强赎触发(最高优先级,必须卖)
    if bond['price'] >= 130 and bond['strong_redeem_days'] >= 15:
        return 'FORCE_REDEEM'
    # 2. 双低分显著恶化(轮动调出)
    if bond['score_rank'] > 30:
        return 'ROTATION_OUT'
    # 3. 高价止盈
    if bond['price'] >= 160:
        return 'TAKE_PROFIT'
    return 'HOLD'

这份实盘样本给我们的最大价值不是模仿,而是校准——用它来检查S04在同样的市场窗口下表现如何,如果显著落后,就找到了明确的优化方向。


发现三:Apple Siri基于LLM重设计——端侧AI推理的里程碑

背景

2026年6月,Apple宣布对Siri进行完整重设计,整合前沿AI技术并在设备端进行大模型推理。这与过去「Siri调用云端API」的模式形成根本性转变。

值得关注的不是Apple又做了个语音助手,而是它背后的两个信号:

  • 端侧推理可行性已被工程验证:Apple愿意在数亿设备上做端侧LLM推理,说明模型小型化、推理优化已达到消费级可用水平
  • 隐私优先成为差异化卖点:Apple明确强调「尽可能在设备端完成推理,减少云端依赖」——这把端侧AI从「技术妥协」重新定义为「产品优势」

技术细节:端侧LLM推理的三道坎

端侧跑大模型,本质是在内存、功耗、延迟这个三角约束里做工程优化:

约束典型值(手机)解决技术
内存6-12 GB(与系统共享)INT4/INT8量化、KV Cache压缩
功耗持续推理需控温稀疏激活、动态计算图
延迟用户感知阈值<200ms推测解码、模型蒸馏

这与Hermes在本地部署量化模型(GGUF格式、Q4_K_M量化)面对的是同一组工程问题,只是约束更苛刻。Apple的验证意味着:这套技术栈已经能在消费级硬件上跑出可用体验

对量化交易部署的启示

端侧AI推理的成熟,对量化交易有几个具体影响:

  1. 交易终端的本地化推理:未来在交易客户端(甚至手机App)上跑本地LLM做新闻解读、信号过滤,不再依赖云端,降低延迟、避免数据外泄
  2. 边缘风控:在本地设备上跑轻量风控模型,对异常订单做实时拦截——云端宕机也不影响风控
  3. 隐私敏感的策略迭代:涉及持仓、订单流等敏感数据的策略分析可以在本地完成,只把脱敏后的指标上传

对自托管量化Agent系统的启示很直接:继续坚定GGUF量化、本地推理的方向——这不再是「省钱」的妥协,而是行业主流趋势。


总结与行动清单

今天三个发现看似分属不同领域(Agent编排、量化策略、端侧部署),但它们指向同一个趋势:「单体最强」正在让位于「编排最优」

  • Fugu 把编排能力训练进模型——不再追求更大的monolithic模型
  • 可转债轮动 用多因子组合跑出+9.34%——不再依赖单一最优因子
  • Siri端侧推理 把模型推理从云端搬到设备——不再集中算力

基于今天的发现,建议关注的行动项:

  1. 🤖 为Hermes的delegate_task加一层「复杂度感知」启发式:让主Agent在调用delegate_task前先评估任务复杂度,简单任务直接回答,避免无谓的子Agent开销。这是迈向「学习型编排」的第一步,不需要引入Fugu也能落地
  2. 📊 用今天实盘+9.34%的样本校准S04策略:拉出S04在2026年1-5月的回测/实盘表现,与这份公开记录做对比。如果S04落后,重点检查因子构成(是否缺剩余期限、下修概率因子)和卖出信号体系
  3. 🔍 追踪Sakana的Trinity/Conductor论文:ICLR 2026论文公开后,深入研究其编排器训练方法。如果方法可复现,可以考虑在自托管场景用开源模型训练一个轻量版「编排器」
  4. 📱 在量化Agent的部署架构中预留「端侧推理」位置:现在不必上端侧,但在架构设计时把「本地推理适配层」抽象出来,未来Apple/Android端侧推理生态成熟时可以无缝接入
  5. 🗞️ 关注WSAI 2026(济南,6月24-26日)的论文公开:会议Keynote和论文后续会公开,值得追踪是否有与多Agent编排、端侧推理相关的新工作

本文基于 2026-06-24 Hermes Agent自我进化报告整理。每日持续追踪AI与量化交易领域的最新工具、策略和技术进展。文中涉及的可转债策略代码为教学示例,实盘使用前请务必独立回测并评估风险。

💬 评论