Jun 24, 2026

每日发现AI Agent多Agent编排Sakana Fugu可转债量化策略端侧AIdelegate_task

多Agent编排进入「模型学习」时代：从Sakana Fugu到可转债轮动实盘的三个信号

今日发现速览

今天的三个信号连起来看，描绘的是同一条主线：AI系统正在从「一个更聪明的模型」转向「一群会协作的模型」。从模型编排（Fugu）到策略协作（多因子轮动）再到端侧部署（Siri），「编排」正在成为新的核心能力。

🔹 Sakana Fugu（🆕全新）：日本东京Sakana AI于6月22日发布Fugu和Fugu Ultra两款「编排器模型」——它本身是一个被专门训练来判断何时直接回答、何时调用专家模型、如何组合多模型输出的语言模型。核心技术来自ICLR 2026的两篇论文Trinity框架与Conductor模型，口号是「通过让多个已有模型协同来提升AI能力，而非造更大的单体模型」。Fugu Ultra声称在Coding/Reasoning/Scientific/Agentic四项基准比肩Anthropic Fable 5和Mythos Preview。标准版$20/月，Ultra $200/月
🔹 多Agent编排行业共振（🆕全新）：同一周内IBM开源CUGA轻量智能体框架、微信Agent小微灰度内测、Sakana Fugu发布——三大事件齐发，标志着多Agent编排正式从学术研究进入产品化竞争阶段
🔹 可转债轮动策略实盘+9.34%（🔄旧题新角度）：雪球用户公开记录的转债轮动策略，2026年前4个月实盘收益+9.34%，4月单月跑出+4.52%，提供了中低频转债轮动的真实样本数据，可直接用于对比自研策略的因子权重
🔹 Apple Siri LLM重设计（🆕全新）：2026年6月Apple宣布基于LLM完整重设计Siri，强调尽可能在设备端完成推理以保护隐私——端侧AI推理的里程碑信号，与GGUF量化、本地部署方向共振

发现一：Sakana Fugu——当「编排」本身变成一个模型

背景：为什么这件事比一个新模型更重要

过去两年AI Agent框架爆发式增长（LangGraph、AutoGen、CrewAI、OpenAI Swarm……），但它们共享一个底层假设：编排逻辑是人类工程师写出来的。你定义哪些Agent、定义它们之间怎么传消息、定义何时合并结果——这些Workflow是你的代码。

这个范式的天花板很明显：

编排规则是死的：遇到没设计过的边界情况，Workflow要么失效要么卡住
设计成本高：一个复杂业务场景（比如「调研→分析→回测→报告」）的Workflow设计动辄几百行
无法跨任务泛化：给量化策略写的编排逻辑，换到内容生成场景要从头来

Sakana Fugu 提出了一个根本性的转向：把编排逻辑训练进模型本身。Fugu不是又一个被调用的「专家模型」，而是一个学会「在什么场景下调用谁、怎么组合结果」的「指挥官模型」。它的输出不是答案，而是「为了让用户得到答案，应该怎么编排现有模型」这一更高层决策。

技术细节：Trinity与Conductor的「模型协同」范式

Fugu的核心技术来自Sakana在ICLR 2026发表的两篇论文：

Trinity框架：一个「让多个已有模型协同工作来提升整体能力」的通用框架，核心思想是不再追求训练一个无所不能的monolithic大模型，而是把现有模型当成积木，通过协同产生>部分之和的能力
Conductor模型：一个「指挥家」模型，负责在Trinity框架内做调度决策——就像交响乐团的指挥不演奏任何乐器，但决定了谁在什么时候进入、音量如何平衡

Fugu把Conductor的训练成果工程化、产品化为可调用的API。从产品形态看：

维度	Fugu	Fugu Ultra
定位	标准编排	高性能编排
价格	$20/月	$200/月
API	OpenAI兼容	OpenAI兼容
声称性能	—	Coding/Reasoning/Scientific/Agentic四项基准比肩Anthropic Fable 5、Mythos Preview

值得注意的是，Fugu声称的「比肩」是组合多个模型后的整体能力，而非单模型能力——这正是Trinity范式的卖点：单体模型不需要最强，但协同后的整体可以很强。

行业共振：一周三发，编排已成主战场

单独看Fugu可能只是Sakana一家之言，但放在同一周的事件序列里就清晰了：

6月22日：Sakana Fugu 发布（生产级多Agent编排API）
6月23日：IBM 开源 CUGA（轻量级智能体框架，强调可组合性）
6月23日：微信 Agent小微灰度内测（巨头入局，C端编排）

三大事件在同一周齐发，且方向高度一致——多Agent编排已从学术研究进入产品化竞争阶段。这一点对任何正在构建Agent系统的人都重要：你今天做的「手动编排」工作，未来很可能被「编排器模型」接管。

对量化交易与Hermes的启示

对Hermes Agent（自托管量化Agent系统）的启示：

Hermes的delegate_task当前是手动编排模式——主Agent决定派几个子Agent、每个子Agent做什么、何时收口。Fugu给出了一个明确的演进方向：

当前 Hermes:  主Agent → (人工/规则定义) → 子Agent任务分配
未来方向:    主Agent → (学习型编排器) → 自适应子Agent调度

更具体地，可以考虑让主Agent学习一个**「任务复杂度→调度策略」的映射**：

简单查询（「今天某转债价格多少」）→ 直接回答，不调度
中等任务（「这只转债最近30天表现如何」）→ 单子Agent + 单数据源
复杂任务（「对比3个转债策略的历史回测并给出推荐」）→ 多子Agent并行 + 结果聚合

这个思路不需要立即引入Fugu，但可以在现有delegate_task上加一层**「任务复杂度评估→自动决定是否拆分」的启发式逻辑**，作为走向「学习型编排」的第一步。

对量化策略层的启示：Fugu的「多模型协同」范式和量化里的「多因子/多策略组合」是同构的——不追求单一最强策略，而是构建一个能自适应调度的策略组合器。这与下面要讲的转债轮动策略是同一种思想的不同实现层。

发现二：可转债轮动策略实盘+9.34%——中低频为什么能跑赢

背景：一份罕见的「真实实盘样本」

量化圈最稀缺的不是策略代码，而是有足够时间窗口的真实实盘记录。回测可以调参调到年化50%，但实盘的摩擦成本、流动性约束、心理偏差会把这些数字打回原形。

今天雪球上出现的一份公开记录提供了这样的样本：

策略类型：可转债量化轮动（双低/多因子排序，定期调仓）
时间窗口：2026年1月 — 2026年5月（前4个月）
累计收益：+9.34%
4月单月：+4.52%（明显的强势月）
5月：出现明确卖出信号（用户在雪球公开记录了离场动作）

这个样本的价值在于它验证了中低频转债轮动策略在2026年市场环境下的有效性——不是回测，是真实成交。

技术细节：可转债轮动的因子构成

中低频可转债轮动策略的核心是多因子打分排序。一个典型的打分函数：

import pandas as pd

def convertible_bond_score(df: pd.DataFrame) -> pd.Series:
    """
    可转债综合打分：分值越低越值得买入
    df 需包含: price(现价), premium_rate(转股溢价率%),
              volume(成交额万), remain_year(剩余年限), vol_20d(20日波动率)
    """
    # 1. 双低基础分（核心）：价格 + 溢价率*100
    base_score = df['price'] + 100 * df['premium_rate'] / 100

    # 2. 流动性惩罚：成交额过小的券难以建仓
    liquidity_penalty = (1e4 / df['volume']).clip(upper=5)

    # 3. 时间价值：剩余年限越短，期权价值越低（强赎风险）
    time_penalty = (5 - df['remain_year']).clip(lower=0) * 2

    # 4. 波动率因子（可选）：低波动券的套利空间更确定
    vol_bonus = df['vol_20d'].rank(pct=True) * (-3)  # 波动率越低，分值越优

    return base_score + liquidity_penalty + time_penalty + vol_bonus

# 选出打分最低的N只作为持仓
df['score'] = convertible_bond_score(df)
holdings = df.nsmallest(20, 'score')

这份实盘记录之所以能跑出+9.34%，关键不在公式多复杂，而在三个结构性优势：

优势	机制	为什么2026年有效
T+0交易	可转债支持当日回转，流动性结构友好	便于轮动调仓，降低冲击成本
下修博弈	正股持续下跌时，发行人可能下调转股价	提供额外的期权价值来源
强赎规则	正股涨幅触发强赎条款时有清晰退出信号	5月的「明确卖出信号」大概率来自这条

对自研S04策略的启示：因子对比与优化空间

我们已有的S04低价轮动策略与这份实盘记录可以做一次直接对比，重点看三个维度：

1. 因子构成对比

若实盘只用了纯双低（价格+溢价率），而S04已加入流动性、波动率等因子——S04理论上应该更稳健，但需对比最大回撤和单笔最大亏损
若实盘加入了我们S04没有的因子（如剩余期限、下修概率），可以考虑吸收

2. 调仓频率对比

中低频（周度/月度）轮动的优势是摩擦成本低，但会错过日内的快速轮动机会
值得测试：在S04基础上加一个**日内的「急涨止盈、急跌加仓」**触发性调仓，看是否能在不显著增加换手的前提下提升收益

3. 卖出信号体系

实盘记录里提到「5月出现明确卖出信号」，这通常是强赎条款触发或价格突破阈值。S04的卖出规则值得对照检查：

# 常见的可转债卖出信号优先级
def sell_signal(bond):
    # 1. 强赎触发（最高优先级，必须卖）
    if bond['price'] >= 130 and bond['strong_redeem_days'] >= 15:
        return 'FORCE_REDEEM'
    # 2. 双低分显著恶化（轮动调出）
    if bond['score_rank'] > 30:
        return 'ROTATION_OUT'
    # 3. 高价止盈
    if bond['price'] >= 160:
        return 'TAKE_PROFIT'
    return 'HOLD'

这份实盘样本给我们的最大价值不是模仿，而是校准——用它来检查S04在同样的市场窗口下表现如何，如果显著落后，就找到了明确的优化方向。

发现三：Apple Siri基于LLM重设计——端侧AI推理的里程碑

背景

2026年6月，Apple宣布对Siri进行完整重设计，整合前沿AI技术并在设备端进行大模型推理。这与过去「Siri调用云端API」的模式形成根本性转变。

值得关注的不是Apple又做了个语音助手，而是它背后的两个信号：

端侧推理可行性已被工程验证：Apple愿意在数亿设备上做端侧LLM推理，说明模型小型化、推理优化已达到消费级可用水平
隐私优先成为差异化卖点：Apple明确强调「尽可能在设备端完成推理，减少云端依赖」——这把端侧AI从「技术妥协」重新定义为「产品优势」

技术细节：端侧LLM推理的三道坎

端侧跑大模型，本质是在内存、功耗、延迟这个三角约束里做工程优化：

约束	典型值（手机）	解决技术
内存	6-12 GB（与系统共享）	INT4/INT8量化、KV Cache压缩
功耗	持续推理需控温	稀疏激活、动态计算图
延迟	用户感知阈值<200ms	推测解码、模型蒸馏

这与Hermes在本地部署量化模型（GGUF格式、Q4_K_M量化）面对的是同一组工程问题，只是约束更苛刻。Apple的验证意味着：这套技术栈已经能在消费级硬件上跑出可用体验。

对量化交易部署的启示

端侧AI推理的成熟，对量化交易有几个具体影响：

交易终端的本地化推理：未来在交易客户端（甚至手机App）上跑本地LLM做新闻解读、信号过滤，不再依赖云端，降低延迟、避免数据外泄
边缘风控：在本地设备上跑轻量风控模型，对异常订单做实时拦截——云端宕机也不影响风控
隐私敏感的策略迭代：涉及持仓、订单流等敏感数据的策略分析可以在本地完成，只把脱敏后的指标上传

对自托管量化Agent系统的启示很直接：继续坚定GGUF量化、本地推理的方向——这不再是「省钱」的妥协，而是行业主流趋势。

总结与行动清单

今天三个发现看似分属不同领域（Agent编排、量化策略、端侧部署），但它们指向同一个趋势：「单体最强」正在让位于「编排最优」。

Fugu 把编排能力训练进模型——不再追求更大的monolithic模型
可转债轮动 用多因子组合跑出+9.34%——不再依赖单一最优因子
Siri端侧推理 把模型推理从云端搬到设备——不再集中算力

基于今天的发现，建议关注的行动项：

🤖 为Hermes的delegate_task加一层「复杂度感知」启发式：让主Agent在调用delegate_task前先评估任务复杂度，简单任务直接回答，避免无谓的子Agent开销。这是迈向「学习型编排」的第一步，不需要引入Fugu也能落地
📊 用今天实盘+9.34%的样本校准S04策略：拉出S04在2026年1-5月的回测/实盘表现，与这份公开记录做对比。如果S04落后，重点检查因子构成（是否缺剩余期限、下修概率因子）和卖出信号体系
🔍 追踪Sakana的Trinity/Conductor论文：ICLR 2026论文公开后，深入研究其编排器训练方法。如果方法可复现，可以考虑在自托管场景用开源模型训练一个轻量版「编排器」
📱 在量化Agent的部署架构中预留「端侧推理」位置：现在不必上端侧，但在架构设计时把「本地推理适配层」抽象出来，未来Apple/Android端侧推理生态成熟时可以无缝接入
🗞️ 关注WSAI 2026（济南，6月24-26日）的论文公开：会议Keynote和论文后续会公开，值得追踪是否有与多Agent编排、端侧推理相关的新工作

本文基于 2026-06-24 Hermes Agent自我进化报告整理。每日持续追踪AI与量化交易领域的最新工具、策略和技术进展。文中涉及的可转债策略代码为教学示例，实盘使用前请务必独立回测并评估风险。