M1 · 出单工具箱 v1 建设计划

4 组 × 7 天 × 30 个出单工具

工具箱是 v3 的核心。论文 1 数据：从 100+ 成功案例蒸馏出工具后，正确率可从 30% 提升到 74%。本计划让 4 个组在 D1-D7 同步建设 30 个出单 SOP 工具，每个工具的 schema、来源、调用方式都写死。

00 / 定义

什么是"出单工具"？

工具 schema 长什么样

借鉴论文 1 的"推理工具箱"概念，出单工具 = 一个可被 LLM 调用的、解决单一出单子问题的 Python 函数。每个工具有明确的 inputs/outputs/前置条件/性能预期。

select_drama_by_audience SELECT · v1

功能：基于目标账号的粉丝画像，筛选最匹配的短剧候选。3 秒返回 Top 20。

def select_drama_by_audience(
    account_id: str,           # 目标账号 ID
    audience: dict,            # 粉丝画像 {age, region, interest}
    top_k: int = 20,            # 返回候选数
    filter_good_drama_only: bool = True  # 只用好剧
) -> list[DramaCandidate]:
    """
    蒸馏自 30 个高 CTR 案例的核心动作。
    论文 1 数据: 类似工具化方法让 NBA 任务正确率 30% → 74%。
    """
    # 实现略

工具注册位置：ai-loop-agent/src/tools/select_drama_by_audience.py

工具调用入口：LangGraph @tool 装饰器自动注册，LLM 通过 tool_name(input1=..., input2=...) 调用

工具沉淀：M4 沉淀期每天自动蒸馏 1-2 个新工具加入

01 / 分类

30 个出单工具分布（v1 目标）

选剧组

8 个

剪辑组

10 个

发布组

7 个

数据组

5 个

选剧组 8 个工具（v1 目标）

select_drama_by_audience — 按粉丝画像选剧（v1 必出）
select_drama_by_competitor — 抄竞对 TOP 100 在跑剧（v1 必出）
rank_drama_by_recency — 按时效性（新发布 24h 内）排序
match_drama_to_account — 内容×账号双向匹配评分
filter_drama_by_compliance — 合规标签筛查（涉政/涉黄/涉暴）
enrich_drama_metadata — 用 Qwen-VL 给剧补打 4 层标签
deduplicate_drama_pool — 候选去重（避免同剧发多账号）
forecast_drama_cvr — 预测单剧出单率（基于历史相似剧）

剪辑组 10 个工具（v1 目标）

ai_cut_v1 — 现有 AI Cut 流程（v1 必出）
ai_cut_v2_high_pre — 热点前置型剪辑（v1 必出）
manual_cut_mix — 人工混剪（晓雄 SOP 数字化）
vidu_drama_split — Vidu 短剧拆条
extract_golden_3s — 黄金 3 秒片段提取（论文 1 类比）
add_subtitle — 自动字幕生成（按语种）
apply_bgm — BGM 智能匹配（按剧情情绪）
check_video_duration — 时长合规检查（D5 子明已提）
deduplicate_video — 视频去重（"切两秒加维度"数字化）
ab_test_clip_style — 同剧 A/B 剪辑手法自动生成

发布组 7 个工具（v1 目标）

publish_video_to_platform — 平台一键发布（v1 必出，包装 ai-publish.py）
select_publish_time — 智能发布时间（按时区+历史最佳）
select_publish_account — 智能账号选择（基于账号健康度）
followup_publish_on_traffic — 流量跟发（30 分钟 > 阈值自动跟发）
scale_to_more_accounts — 爆款加码（单条爆 → 1h 全账号跟发 3-5 条）
batch_publish_scheduler — 批量定时发布（Celery 调度）
ab_test_publish_time — 发布时间 A/B 测试驱动

数据组 5 个工具（v1 目标）

fetch_account_metrics — T+0 数据抓取（包装 Codex 自爬）
crawl_competitor_top100 — 每 3h 竞对爬取
calculate_account_revenue — 单账号日收入实时计算
detect_zero_play — 零播检测 + 告警（v1 必出）
daily_dashboard_report — 每日 8:30 自动播报

02 / 责任人

30 个工具的 owner 分配

SELECT · 丁浩

8 个工具

选剧 SOP 数字化

CUT · 子明

10 个工具

剪辑 SOP 数字化

PUBLISH · Colin

7 个工具

发布 SOP 数字化

DATA · 博恒

5 个工具

数据 SOP 数字化

注：人员为基于 6/3 会议推断，需要 Frank 确认。如果人手不够，建议外部招 1 名"AI 训练师"（v3 §11 提到 Colin 转型后的角色）。

03 / 数据源

30 个工具蒸馏自哪些历史案例？

3 个核心数据源

数据源	规模	来源
BI 公共主页 TOP 100 出单达人	~ 500 案例	CEO 6/1 复盘会要求导出
6/3 抖音策略会议历史出单数据	~ 100 案例	小熊 / Colin 整理
5/12 + 5/14 复盘会数据	~ 50 案例	直接来自会议记录
合计	~ 650 案例	远超论文 1 的 100 案例门槛

充足的数据源：我们有 ~650 案例，论文 1 建议 100+ 就够。所以 v1 30 个工具的目标完全可以达到——关键是 D1-D7 必须启动案例拆解工作。

04 / 每日动作

D1 — D7 工具箱建设执行表

D1 数据准备日：650 案例入仓库 FOCUS · 数据是工具的燃料

选剧组

联系 BI 同学导出 1 万公共主页 → 上传飞书群
筛 TOP 100 出单达人 → top_100_drama.csv
从历史出单库里筛 100+ 成功案例（按"出单 ≥ 5 单/天"）

剪辑组

拉取 5/15 至今 AI Cut 任务 → ai-cut-history.xlsx
联系晓雄要"非 AI Cut"剪辑手法清单
从 5 个成功手法（ai-cut-v1/v2/混剪/vidu/手工）各筛 20 个成功案例

发布组

导出最近 90 天发布记录 publish-log.csv
筛高 CTR 发布时间段（前 20% 数据）
筛爆款加码成功案例（前 10% 数据）

数据组

建 toolbox-v1/ Git 仓库 + CI
建 case_pool/ 飞书多维表格，6 张 sheet
建 tool_template.py 模板（含 schema 校验）

D2 拆解日：4 组各拆 20+ 案例 FOCUS · 案例 → 核心动作

选剧组

用 Qwen-Max 拆 100 案例的"选剧核心动作"
提取高频核心动作（每案例 → 3-5 步）
输出 select_actions_v1.json

剪辑组

拆 100 剪辑案例的核心步骤
识别"黄金 3 秒"、"BGM 选择"、"去重"等高频动作
输出 cut_actions_v1.json

发布组

拆 80 发布案例的核心步骤
识别"选时区"、"选账号"、"跟发阈值"等动作
输出 publish_actions_v1.json

数据组

为 4 个 JSON 文件建 schema 校验
准备 toolbox_merger.py（下一步用）
Codex 自爬 T+0 跑通（v2 不变）

D3 合并日：4 组核心动作 → 工具候选 FOCUS · 分类合并 + 频次统计

选剧组

Qwen 分类合并 100 案例动作 → 15-20 候选工具
标记频次：高频 (≥20 案例) / 中频 (10-19) / 低频 (<10)
筛 8 个高频工具进入 v1

剪辑组

Qwen 合并 100 剪辑动作 → 20 候选
筛 10 个高频工具（含 5 必出）
输出 cut_tools_v1.json

发布组

Qwen 合并 80 发布动作 → 15 候选
筛 7 个高频工具
输出 publish_tools_v1.json

数据组

运行 toolbox_merger.py 自动合并
生成 v1 工具总表 tools_v1.yaml（30 个）
为每个工具分配 ID + 命名空间

D4 实现日：4 组开始写工具代码 FOCUS · skeleton 实现

选剧组

实现 select_drama_by_audience skeleton
实现 select_drama_by_competitor skeleton
接口先 mock，真实数据 D5 接入

剪辑组

实现 5 必出工具的 skeleton
ai_cut_v1/v2 包装现有 Codex 工具
manual_cut_mix 包装晓雄 SOP

发布组

实现 4 工具 skeleton
publish_video_to_platform 包装 ai-publish.py
followup_publish_on_traffic 跑通 30 分钟阈值逻辑

数据组

实现 5 工具 skeleton
fetch_account_metrics 接 T+0 Codex 自爬
detect_zero_play 飞书告警通道

D5 集成日：30 个工具串通 FOCUS · 工具间数据流

选剧组

8 工具全部联通（输入输出对接）
写 5 个 tool unit test

剪辑组

10 工具全部联通
跑一次 end-to-end 测试（输入剧 → 输出多版本视频）

发布组

7 工具全部联通
跑一次"全账号 24h 自动发布"小流量测试

数据组

5 工具全部联通
建 LangGraph 集成测试：选→剪→发→回

D6 验证日：拿 5 部真实剧跑完整 run FOCUS · 真实数据验证

选剧组

5 部剧跑 select_drama_by_audience
对比"工具推荐" vs "晓雄人工选" Top 5 重合度

剪辑组

5 部剧各跑 5 种剪辑手法
对比输出视频完播率（如果能测）

发布组

5 部 × 7 工具 = 35 条发布跑通
跟踪 24h 数据

数据组

所有数据回流到 case_pool
出第一份"工具箱 v1 健康度报告"

D7 发布日：30 工具 v1 上线 FOCUS · 全部交付

选剧组

8 工具 merge 到 main branch
提交"选剧组 v1 周报"

剪辑组

10 工具 merge 到 main branch
提交"剪辑组 v1 周报"

发布组

7 工具 merge 到 main branch
提交"发布组 v1 周报"

数据组

5 工具 merge + 工具总索引
提交"数据组 v1 周报"
发"AI Loop 工具箱 v1 上线" 公告

05 / 进度

D7 末的预期工具箱规模

选剧组

8 / 8

剪辑组

10 / 10

发布组

7 / 7

数据组

5 / 5

总进度

30 / 30

06 / 支持

需要 Frank 提供的支持（P0/P1/P2）

BI 系统 1 万公共主页数据导出权限

6/1 复盘会 CEO 已要求导出，但还没给具体数据。Frank 需要找 BI 同学（佩仪，归丁浩管）确认账号 / 表名 / 字段。

截止：D1 20:00 · 负责人：Frank · 协调对象：丁浩 / 佩仪

4 个组负责人最终确认

30 个工具的 owner 分配是基于 6/3 会议推断（丁浩/子明/Colin/博恒）。需要 Frank 确认：① 负责人是否还是这 4 位 ② 是否有 Colin 转型后的"AI 训练师"新角色 ③ 艳森团队是否参与

截止：D1 18:00 · 负责人：Frank

AI Loop Agent 项目仓库创建

30 个工具代码需要放在 ai-loop-agent/src/tools/。需要 Frank 决定：① 仓库路径（git.inbeidou.cn/ailab/ai-loop-agent 新建？还是 ai-loop 仓库内加 src/？）② 子明是否能 push ③ CI/CD 权限

截止：D1 18:00 · 负责人：Frank · 协调对象：玉（运维）

晓雄人工混剪 SOP 文档

5/12 会议提到晓雄"非 AI Cut"打法效果更好。需要晓雄把他的人工混剪流程写成可数字化 SOP（每个步骤 5-10 分钟级别），剪辑组 D2 才能拆解出 manual_cut_mix 工具。

截止：D1 22:00 · 负责人：Frank · 协调对象：晓雄

Qwen-Max API 调用权限

D2-D3 需要 Qwen-Max 做"分类合并"工具蒸馏。按 650 案例 × 5 千 token/案例 = 325 万 token ≈ ¥130（一次性）。需要 Frank 协调：① Qwen-Max Token ② 调用额度 ③ rate limit

截止：D2 10:00 · 负责人：Frank · 协调对象：阿里云销售（子明已对接过）

LangGraph @tool 注册规范决策

30 个工具的注册方式需要 Frank 拍板：① 工具名命名规范（snake_case？kebab-case？）② 工具输入输出 schema（pydantic？TypedDict？）③ 工具返回的错误格式（统一 vs 各组自定义？）

截止：D1 22:00 · 负责人：Frank · 可参考 ai-loop-Agent改造方案.html §4

工具箱 v1 完成奖励机制

5/12 会议承诺"6 月顺利出单+盈利 → 每人配 Mac Mini"。M1 工具箱 v1 是 6 月底出单的"先决条件"。建议 Frank 在 AI Loop 群公告：① D1-D7 工具箱 v1 完成的 4 个组 ② 每人额外奖励 ¥X（CEO 5/14 强调"找大牛花钱不要省"）

截止：D2 12:00 · 负责人：Frank

工具调用计费/Mac Mini/Token 额度

D5 之后 30 个工具会持续被 LLM 调用，Token 消耗会显著增加。需要 Frank 提前协调：① 个人 AI Token 月度上限（5/12 会议提到"人均 1000 元/月"）② 工具调用是否走 LangGraph 计费系统（5/12 会议"Token 方案 5/30 出"）

截止：D5 · 负责人：Frank