M1 · 出单工具箱 v1 建设计划

4 组 × 7 天 × 30 个出单工具

工具箱是 v3 的核心。论文 1 数据:从 100+ 成功案例蒸馏出工具后,正确率可从 30% 提升到 74%。本计划让 4 个组在 D1-D7 同步建设 30 个出单 SOP 工具,每个工具的 schema、来源、调用方式都写死。

00 / 定义

什么是"出单工具"?

工具 schema 长什么样

借鉴论文 1 的"推理工具箱"概念,出单工具 = 一个可被 LLM 调用的、解决单一出单子问题的 Python 函数。每个工具有明确的 inputs/outputs/前置条件/性能预期。

select_drama_by_audience SELECT · v1
功能:基于目标账号的粉丝画像,筛选最匹配的短剧候选。3 秒返回 Top 20。
def select_drama_by_audience(
    account_id: str,           # 目标账号 ID
    audience: dict,            # 粉丝画像 {age, region, interest}
    top_k: int = 20,            # 返回候选数
    filter_good_drama_only: bool = True  # 只用好剧
) -> list[DramaCandidate]:
    """
    蒸馏自 30 个高 CTR 案例的核心动作。
    论文 1 数据: 类似工具化方法让 NBA 任务正确率 30% → 74%。
    """
    # 实现略

工具注册位置:ai-loop-agent/src/tools/select_drama_by_audience.py

工具调用入口:LangGraph @tool 装饰器自动注册,LLM 通过 tool_name(input1=..., input2=...) 调用

工具沉淀:M4 沉淀期每天自动蒸馏 1-2 个新工具加入

01 / 分类

30 个出单工具分布(v1 目标)

选剧组
8
剪辑组
10
发布组
7
数据组
5

选剧组 8 个工具(v1 目标)

  1. select_drama_by_audience — 按粉丝画像选剧(v1 必出)
  2. select_drama_by_competitor — 抄竞对 TOP 100 在跑剧(v1 必出)
  3. rank_drama_by_recency — 按时效性(新发布 24h 内)排序
  4. match_drama_to_account — 内容×账号双向匹配评分
  5. filter_drama_by_compliance — 合规标签筛查(涉政/涉黄/涉暴)
  6. enrich_drama_metadata — 用 Qwen-VL 给剧补打 4 层标签
  7. deduplicate_drama_pool — 候选去重(避免同剧发多账号)
  8. forecast_drama_cvr — 预测单剧出单率(基于历史相似剧)

剪辑组 10 个工具(v1 目标)

  1. ai_cut_v1 — 现有 AI Cut 流程(v1 必出)
  2. ai_cut_v2_high_pre — 热点前置型剪辑(v1 必出)
  3. manual_cut_mix — 人工混剪(晓雄 SOP 数字化)
  4. vidu_drama_split — Vidu 短剧拆条
  5. extract_golden_3s — 黄金 3 秒片段提取(论文 1 类比)
  6. add_subtitle — 自动字幕生成(按语种)
  7. apply_bgm — BGM 智能匹配(按剧情情绪)
  8. check_video_duration — 时长合规检查(D5 子明已提)
  9. deduplicate_video — 视频去重("切两秒加维度"数字化)
  10. ab_test_clip_style — 同剧 A/B 剪辑手法自动生成

发布组 7 个工具(v1 目标)

  1. publish_video_to_platform — 平台一键发布(v1 必出,包装 ai-publish.py)
  2. select_publish_time — 智能发布时间(按时区+历史最佳)
  3. select_publish_account — 智能账号选择(基于账号健康度)
  4. followup_publish_on_traffic — 流量跟发(30 分钟 > 阈值自动跟发)
  5. scale_to_more_accounts — 爆款加码(单条爆 → 1h 全账号跟发 3-5 条)
  6. batch_publish_scheduler — 批量定时发布(Celery 调度)
  7. ab_test_publish_time — 发布时间 A/B 测试驱动

数据组 5 个工具(v1 目标)

  1. fetch_account_metrics — T+0 数据抓取(包装 Codex 自爬)
  2. crawl_competitor_top100 — 每 3h 竞对爬取
  3. calculate_account_revenue — 单账号日收入实时计算
  4. detect_zero_play — 零播检测 + 告警(v1 必出)
  5. daily_dashboard_report — 每日 8:30 自动播报
02 / 责任人

30 个工具的 owner 分配

SELECT · 丁浩
8 个工具
选剧 SOP 数字化
CUT · 子明
10 个工具
剪辑 SOP 数字化
PUBLISH · Colin
7 个工具
发布 SOP 数字化
DATA · 博恒
5 个工具
数据 SOP 数字化

注:人员为基于 6/3 会议推断,需要 Frank 确认。如果人手不够,建议外部招 1 名"AI 训练师"(v3 §11 提到 Colin 转型后的角色)。

03 / 数据源

30 个工具蒸馏自哪些历史案例?

3 个核心数据源

数据源 规模 来源
BI 公共主页 TOP 100 出单达人 ~ 500 案例 CEO 6/1 复盘会要求导出
6/3 抖音策略会议历史出单数据 ~ 100 案例 小熊 / Colin 整理
5/12 + 5/14 复盘会数据 ~ 50 案例 直接来自会议记录
合计 ~ 650 案例 远超论文 1 的 100 案例门槛

充足的数据源:我们有 ~650 案例,论文 1 建议 100+ 就够。所以 v1 30 个工具的目标完全可以达到——关键是 D1-D7 必须启动案例拆解工作。

04 / 每日动作

D1 — D7 工具箱建设执行表

D1 数据准备日:650 案例入仓库 FOCUS · 数据是工具的燃料
选剧组
  • 联系 BI 同学导出 1 万公共主页 → 上传飞书群
  • 筛 TOP 100 出单达人 → top_100_drama.csv
  • 从历史出单库里筛 100+ 成功案例(按"出单 ≥ 5 单/天")
剪辑组
  • 拉取 5/15 至今 AI Cut 任务 → ai-cut-history.xlsx
  • 联系晓雄要"非 AI Cut"剪辑手法清单
  • 从 5 个成功手法(ai-cut-v1/v2/混剪/vidu/手工)各筛 20 个成功案例
发布组
  • 导出最近 90 天发布记录 publish-log.csv
  • 筛高 CTR 发布时间段(前 20% 数据)
  • 筛爆款加码成功案例(前 10% 数据)
数据组
  • toolbox-v1/ Git 仓库 + CI
  • case_pool/ 飞书多维表格,6 张 sheet
  • tool_template.py 模板(含 schema 校验)
D2 拆解日:4 组各拆 20+ 案例 FOCUS · 案例 → 核心动作
选剧组
  • 用 Qwen-Max 拆 100 案例的"选剧核心动作"
  • 提取高频核心动作(每案例 → 3-5 步)
  • 输出 select_actions_v1.json
剪辑组
  • 拆 100 剪辑案例的核心步骤
  • 识别"黄金 3 秒"、"BGM 选择"、"去重"等高频动作
  • 输出 cut_actions_v1.json
发布组
  • 拆 80 发布案例的核心步骤
  • 识别"选时区"、"选账号"、"跟发阈值"等动作
  • 输出 publish_actions_v1.json
数据组
  • 为 4 个 JSON 文件建 schema 校验
  • 准备 toolbox_merger.py(下一步用)
  • Codex 自爬 T+0 跑通(v2 不变)
D3 合并日:4 组核心动作 → 工具候选 FOCUS · 分类合并 + 频次统计
选剧组
  • Qwen 分类合并 100 案例动作 → 15-20 候选工具
  • 标记频次:高频 (≥20 案例) / 中频 (10-19) / 低频 (<10)
  • 筛 8 个高频工具进入 v1
剪辑组
  • Qwen 合并 100 剪辑动作 → 20 候选
  • 筛 10 个高频工具(含 5 必出)
  • 输出 cut_tools_v1.json
发布组
  • Qwen 合并 80 发布动作 → 15 候选
  • 筛 7 个高频工具
  • 输出 publish_tools_v1.json
数据组
  • 运行 toolbox_merger.py 自动合并
  • 生成 v1 工具总表 tools_v1.yaml(30 个)
  • 为每个工具分配 ID + 命名空间
D4 实现日:4 组开始写工具代码 FOCUS · skeleton 实现
选剧组
  • 实现 select_drama_by_audience skeleton
  • 实现 select_drama_by_competitor skeleton
  • 接口先 mock,真实数据 D5 接入
剪辑组
  • 实现 5 必出工具的 skeleton
  • ai_cut_v1/v2 包装现有 Codex 工具
  • manual_cut_mix 包装晓雄 SOP
发布组
  • 实现 4 工具 skeleton
  • publish_video_to_platform 包装 ai-publish.py
  • followup_publish_on_traffic 跑通 30 分钟阈值逻辑
数据组
  • 实现 5 工具 skeleton
  • fetch_account_metrics 接 T+0 Codex 自爬
  • detect_zero_play 飞书告警通道
D5 集成日:30 个工具串通 FOCUS · 工具间数据流
选剧组
  • 8 工具全部联通(输入输出对接)
  • 写 5 个 tool unit test
剪辑组
  • 10 工具全部联通
  • 跑一次 end-to-end 测试(输入剧 → 输出多版本视频)
发布组
  • 7 工具全部联通
  • 跑一次"全账号 24h 自动发布"小流量测试
数据组
  • 5 工具全部联通
  • 建 LangGraph 集成测试:选→剪→发→回
D6 验证日:拿 5 部真实剧跑完整 run FOCUS · 真实数据验证
选剧组
  • 5 部剧跑 select_drama_by_audience
  • 对比"工具推荐" vs "晓雄人工选" Top 5 重合度
剪辑组
  • 5 部剧各跑 5 种剪辑手法
  • 对比输出视频完播率(如果能测)
发布组
  • 5 部 × 7 工具 = 35 条发布跑通
  • 跟踪 24h 数据
数据组
  • 所有数据回流到 case_pool
  • 出第一份"工具箱 v1 健康度报告"
D7 发布日:30 工具 v1 上线 FOCUS · 全部交付
选剧组
  • 8 工具 merge 到 main branch
  • 提交"选剧组 v1 周报"
剪辑组
  • 10 工具 merge 到 main branch
  • 提交"剪辑组 v1 周报"
发布组
  • 7 工具 merge 到 main branch
  • 提交"发布组 v1 周报"
数据组
  • 5 工具 merge + 工具总索引
  • 提交"数据组 v1 周报"
  • 发"AI Loop 工具箱 v1 上线" 公告
05 / 进度

D7 末的预期工具箱规模

选剧组
8 / 8
剪辑组
10 / 10
发布组
7 / 7
数据组
5 / 5
总进度
30 / 30
06 / 支持

需要 Frank 提供的支持(P0/P1/P2)

P0
BI 系统 1 万公共主页数据导出权限

6/1 复盘会 CEO 已要求导出,但还没给具体数据。Frank 需要找 BI 同学(佩仪,归丁浩管)确认账号 / 表名 / 字段。

截止:D1 20:00 · 负责人:Frank · 协调对象:丁浩 / 佩仪

P0
4 个组负责人最终确认

30 个工具的 owner 分配是基于 6/3 会议推断(丁浩/子明/Colin/博恒)。需要 Frank 确认:① 负责人是否还是这 4 位 ② 是否有 Colin 转型后的"AI 训练师"新角色 ③ 艳森团队是否参与

截止:D1 18:00 · 负责人:Frank

P0
AI Loop Agent 项目仓库创建

30 个工具代码需要放在 ai-loop-agent/src/tools/。需要 Frank 决定:① 仓库路径(git.inbeidou.cn/ailab/ai-loop-agent 新建?还是 ai-loop 仓库内加 src/?)② 子明是否能 push ③ CI/CD 权限

截止:D1 18:00 · 负责人:Frank · 协调对象:玉(运维)

P1
晓雄人工混剪 SOP 文档

5/12 会议提到晓雄"非 AI Cut"打法效果更好。需要晓雄把他的人工混剪流程写成可数字化 SOP(每个步骤 5-10 分钟级别),剪辑组 D2 才能拆解出 manual_cut_mix 工具。

截止:D1 22:00 · 负责人:Frank · 协调对象:晓雄

P1
Qwen-Max API 调用权限

D2-D3 需要 Qwen-Max 做"分类合并"工具蒸馏。按 650 案例 × 5 千 token/案例 = 325 万 token ≈ ¥130(一次性)。需要 Frank 协调:① Qwen-Max Token ② 调用额度 ③ rate limit

截止:D2 10:00 · 负责人:Frank · 协调对象:阿里云销售(子明已对接过)

P1
LangGraph @tool 注册规范决策

30 个工具的注册方式需要 Frank 拍板:① 工具名命名规范(snake_case?kebab-case?)② 工具输入输出 schema(pydantic?TypedDict?)③ 工具返回的错误格式(统一 vs 各组自定义?)

截止:D1 22:00 · 负责人:Frank · 可参考 ai-loop-Agent改造方案.html §4

P2
工具箱 v1 完成奖励机制

5/12 会议承诺"6 月顺利出单+盈利 → 每人配 Mac Mini"。M1 工具箱 v1 是 6 月底出单的"先决条件"。建议 Frank 在 AI Loop 群公告:① D1-D7 工具箱 v1 完成的 4 个组 ② 每人额外奖励 ¥X(CEO 5/14 强调"找大牛花钱不要省")

截止:D2 12:00 · 负责人:Frank

P2
工具调用计费/Mac Mini/Token 额度

D5 之后 30 个工具会持续被 LLM 调用,Token 消耗会显著增加。需要 Frank 提前协调:① 个人 AI Token 月度上限(5/12 会议提到"人均 1000 元/月")② 工具调用是否走 LangGraph 计费系统(5/12 会议"Token 方案 5/30 出")

截止:D5 · 负责人:Frank