工具箱是 v3 的核心。论文 1 数据:从 100+ 成功案例蒸馏出工具后,正确率可从 30% 提升到 74%。本计划让 4 个组在 D1-D7 同步建设 30 个出单 SOP 工具,每个工具的 schema、来源、调用方式都写死。
借鉴论文 1 的"推理工具箱"概念,出单工具 = 一个可被 LLM 调用的、解决单一出单子问题的 Python 函数。每个工具有明确的 inputs/outputs/前置条件/性能预期。
def select_drama_by_audience( account_id: str, # 目标账号 ID audience: dict, # 粉丝画像 {age, region, interest} top_k: int = 20, # 返回候选数 filter_good_drama_only: bool = True # 只用好剧 ) -> list[DramaCandidate]: """ 蒸馏自 30 个高 CTR 案例的核心动作。 论文 1 数据: 类似工具化方法让 NBA 任务正确率 30% → 74%。 """ # 实现略
工具注册位置:ai-loop-agent/src/tools/select_drama_by_audience.py
工具调用入口:LangGraph @tool 装饰器自动注册,LLM 通过 tool_name(input1=..., input2=...) 调用
工具沉淀:M4 沉淀期每天自动蒸馏 1-2 个新工具加入
select_drama_by_audience — 按粉丝画像选剧(v1 必出)select_drama_by_competitor — 抄竞对 TOP 100 在跑剧(v1 必出)rank_drama_by_recency — 按时效性(新发布 24h 内)排序match_drama_to_account — 内容×账号双向匹配评分filter_drama_by_compliance — 合规标签筛查(涉政/涉黄/涉暴)enrich_drama_metadata — 用 Qwen-VL 给剧补打 4 层标签deduplicate_drama_pool — 候选去重(避免同剧发多账号)forecast_drama_cvr — 预测单剧出单率(基于历史相似剧)ai_cut_v1 — 现有 AI Cut 流程(v1 必出)ai_cut_v2_high_pre — 热点前置型剪辑(v1 必出)manual_cut_mix — 人工混剪(晓雄 SOP 数字化)vidu_drama_split — Vidu 短剧拆条extract_golden_3s — 黄金 3 秒片段提取(论文 1 类比)add_subtitle — 自动字幕生成(按语种)apply_bgm — BGM 智能匹配(按剧情情绪)check_video_duration — 时长合规检查(D5 子明已提)deduplicate_video — 视频去重("切两秒加维度"数字化)ab_test_clip_style — 同剧 A/B 剪辑手法自动生成publish_video_to_platform — 平台一键发布(v1 必出,包装 ai-publish.py)select_publish_time — 智能发布时间(按时区+历史最佳)select_publish_account — 智能账号选择(基于账号健康度)followup_publish_on_traffic — 流量跟发(30 分钟 > 阈值自动跟发)scale_to_more_accounts — 爆款加码(单条爆 → 1h 全账号跟发 3-5 条)batch_publish_scheduler — 批量定时发布(Celery 调度)ab_test_publish_time — 发布时间 A/B 测试驱动fetch_account_metrics — T+0 数据抓取(包装 Codex 自爬)crawl_competitor_top100 — 每 3h 竞对爬取calculate_account_revenue — 单账号日收入实时计算detect_zero_play — 零播检测 + 告警(v1 必出)daily_dashboard_report — 每日 8:30 自动播报注:人员为基于 6/3 会议推断,需要 Frank 确认。如果人手不够,建议外部招 1 名"AI 训练师"(v3 §11 提到 Colin 转型后的角色)。
| 数据源 | 规模 | 来源 |
|---|---|---|
| BI 公共主页 TOP 100 出单达人 | ~ 500 案例 | CEO 6/1 复盘会要求导出 |
| 6/3 抖音策略会议历史出单数据 | ~ 100 案例 | 小熊 / Colin 整理 |
| 5/12 + 5/14 复盘会数据 | ~ 50 案例 | 直接来自会议记录 |
| 合计 | ~ 650 案例 | 远超论文 1 的 100 案例门槛 |
充足的数据源:我们有 ~650 案例,论文 1 建议 100+ 就够。所以 v1 30 个工具的目标完全可以达到——关键是 D1-D7 必须启动案例拆解工作。
top_100_drama.csvai-cut-history.xlsxpublish-log.csvtoolbox-v1/ Git 仓库 + CIcase_pool/ 飞书多维表格,6 张 sheettool_template.py 模板(含 schema 校验)select_actions_v1.jsoncut_actions_v1.jsonpublish_actions_v1.jsontoolbox_merger.py(下一步用)cut_tools_v1.jsonpublish_tools_v1.jsontoolbox_merger.py 自动合并tools_v1.yaml(30 个)select_drama_by_audience skeletonselect_drama_by_competitor skeleton6/1 复盘会 CEO 已要求导出,但还没给具体数据。Frank 需要找 BI 同学(佩仪,归丁浩管)确认账号 / 表名 / 字段。
截止:D1 20:00 · 负责人:Frank · 协调对象:丁浩 / 佩仪
30 个工具的 owner 分配是基于 6/3 会议推断(丁浩/子明/Colin/博恒)。需要 Frank 确认:① 负责人是否还是这 4 位 ② 是否有 Colin 转型后的"AI 训练师"新角色 ③ 艳森团队是否参与
截止:D1 18:00 · 负责人:Frank
30 个工具代码需要放在 ai-loop-agent/src/tools/。需要 Frank 决定:① 仓库路径(git.inbeidou.cn/ailab/ai-loop-agent 新建?还是 ai-loop 仓库内加 src/?)② 子明是否能 push ③ CI/CD 权限
截止:D1 18:00 · 负责人:Frank · 协调对象:玉(运维)
5/12 会议提到晓雄"非 AI Cut"打法效果更好。需要晓雄把他的人工混剪流程写成可数字化 SOP(每个步骤 5-10 分钟级别),剪辑组 D2 才能拆解出 manual_cut_mix 工具。
截止:D1 22:00 · 负责人:Frank · 协调对象:晓雄
D2-D3 需要 Qwen-Max 做"分类合并"工具蒸馏。按 650 案例 × 5 千 token/案例 = 325 万 token ≈ ¥130(一次性)。需要 Frank 协调:① Qwen-Max Token ② 调用额度 ③ rate limit
截止:D2 10:00 · 负责人:Frank · 协调对象:阿里云销售(子明已对接过)
30 个工具的注册方式需要 Frank 拍板:① 工具名命名规范(snake_case?kebab-case?)② 工具输入输出 schema(pydantic?TypedDict?)③ 工具返回的错误格式(统一 vs 各组自定义?)
截止:D1 22:00 · 负责人:Frank · 可参考 ai-loop-Agent改造方案.html §4
5/12 会议承诺"6 月顺利出单+盈利 → 每人配 Mac Mini"。M1 工具箱 v1 是 6 月底出单的"先决条件"。建议 Frank 在 AI Loop 群公告:① D1-D7 工具箱 v1 完成的 4 个组 ② 每人额外奖励 ¥X(CEO 5/14 强调"找大牛花钱不要省")
截止:D2 12:00 · 负责人:Frank
D5 之后 30 个工具会持续被 LLM 调用,Token 消耗会显著增加。需要 Frank 提前协调:① 个人 AI Token 月度上限(5/12 会议提到"人均 1000 元/月")② 工具调用是否走 LangGraph 计费系统(5/12 会议"Token 方案 5/30 出")
截止:D5 · 负责人:Frank