flowchart LR
subgraph track [1 追踪]
Cron[定时任务]
RSS[频道 RSS / API]
Meta[元数据登记]
end
subgraph extract [2 提取]
DL[下载音频或拉字幕]
SRT[字幕 / ASR]
Raw[raw 文稿存档]
end
subgraph process [3 梳理与总结]
Struct[结构化模板]
Tag[压力源 / 板块标签]
Link[关联 facts / ideas]
end
subgraph publish [4 发布]
Qmd[index.qmd 博文]
PR[Git 提交]
Site[quarto render → Pages]
end
Cron --> RSS --> Meta --> DL --> SRT --> Raw --> Struct --> Tag --> Link --> Qmd --> PR --> Site
YouTube 财经博主视频:追踪、提取、梳理与发布工作流
1. 在策略追踪体系中的定位
stragegy-tracing/youtuber/ 是 事实追踪(facts) 的重要补充来源,而非独立叙事:
| 板块 | 角色 |
|---|---|
| ideas | 策略思想、框架、工作流设计(本文档所在) |
| facts | 多来源客观事实摘录(公告、数据、新闻等) |
| youtuber | 财经博主对宏观/中观压力的 观点型事实:需标注来源、时间、博主立场 |
与 guide-tracing 中「板块运动 → 地壳变形 → 地震」类比一致,博主视频笔记应回答:
- 压力/摩擦来自哪里?(政策、流动性、地缘、行业结构等)
- 变形是否在累积?(情绪、估值、资金行为等中观信号)
- 与既有策略框架是否一致或冲突?(对照 ideas,不输出买卖建议)
2. 端到端工作流总览
原则:原始字幕只作存档与溯源;站点展示的是 经整理后的笔记,避免大段粘贴未校对 ASR 文本。
3. 分阶段说明
3.1 追踪(Track)
目标:在约定时间窗口内发现「新一期」视频,避免重复处理。
| 博主 | 频道 | 建议检查时间(北京时间) | 说明 |
|---|---|---|---|
| 小翠时政财经 | @cui_news/streams | 每日 05:00 起 | 以直播为主,前一日 stream 结束后字幕往往已可用 |
| LT视界 | @ltshijie/videos | 当日 08:00 起 | 约 07:00 上新,留 1 小时缓冲 |
实现选项(由简到繁):
- MVP:cron +
yt-dlp列出频道最新视频 ID,与本地registry.json比对 - 增强:YouTube Data API(需 API Key)或 RSS(若频道提供)
- 登记:每条新视频写入
stragegy-tracing/youtuber/_registry/videos.json(不进入 Quarto 渲染)
{
"video_id": "xxxxxxxx",
"channel": "cui_news",
"title": "……",
"published_at": "2026-05-28T…",
"slug": "2026-05-28-xiaocui",
"status": "pending|extracted|published"
}slug 规则:YYYY-MM-DD-{博主简称},同日多期则 YYYY-MM-DD-{博主}-l02。
3.2 提取与脱敏 (Extract & De-sensitize)
目标:获得客观、专业且符合合规要求的文字底稿。
政治中立与用词脱敏规范(强制执行): 在提取、摘要及博文编写过程中必须执行以下脱敏规则,以保持分析的专业性与中立性,降低合规风险:
核心脱敏词表(示例): | 原词 | 脱敏后建议用词 | 备注 | |:—|:—|:—| | 「中共」、「共党」 | 中国政府、官方、北京方面 | 保持行政/地理中立 | | 「习近平」 | 习近平主席、中方领导人 | 严禁使用「习大大」、「皇上」等昵称或贬义词 | | 「党魁」、「独裁」 | 主要领导人、核心决策层 | 描述权力结构而非进行定性评价 | | 「大清洗」、「镇压」 | 高层整顿、政策收紧、人事调整 | 转化为经济/政策影响描述 |
处理原则:
- 剔除情绪:原视频中博主的情绪化宣泄、主观谩骂或过度偏见应在摘要中予以剔除,仅保留其基于事实的推演逻辑。
- 事实导向:将博主的政治立场转化为「政策变动压力」或「地缘政治风险」进行记录。
- 文字洁净:最终生成的
index.qmd中不应出现任何非正式、具有讽刺意味或过度贬义的词汇。
| 步骤 | 工具 / 方式 | 产出 |
|---|---|---|
| 拉元数据 | yt-dlp --dump-json |
meta.json(标题、时长、上传时间、URL) |
| 字幕 | yt-dlp --write-subs --write-auto-subs --sub-lang zh-Hans,zh,en |
*.srt / *.vtt |
| 无字幕时 | Whisper 等 ASR(本地或 API) | transcript.srt |
| 归档 | 同目录存放,不提交超大媒体 | stragegy-tracing/youtuber/YYYY-MM-DD-slug/ |
建议目录结构(单期视频):
stragegy-tracing/youtuber/2026-05-28-xiaocui/
├── index.qmd # 发布用笔记(进 listing)
├── meta.json # 机器可读元数据(可选,gitignore 或提交二选一)
├── transcript.srt # 原始字幕(git 可选:大文件用 .gitignore)
└── notes.md # 处理过程草稿(可选,不渲染)
Red Lines(与 report-agent 一致):
- 不篡改博主原意;摘要须能回溯到 SRT 时间戳或段落
- 不输出具体投资建议(买卖点、目标价等)
3.3 梳理(Organize)
目标:把长视频变成可扫描、可对照策略框架的结构化笔记。
推荐 固定章节(写入 index.qmd 正文):
- 视频来源:标题、链接、发布日期、博主、时长
- 一句话摘要(≤ 80 字)
- 关键事实与数据指标(核心点:梳理视频中提到的具体数据、事实线索,增强事实参考价值)
- 核心论点(3–7 条 bullet)
- 市场压力 / 摩擦识别(对照策略框架)
- 宏观压力
- 中观 / 行业或资金层面
- 博主判断的「变形」或临近「释放」信号
- 与策略框架的对照(支持 / 中性 / 待验证 / 冲突)
- 可跟进事实线索(→ 建议转入
facts/条目或 DuckDB 待查列表) - 字幕与引用:链到同目录
transcript.srt;关键句注明大致时间
标签(YAML categories)要求:
- 数量:必须保持 正好 4 个。
- 内容:YouTube, 博主名, 以及 2 个与内容紧密相关的核心关键词。
3.4 总结(Summarize)
目标:生成 listing 所需的 title / description,并便于日后检索。
- title:
{博主} · {视频主题简写}(示例:小翠 · 5月28日直播要点) - description:一句话摘要 + 主要压力类型关键词
- date:视频 内容日期(直播日),非笔记撰写日
可由 Agent 根据 SRT 初稿生成,人工或 Brain 抽检 后定稿(V1 建议半自动)。
3.5 发布(Publish)
目标:进入 youtuber listing,并随 finance-portal 部署上线。
| 步骤 | 执行方 | 动作 |
|---|---|---|
| 1 | Mr.Reporter / 你 | 在 stragegy-tracing/youtuber/YYYY-MM-DD-slug/index.qmd 填写完整 YAML + 正文 |
| 2 | — | quarto render 本地或通过 CI 验证 |
| 3 | Git | main 推送 → GitHub Actions → Cloudflare Pages |
| 4 | memory | workspace-reporter-agent/memory/YYYY-MM-DD.md 记录发布时间与 video_id |
与 facts 的联动(可选 V2):
- 笔记中「可跟进事实」若已核实,在
stragegy-tracing/facts/YYYY-MM-DD-xxx/index.qmd另开短文,双向链接
4. 多 Agent 分工(与现有架构对齐)
| 角色 | 职责 |
|---|---|
| Mr.Data(或专用采集脚本) | 定时拉取新视频列表、下载字幕、更新 _registry |
| Mr.Analyst | 按模板做结构化摘要、压力源标注、与策略框架对照 |
| Mr.Reporter | 生成/润色 index.qmd、触发 render、记录 memory |
| Mr.Brain | 抽检质量、合并 PR、扩展博主清单 |
与 multi-agent 设计 一致:采集与分析解耦,发布走 Git + CI。
5. 定时任务建议(cron 草图)
# 小翠:北京时间 05:00(服务器需按 TZ=Asia/Shanghai 配置)
0 5 * * * /path/to/scripts/youtube_track.sh cui_news
# LT视界:北京时间 08:00
0 8 * * * /path/to/scripts/youtube_track.sh ltshijie
脚本职责:track → 若有新视频则 extract → 通知 Analyst/Reporter(邮件或 OpenClaw 任务),不自动 push 未审核正文。
6. 落地方案分期
Phase 0 — 手工 SOP(当前,1–2 周)
Phase 1 — 半自动(2–4 周)
Phase 2 — 与 facts 闭环(1–2 月)
Phase 3 — 质量与扩展(按需)
7. index.qmd 博文模板(复制即用)
---
title: "{博主} · {主题简写}"
author: "Mr. Analyst"
date: "YYYY-MM-DD"
description: "{一句话摘要}"
categories: [YouTube, {博主}, {关键词1}, {关键词2}] # 必须保持 4 个
---
## 视频来源
- **博主**:
- **标题**:
- **链接**:
- **发布日期**:
- **字幕**:[transcript.srt](transcript.srt)
## 一句话摘要
## 关键事实与数据指标
-
## 核心论点
1.
2.
3.
## 市场压力与「板块运动」式变形
### 宏观 / 结构性压力
### 中观信号
## 与策略框架对照
| 维度 | 博主观点 | 与框架关系 |
|------|----------|------------|
| 压力识别 | | 支持 / 中性 / 待验证 / 冲突 |
| 变形累积 | | |
| 潜在释放 | | |
## 可跟进事实(→ facts)
-
## 备注
- 不提供投资建议;内容为观点整理与策略对照。8. 成功标准(Definition of Done)
一期视频处理完成当且仅当:
_registry(或等效清单)中状态为publishedstragegy-tracing/youtuber/YYYY-MM-DD-slug/index.qmd可在 listing 中展示- 含可点击视频链接与(如有)字幕文件
- 至少完成「压力识别 + 框架对照」两节,非空占位
- CI
quarto render通过