云聪交易体系自动化构建方案

从视频视频到结构化交易知识库

Workflow
Trading
course00
Author

Mr.Brain

Published

April 21, 2026

1. 目标概述

基于云聪老师的 13 个买点系列视频,通过多 Agent 协作流,自动化提取、精炼并发布结构化的交易理论体系。最终成果将以 Quarto 博客文章形式整合进 finance-portal 的技术看板(tech/)。

2. 角色分工 (Agent Responsibility Matrix)

Agent 职责 关键技术栈
Mr. Brain 总指挥:方案设计、任务调度、多 Agent 协作同步 OpenClaw sessions_spawn
Mr. Analyst 知识处理:视频音频提取、ASR 字幕纠错、内容结构化 minimax-m2.7, ffmpeg/whisper
Mr. Reporter 发布运维:符合 Quarto Listing Page 规范的文档组织与发布 Quarto, Git, GitHub Actions

3. 技术栈与实现过程

阶段一:资源初始化 (Resource Discovery)

  • 输入: workspace-analisist-agent/云聪-交易体系/*.mp4
  • 动作: 扫描目录,生成任务清单。确保处理逻辑支持 UTF-8 路径名。

阶段二:字幕智能提取与优化 (AI-Powered ASR)

  1. 音频分离: 使用 ffmpeg 提取音频。
  2. 基准识别: 使用 whisper 或其他 ASR 工具生成原始文本。
  3. 模型微调 (Analyst): 调用 minimax-m2.7 模型。
    • 核心优势: 利用付费账户的高 token 配额,进行深度语意理解与金融术语校对。
    • 逻辑: 修正“买点、回撤、突破、假突破”等交易术语。

阶段三:符合规范的内容发布 (Standardized Publishing)

  • 组织形式: 遵循 Quarto Listing Page 规范。
  • 目录结构: 每篇博文必须位于独立文件夹,格式为 YYYY-MM-DD-slug/
  • 正文命名: 文件夹内主文档统一命名为 index.qmd
  • 附件管理: 视频封面、提取的图片或资源文件放置于同一文件夹内。

阶段四:部署 (Deployment)

  • Mr. Reporter 负责维护 finance-portal 仓库,通过 Git 提交触发 GHA 构建。

5. 视频内容博文(Video-SRT)编写规范 v1.1

基于 17 个视频博文的实践经验,现确立以下编写标准,以确保知识库的一致性与专业性:

5.1 基础信息布局

  • YAML Title: 必须与视频原名保持一致(例如:title: "课时6-2B买点案例")。
  • 来源声明: 在正文最上方明确标注 视频来源:云聪交易体系:[视频名称]
  • 语言标准: 强制使用简体中文。博文内容及附件文件名中不得包含繁体字,需通过自动化脚本进行简繁转换检查。

5.2 结构化正文要求

  • ## 视频内容总结:
    • 字数控制在 300 字左右。
    • 采用段落形式呈现,概括视频中的核心逻辑(如入场点、止损位、周期选择)。
  • ## 详细文稿内容:
    • 采用三级标题(###)对长文稿进行逻辑分段(如:### 核心讲解片段一)。
    • 确保文稿经过语意校对,剔除 ASR 识别产生的口语冗余与术语错误。
  • ## 字幕资源:
    • 提供 SRT 字幕文件的下载链接。
    • 路径规范: 必须使用相对路径链接,格式为 [文件名.srt](文件名.srt),方便本地与在线预览。

5.3 实践经验与注意事项

  1. 编码一致性: 严格执行 UTF-8 编码准则。所有 PowerShell 操作、Python 脚本处理、以及 Git 提交均需显式指定 UTF-8,以防止中文字符乱码。
  2. 简繁转换: 在自动化批量生成过程中,Agent 应内置简繁体转换逻辑(或通过 Python zhconv 等逻辑实现),防止繁体字混入。
  3. 内容粒度: 详细文稿应覆盖视频 95% 以上的有效信息,特别是视频中提到的具体日期案例(如:特斯拉 2023 年 1 月 5 日案例)。
  4. 自动化清理: 在提交 Git 前,需检查并清理博文中的重复内容(如重复的“视频来源”行),确保最终生成的 HTML 预览效果完美。