云聪交易体系自动化构建方案
从视频视频到结构化交易知识库
Workflow
Trading
course00
1. 目标概述
基于云聪老师的 13 个买点系列视频,通过多 Agent 协作流,自动化提取、精炼并发布结构化的交易理论体系。最终成果将以 Quarto 博客文章形式整合进 finance-portal 的技术看板(tech/)。
2. 角色分工 (Agent Responsibility Matrix)
| Agent | 职责 | 关键技术栈 |
|---|---|---|
| Mr. Brain | 总指挥:方案设计、任务调度、多 Agent 协作同步 | OpenClaw sessions_spawn |
| Mr. Analyst | 知识处理:视频音频提取、ASR 字幕纠错、内容结构化 | minimax-m2.7, ffmpeg/whisper |
| Mr. Reporter | 发布运维:符合 Quarto Listing Page 规范的文档组织与发布 | Quarto, Git, GitHub Actions |
3. 技术栈与实现过程
阶段一:资源初始化 (Resource Discovery)
- 输入:
workspace-analisist-agent/云聪-交易体系/*.mp4 - 动作: 扫描目录,生成任务清单。确保处理逻辑支持 UTF-8 路径名。
阶段二:字幕智能提取与优化 (AI-Powered ASR)
- 音频分离: 使用
ffmpeg提取音频。 - 基准识别: 使用
whisper或其他 ASR 工具生成原始文本。 - 模型微调 (Analyst): 调用 minimax-m2.7 模型。
- 核心优势: 利用付费账户的高 token 配额,进行深度语意理解与金融术语校对。
- 逻辑: 修正“买点、回撤、突破、假突破”等交易术语。
阶段三:符合规范的内容发布 (Standardized Publishing)
- 组织形式: 遵循 Quarto Listing Page 规范。
- 目录结构: 每篇博文必须位于独立文件夹,格式为
YYYY-MM-DD-slug/。 - 正文命名: 文件夹内主文档统一命名为
index.qmd。 - 附件管理: 视频封面、提取的图片或资源文件放置于同一文件夹内。
阶段四:部署 (Deployment)
Mr. Reporter负责维护finance-portal仓库,通过 Git 提交触发 GHA 构建。
5. 视频内容博文(Video-SRT)编写规范 v1.1
基于 17 个视频博文的实践经验,现确立以下编写标准,以确保知识库的一致性与专业性:
5.1 基础信息布局
- YAML Title: 必须与视频原名保持一致(例如:
title: "课时6-2B买点案例")。 - 来源声明: 在正文最上方明确标注
视频来源:云聪交易体系:[视频名称]。 - 语言标准: 强制使用简体中文。博文内容及附件文件名中不得包含繁体字,需通过自动化脚本进行简繁转换检查。
5.2 结构化正文要求
- ## 视频内容总结:
- 字数控制在 300 字左右。
- 采用段落形式呈现,概括视频中的核心逻辑(如入场点、止损位、周期选择)。
- ## 详细文稿内容:
- 采用三级标题(###)对长文稿进行逻辑分段(如:### 核心讲解片段一)。
- 确保文稿经过语意校对,剔除 ASR 识别产生的口语冗余与术语错误。
- ## 字幕资源:
- 提供 SRT 字幕文件的下载链接。
- 路径规范: 必须使用相对路径链接,格式为
[文件名.srt](文件名.srt),方便本地与在线预览。
5.3 实践经验与注意事项
- 编码一致性: 严格执行 UTF-8 编码准则。所有 PowerShell 操作、Python 脚本处理、以及 Git 提交均需显式指定 UTF-8,以防止中文字符乱码。
- 简繁转换: 在自动化批量生成过程中,Agent 应内置简繁体转换逻辑(或通过 Python
zhconv等逻辑实现),防止繁体字混入。 - 内容粒度: 详细文稿应覆盖视频 95% 以上的有效信息,特别是视频中提到的具体日期案例(如:特斯拉 2023 年 1 月 5 日案例)。
- 自动化清理: 在提交 Git 前,需检查并清理博文中的重复内容(如重复的“视频来源”行),确保最终生成的 HTML 预览效果完美。