之前有粉丝私信问过我,能不能把看B站视频的笔记自动化一下。我当时就做了个Skill,现在把它开源出来。
这个Skill的作用是:给它一个B站链接,它会自动把视频的音频下载下来,丢给AI转成文字,再用另一个AI生成总结,最后把转写的完整原文和总结一起存进Obsidian的收集箱。
整个过程不需要你手动操作,等一会就好了。
涉及的工具
这个Skill跑起来需要几个东西配合。
yt-dlp
这是一个命令行工具,专门用来下载各种视频平台的音视频。Skill会调用它把B站视频的音频流下载成M4A文件。
macOS安装(推荐):
brew install yt-dlp
没有Homebrew的话也可以用pip安装:
pip install yt-dlp
ffmpeg
yt-dlp在处理音频的时候依赖ffmpeg,没装的话可能会报错。
brew install ffmpeg
Python 3
Skill里有个Python脚本负责调用API、处理文件和套模板。macOS通常自带Python 3,可以确认一下:
python3 -V
能看到版本号就行,不需要特别的版本。
Gemini API(音频转文字)
转文字用的是Google的Gemini模型,具体是 gemini-3-flash-preview。
这个模型对普通Google账户有每天的免费额度,日常使用足够。超了额度会报429的错误,等明天额度刷新就行。
去这个地址申请API Key:aistudio.google.com
进去之后左边有 Get API key,点进去创建一个就行。
DeepSeek API(内容总结)
生成总结用的是DeepSeek,我觉得它做文字总结比较符合我的习惯。
去这个地址申请:platform.deepseek.com
注册账号,进去创建API Key。DeepSeek的API价格很便宜,充个几块钱能用很久。
怎么安装和使用
第一步:下载Skill包
去我的博客下载:https://blog.discoverlabs.ac.cn/downloads/bili-to-obsidian-skill/
解压之后把文件夹放到 ~/.claude/skills/,确保路径是 ~/.claude/skills/bili_to_obsidian/。
第二步:填写配置
打开 ~/.claude/skills/bili_to_obsidian/scripts/bili_to_obsidian.py,找到开头几行:
API_KEY = "YOUR_GEMINI_API_KEY"
DEEPSEEK_API_KEY = "YOUR_DEEPSEEK_API_KEY"
TEMPLATE_PATH = Path("/你的Obsidian路径/02模板/笔记.md")
OUTPUT_DIR = Path("/你的Obsidian路径/00收集箱")
把这几个地方改一下:
YOUR_GEMINI_API_KEY:换成你在aistudio.google.com申请的KeyYOUR_DEEPSEEK_API_KEY:换成你在DeepSeek申请的KeyTEMPLATE_PATH:换成你Obsidian笔记模板的完整路径OUTPUT_DIR:换成你Obsidian收集箱的完整路径
如果你没有用Obsidian的笔记模板,TEMPLATE_PATH那里可以随便填一个不存在的路径,脚本找不到模板会直接生成基础格式,也能用。
第三步:调用
在Claude Code里输入:
/bili_to_obsidian 粘贴B站视频链接
之后等它跑完就好了,一般几分钟内完成。
几个要注意的地方
Gemini的免费额度每天有限制,如果一天看了很多视频,遇到429报错就是超了。等明天额度刷新再用。如果经常超,注册多几个Google账号,轮流用不同的Key。
路径那几行必须改成你自己的。我放在下载包里的是我自己电脑的路径,直接用肯定报错。
格式是根据我的Obsidian模板来的。如果你的模板结构和我的不一样,转写内容写进去的位置可能会乱。这种情况直接把脚本扔给AI,说一下你的模板结构,让它帮你改一下锚点就行。
下载
博客下载,我已经去掉了自己的API:
https://blog.discoverlabs.ac.cn/downloads/bili-to-obsidian-skill/
我自己用这个Skill有一段时间了,B站的学习类视频用来转写特别方便,直接存进Obsidian备查。
另外,下载音频用的是yt-dlp,这个工具支持的平台不只有B站,YouTube、Twitter、抖音等几百个视频网站都能用。所以这个Skill其实不只能转B站,把链接换成其他平台的也一样能跑,你可以自己试试,也可以在这个基础上继续扩展。