liyao52033/bilibili-rag

Public

WeChat Login

Code Issues Pull requests Events Packages Insights

main

bilibili-rag/README.md

记得勇敢ᯤ ⁵ᴳ

docs: 更新部署文档和配置文件

85074493

PreviewCode viewBlame

🚀 Bilibili RAG：把收藏夹变成可对话的知识库

把你在 B 站收藏的访谈/演讲/课程，变成可检索、可追溯来源的个人知识库。
适合：访谈/演讲/课程、技术视频与学习视频整理、公开课复盘、知识总结、会议/分享回顾、播客内容归档等。

亮点：自动拉取内容 → 语音转写 → 向量检索 → 对话问答

✨ 功能一览

✅ B 站扫码登录，读取收藏夹
✅ 音频转文字（ASR），自动兜底处理
✅ 语义检索（向量检索）
✅ 基于 RAG 的对话问答
✅ 本地 SQLite + ChromaDB 存储

🖼️ 演示与截图

首页截图对话界面截图

B站演示视频：

演示视频

⚡ 快速开始

🐳 Docker 部署（推荐）

一键部署，前后端不分离，所有功能统一入口：


# 1. 配置环境变量
cp .env.example .env
# 编辑 .env，填写 DASHSCOPE_API_KEY

# 2. 构建并启动
docker-compose -f docker-compose.image.yml up -d

访问：

说明：前端已打包为静态文件，由 FastAPI 统一提供服务，无需单独启动前端服务。

详细 Docker 部署文档：DOCKER_README.md

本地开发部署

安装 ffmpeg（并确保在 PATH 中）

macOS: brew install ffmpeg
Windows: 下载安装包后将 bin 目录加入 PATH
Linux: apt/yum/pacman 安装 ffmpeg

安装后端依赖


pip install -r requirements.txt

安装前端依赖并构建


cd frontend
npm install
npm run build
cd ..

配置环境变量


cp .env.example .env
# 编辑 .env，填写 DashScope API Key 等配置

启动服务


python -m uvicorn app.main:app --reload

访问：

应用首页：http://localhost:8000
API 文档：http://localhost:8000/docs

开发模式：修改前端代码后需要重新运行 cd frontend && npm run build

🧠 工作流程

选择收藏夹
拉取视频 → 音频转写（ASR）
生成向量 → 构建知识库
对话/检索问答

🤖 OpenClaw Skill（本地接入）

本仓库已提供一个可直接使用的 Skill：skills/bilibili-rag-local/SKILL.md。
作用：把本地运行的 bilibili-rag 服务接入 OpenClaw，让 OpenClaw 直接调用你的收藏夹知识库进行检索和问答。

前置条件

先按上面的步骤完成本项目本地部署。
确认后端接口可访问：http://127.0.0.1:8000/docs。
确认 OpenClaw 已安装并可加载本地 Skills。

接入方式

将本仓库中的 skills/bilibili-rag-local 放到 OpenClaw 的 Skills 目录（例如 ~/.openclaw/skills/）。
重启或刷新 OpenClaw Skills。
在 OpenClaw 中调用该 Skill，让它通过本地 API 执行：
- POST /chat/ask（问答）
- POST /chat/search（检索片段）
- GET /knowledge/folders/status（入库状态）

使用建议

先同步/入库收藏夹，再进行问答。
问题越具体，召回效果越好。
若出现“无命中”，优先检查是否完成入库或是否选错收藏夹。

🧩 基于 Skill 的扩展示例

你可以在 skills/ 目录继续开发更多 Skill，把收藏夹真正变成可持续运营的知识系统。
例如结合 OpenClaw 的定时能力（Cron）做自动化：

每日/每周统计收藏夹入库状态（新增、未入库、失败项）。
定时生成“新增收藏学习摘要”（按主题聚合要点）。
定时输出“待补全内容清单”（ASR 失败、内容过短、召回弱视频）。
将统计结果自动推送到你常用的消息渠道，形成固定复盘节奏。

🧪 测试与诊断脚本

注意：test/ 目录下的脚本需要 移动到项目根目录 再运行（依赖相对路径与配置）。

debug_asr_single.py：测试单个视频是否能正确获取音频
diagnose_rag.py：测试向量检索召回是否准确
sync_cache_vectors.py：同步数据库缓存数据到向量库

🎧 ASR 说明（音频不可达兜底）

部分 B 站音频 URL 可能返回 403（直链不可拉取），系统会自动执行兜底流程：

本地下载音频（带 Cookie）
ffmpeg 转码为 16k 单声道
上传到 DashScope 后再识别

请确保本机已安装 ffmpeg 并加入 PATH。

💰 费用说明（DashScope）

模型相关费用包括：

LLM 对话（按 Token）
Embedding（按 Token）
ASR 音频转写（按时长）

建议：

部署/测试阶段先用 **短视频（约 10 分钟）**验证流程与费用
正式使用按需启用，注意费用；大多数模型有免费额度，通常足够日常使用

🧩 技术栈

后端：FastAPI
LLM：LangChain + DashScope
向量库：ChromaDB
前端：集成到 FastAPI（静态文件）
数据库：SQLite
容器：Docker + Docker Compose

📂 目录结构（简版）


bilibili-rag/
├── app/                # 后端逻辑
├── frontend/           # 前端静态资源
├── data/               # 数据库与向量库
├── skills/             # OpenClaw Skills（含 bilibili-rag-local）
├── test/               # 测试脚本（需移动到根目录再运行）
├── Dockerfile          # Docker 镜像构建文件
├── docker-compose.yml  # Docker Compose 配置
├── Makefile            # 快捷命令管理
└── README.md

✅ 常见问题

Q：为什么有些音频 URL 可达、有些不可达？
A：B 站音频直链存在鉴权/过期/区域限制，只有公网可直接拉取的 URL 才可达。

免责声明：本项目仅供个人学习与技术研究，使用者需自行遵守相关平台协议与法律法规，禁止用于未授权的商业或违规用途。

📜 License

MIT

🧩 TodoList

对话存储、会话管理、检索历史对话记录
支持 B 站分 P 视频
适配更多 LLM 与向量模型

35/F,Tencent Building,Kejizhongyi Avenue,Nanshan District,Shenzhen

京ICP备11018762号-111