ForesAi/smart-knowledge-assistant

Public

WeChat Login

Code Issues Pull requests Events Packages Insights

main

Branch

Tag

智能知识库助手 (Smart Knowledge Assistant)

基于 LangChain、LangGraph、Milvus 的智能知识库系统，集成 RAG、Memory、MCP、Output Parser、Prompt Template 等先进技术。

✨ 特性

🔍 智能检索: 基于 Milvus 向量数据库的高效相似度搜索
🧠 记忆管理: 4种记忆类型，上下文感知对话
🔄 工作流编排: 使用 LangGraph 实现5节点处理流程
📡 MCP 协议: 标准化的知识库访问接口
📝 输出解析: 结构化输出，自动修复和验证
🎨 提示词模板: 丰富的模板库，支持自定义
🧪 完整测试: 51+ 单元测试，代码覆盖充分
📚 详细文档: 12个文档文件，6000+字说明

🚀 快速开始

方式 1: Docker Compose（推荐，已验证）


# 1. 克隆项目
git clone https://github.com/yourusername/smart-knowledge-assistant.git
cd smart-knowledge-assistant

# 2. 配置环境变量
cp .env.example .env
# 编辑 .env 文件，填入 DeepSeek API Key:
# OPENAI_API_KEY=sk-your-api-key-here

# 3. 启动所有服务
docker compose up -d etcd minio
sleep 10
docker compose up -d milvus
sleep 20
docker compose run -d --name smart-assistant smart-assistant tail -f /dev/null

# 4. 安装依赖（首次需要 5-10 分钟）
docker exec smart-assistant pip install --no-cache-dir pymilvus langchain langgraph sentence-transformers openai pydantic python-dotenv pydantic-settings langchain-openai langchain-community

# 5. 运行演示
docker exec smart-assistant python demo_run.py

方式 2: 本地 Python 环境


# 1. 克隆项目并创建虚拟环境
git clone https://github.com/yourusername/smart-knowledge-assistant.git
cd smart-knowledge-assistant
python3 -m venv venv
source venv/bin/activate  # Linux/Mac
# 或 venv\Scripts\activate  # Windows

# 2. 安装依赖
pip install -r requirements.txt

# 3. 启动 Milvus（使用 Docker）
docker run -d \
  --name milvus-standalone \
  -p 19530:19530 \
  -v /tmp/milvus:/var/lib/milvus \
  milvusdb/milvus:v2.3.3

# 4. 配置环境变量
cp .env.example .env
# 编辑 .env 文件

# 5. 运行应用
python demo_run.py
# 或交互模式: python main.py

环境要求

组件	最低版本	推荐版本
Python	3.9+	3.10+
Docker	20.10+	24.0+
Docker Compose	2.0+	2.20+
内存	4GB	8GB+
磁盘	10GB	20GB+

🌐 Web UI 界面

快速启动 Web UI

Linux/Mac:


./start_web.sh

Windows:


start_web.bat

或直接运行:


pip install streamlit
cd src/web
streamlit run app.py

访问地址: http://localhost:8502

Web UI 功能

💬 智能对话: 实时对话、置信度显示、来源追踪
📚 文档管理: 拖拽上传、批量处理、文档列表
📜 对话历史: 历史查看、导出为 JSON/Markdown
⚙️ 高级设置: Temperature、Top K、记忆类型配置
🎨 美观界面: 现代化设计、响应式布局

详细使用说明请查看 Web UI 使用指南

📖 使用示例

基础查询


from src.components.rag_engine import RAGEngine
from src.utils.document_loader import DocumentLoader

# 初始化
loader = DocumentLoader()
rag = RAGEngine()

# 加载文档
docs = loader.load_directory("./data")
rag.add_documents(docs)

# 查询
result = rag.query("Python 有什么特点？")
print(result.answer)

使用工作流


from src.graph.workflow import KnowledgeAssistantGraph

graph = KnowledgeAssistantGraph()
result = graph.run("什么是机器学习？")
print(result["answer"])

MCP 服务器


from src.components.mcp_server import MCPServer
from src.models import MCPRequest

mcp = MCPServer()
request = MCPRequest(
    method="query",
    params={"question": "LangChain 是什么？"},
    request_id="001"
)
response = mcp.handle_request(request)
print(response.result)

📚 文档

📖 完整文档 - 详细使用说明
🏗️ 架构设计 - 系统架构详解
📋 API 参考 - 完整 API 文档
🌐 Web UI 指南 - Web 界面使用说明
🚀 快速开始 - 5分钟上手（已验证）
🐳 Docker 部署指南 - Docker 完整部署（已验证）
✅ 部署验证清单 - 部署成功验证步骤
🎉 部署成功总结 - 部署完成概览
🔧 开发指南 - 开发和扩展
📝 贡献指南 - 如何贡献代码

🧪 测试


# 运行所有测试
pytest src/tests/ -v

# 运行特定测试
pytest src/tests/test_rag_engine.py -v

# 生成覆盖率报告
pytest src/tests/ --cov=src --cov-report=html

# 查看覆盖率报告
open htmlcov/index.html  # Mac
xdg-open htmlcov/index.html  # Linux
start htmlcov/index.html  # Windows

📊 项目统计

Python 文件: 27 个
代码行数: 3,332 行
测试用例: 51+ 个
文档文件: 12 个 (6000+ 字)
示例代码: 3 个

🏗️ 项目结构


smart-knowledge-assistant/
├── config/              # 配置文件
├── src/
│   ├── components/     # 核心组件
│   │   ├── rag_engine.py
│   │   ├── memory_manager.py
│   │   └── mcp_server.py
│   ├── graph/          # LangGraph 工作流
│   ├── utils/          # 工具类
│   ├── models/         # 数据模型
│   └── tests/          # 单元测试
├── examples/           # 使用示例
├── docs/               # 文档
└── main.py            # 主程序

🔧 技术栈

技术	版本	用途
LangChain	0.3.7	核心框架
LangGraph	0.2.45	工作流编排
Milvus	Latest	向量数据库
sentence-transformers	Latest	文本嵌入
Pydantic	Latest	数据验证
pytest	Latest	单元测试

🎯 核心功能

1️⃣ RAG 引擎

文档加载和智能分块
向量化嵌入生成
语义相似度搜索
上下文增强的答案生成
置信度评估

2️⃣ 记忆管理

ConversationBufferMemory (全量记忆)
ConversationBufferWindowMemory (窗口记忆)
ConversationTokenBufferMemory (Token限制)
ConversationSummaryMemory (摘要记忆)
对话历史持久化

3️⃣ LangGraph 工作流

分析用户输入
检索相关上下文
生成答案
评估答案质量
更新对话记忆
条件路由和流式执行

4️⃣ MCP 服务器

query - 查询知识库
search - 搜索文档
add_documents - 添加文档
delete_document - 删除文档
get_stats - 获取统计
clear - 清空知识库

🤝 贡献

我们欢迎所有形式的贡献！请查看贡献指南了解详情。

贡献方式

🐛 报告 Bug
💡 提出新功能建议
📝 改进文档
🔧 提交代码修复
🧪 添加测试用例

📄 许可证

本项目采用 MIT 许可证开源。

🔮 路线图

✅ 已完成功能 (v1.0)

核心功能

✅ 基于 LangChain 的 RAG 引擎实现
✅ Milvus 向量数据库集成
✅ 4 种记忆管理类型（Buffer/Window/Token/Summary）
✅ LangGraph 5节点工作流编排
✅ MCP 服务器（6个核心接口）
✅ 结构化输出解析器（自动修复和验证）
✅ 可配置提示词模板系统
✅ 文档加载器（支持多种格式）

工程化

✅ 51+ 单元测试覆盖
✅ 完整的中文文档体系（12个文档，6000+字）
✅ Docker Compose 部署方案
✅ 环境变量配置管理
✅ 类型注解和代码规范

示例和演示

✅ 3个完整示例程序
✅ 交互式命令行界面
✅ 演示对话脚本

🚀 短期计划 (v1.1 - v1.2)

v1.1 - 功能增强

多语言支持
- 中英文混合查询优化
- 多语言文档嵌入模型
- 语言检测和自动切换
✅ Web UI 界面 (已完成)
- ✅ Streamlit 基础界面
- ✅ 实时对话展示
- ✅ 文档上传和管理
- ✅ 查询历史记录
- ✅ 置信度显示
- ✅ 来源追踪
- ✅ 高级参数配置
- ✅ 对话历史导出
批量文档处理
- 文档队列处理系统
- 进度监控和日志
- 增量更新机制

v1.2 - 性能优化

🎯 中期计划 (v2.0 - v2.1)

v2.0 - 企业级特性

v2.1 - 智能增强

🌟 长期愿景 (v3.0+)

v3.0 - 生态扩展

v3.1 - 企业级功能

💡 创新功能 (探索中)

知识图谱集成 - 结合图数据库增强推理
实时学习 - 在线学习和知识更新
个性化推荐 - 基于用户行为的推荐系统
联邦学习 - 隐私保护的分布式学习
对话式文档 - 与文档进行深度对话
跨库检索 - 多知识库联合检索
智能摘要 - 文档自动摘要和关键点提取
问答对生成 - 自动生成 QA 数据集

📅 发布时间表

版本	计划时间	主要特性
v1.0	✅ 已完成	核心 RAG、记忆、LangGraph、MCP
v1.1	Q2 2026	多语言、Web UI、批量处理
v1.2	Q3 2026	检索优化、多数据库支持
v2.0	Q4 2026	RESTful API、知识库管理、高级记忆
v2.1	Q1 2027	多模态、高级工作流、Agent 集成
v3.0	Q2 2027	插件系统、多模型、分布式
v3.1	Q3 2027	监控运维、安全合规、数据治理

🤝 参与路线图

欢迎社区贡献！如果您有兴趣参与特定功能的开发：

查看现有 Issue
在 Issue 中评论表明意向
阅读贡献指南
提交 Pull Request

如果您有新的功能建议或想法，欢迎创建新的 Feature Request。

🙏 致谢

感谢以下开源项目：

About

No description, topics, or website provided.

860.00 KiB

0 forks 0 stars 1 branches 1 TagREADMEMIT license

Release
0

Tag

Contributors
1

Language

Python79.7%

HTML11.8%

Shell7.9%

Others0.6%

35/F,Tencent Building,Kejizhongyi Avenue,Nanshan District,Shenzhen

京ICP备11018762号-111

.codebuddy
config
docs
examples
src
.env.example
.gitignore
CONFIG_SUMMARY.md
CONTRIBUTING.md
DEEPSEEK_CONFIG_COMPLETE.txt
DEMO.sh
DEPLOYMENT_CHECKLIST.md
DEPLOYMENT_SUMMARY.md
DOCKER_LAUNCH_GUIDE.md
DOCUMENTATION_UPDATE_SUMMARY.md
FEATURE_SHOWCASE.txt
GITHUB_SETUP.md
INSTALL_GUIDE.md
INTERACTIVE_DEMO.md
INTERACTIVE_EXPERIENCE.md
LICENSE
PROJECT_COMPLETION_REPORT.md
PROJECT_OVERVIEW.md
PROJECT_STATUS.txt
QUICK_GUIDE.txt
QUICK_START.txt
README.md
START_DOCKER.sh
START_NOW.md
START_WEB_LOCALLY.md
VERIFY_CONFIG.sh
WEB_INTERFACE.md
WEB_UI_GUIDE.md
WEB_UI_IMPLEMENTATION_SUMMARY.md
WEB_UI_QUICKSTART.md
demo_conversation.py
demo_run.py
docker-compose.yml
main.py
pyproject.toml
requirements-dev.txt
requirements.txt
start.sh
start_all.sh
start_web.bat
start_web.sh
web_ui_preview.html