logo
0
0
WeChat Login
Codex<codex@local>
chore: update knowledge graph workspace

Hyper-Extract Course KG Demo

一个基于 Hyper-Extract 的课程知识图谱后端原型。

它的核心目标是验证:

  1. 使用模板从课程文本中抽取结构化知识
  2. 将结果保存为 Hyper-Extract 的 Knowledge Abstract
  3. 支持增量补充、索引重建和语义检索
  4. 将 Knowledge Abstract 转成前端可视化图谱

当前架构

详细架构见:

核心目录:

运行方式

cd /Users/mikasa/test/graphrag_course_kg
./scripts/run_app.sh

访问:

http://127.0.0.1:8000

当前支持的后端能力

  • 查看环境状态
  • 查看 Provider 配置
  • 使用课程模板创建 Knowledge Abstract
  • 对现有 Knowledge Abstract 做增量 feed
  • 重建索引
  • 读取图谱 JSON
  • 进行语义搜索

Provider 说明

Hyper-Extract 当前在这个项目里走的是 OpenAI 兼容客户端:

  • LLM:ChatOpenAI
  • Embedder:OpenAIEmbeddings

默认接入 OpenAI API;如果你的模型服务兼容 OpenAI 风格接口,也可以通过 OPENAI_BASE_URL/api/provider 接入。

推荐配置方式:

  1. 通过 /api/provider 写入项目配置
  2. 或直接设置环境变量:
export OPENAI_API_KEY=your-key
export OPENAI_MODEL=gpt-4.1-mini
export OPENAI_EMBEDDING_MODEL=text-embedding-3-small
export OPENAI_WIRE_API=responses
export OPENAI_REASONING_EFFORT=medium

# 可选:只有接入自定义 OpenAI-compatible endpoint 时才需要
export OPENAI_BASE_URL=https://your-openai-compatible-endpoint/v1

与旧版 GraphRAG 原型的区别

旧版围绕:

  • GraphRAG workspace
  • parquet 输出
  • 导入图谱

新版围绕:

  • Hyper-Extract Template
  • Knowledge Abstract 目录
  • 增量补充与检索

所以它更适合接正式业务后端。