llm-memory-integrat/llm

Public

WeChat Login

Code Issues Pull requests Events Packages Insights

master

Branch

Tag

xkzs2007<xkzs2007@gitee.com>

更新 ClawHub 链接

135cf0f2

29 commits

LLM Memory Integration - 私有增强包

高性能 LLM 记忆集成框架，提供向量计算、硬件优化、RAG 增强和智能缓存能力。

当前版本：v3.0.5（生产就绪）

特性

高性能向量计算 - 自动检测 FMA/MKL/SIMD 指令集加速
多级缓存系统 - L1/L2/L3/NUMA/DRAM/CXL 智能预取
硬件感知优化 - CPU/GPU/内存/IO 协同调度
前沿 RAG 能力 - 投机解码、混合检索、命题级检索、上下文压缩
跨平台支持 - Linux/macOS/Windows 自动适配，优雅降级

快速开始


# 安装（自动拉取私有增强包）
clawhub install llm-memory-integration

# 私有包自动克隆到：
# ~/.openclaw/workspace/skills/llm-memory-integration/src/privileged/


from llm import initialize

result = initialize()
# Platform: Linux x86_64 | Optimizations: numa, hugepages | Tools: 9

核心模块

向量计算

vector_api.py - 向量运算、Top-K 搜索、余弦相似度
mkl_accelerator.py - Intel MKL 矩阵加速
quantization.py - 向量量化压缩

缓存系统

unified_cache.py - 统一多级缓存
rag_cache.py - RAG 知识树缓存
semantic_cache.py - 语义相似度缓存

硬件优化

hardware_optimize.py - 自动硬件检测与调优
numa_optimizer.py - NUMA 亲和性绑定
gpu_optimizer.py - CUDA/OpenCL GPU 加速
kunpeng_optimizer.py - 华为鲲鹏专用优化

RAG 增强

hybrid_search.py - Dense+Sparse 混合检索
speculative_decoder.py - 投机解码加速推理
streaming_llm.py - 无限长度流式推理
crag_pipeline.py - CRAG 自纠正管线
context_compressor.py - LLMLingua 上下文压缩
proposition_retriever.py - 原子命题级检索

资源管理

resource_orchestrator.py - 统一资源编排
power_manager.py - DVFS 电源管理
io_optimizer.py - I/O 调度优化

版本历史

版本	主要变更
v3.0.5	模块协同与进程管理优化；15 项稳定性修复；生产就绪
v3.0.0	7 项论文级模块（投机解码、混合检索、命题检索、上下文压缩、RAG 失败检测、Late Chunking、StreamingLLM）；CRAG 自纠正管线
v2.1.0	资源编排器、统一缓存、向量 API、I/O 优化器
v2.0.0	GPU 检测、安全对齐、检索评估
v1.4.0	14 个搜索增强子模块
v1.0.0	初始版本

依赖

级别	依赖	用途
必须	numpy (Python 3.8+)	向量计算
推荐	pysqlite3-binary	向量搜索
可选	scipy, scikit-learn, aiohttp, pyopencl	扩展功能

测试


python3 -m unittest test_suite -v

安全保障

参数类型与范围校验
SHA-256 路径哈希防护
扩展白名单机制
线程安全锁保护
连接资源安全释放

许可证

MIT License

链接

About

No description, topics, or website provided.

3.74 MiB

0 forks 0 stars 1 branches 9 TagREADME

Release
1

v3.0.0: 论文级 RAG/LLM 模块 + CRAG 管线 + 12 项深度 Bug 修复

Contributors
5

Language

Python100%

35/F,Tencent Building,Kejizhongyi Avenue,Nanshan District,Shenzhen

京ICP备11018762号-111

__pycache__
scripts_core
.cnb.yml
.flake8
.gitignore
README.md
__init__.py
acp_server.py
ann_selector.py
approximate_cache.py
async_ops.py
auto_tuner.py
auto_update_persona.py
cache_allocator.py
cache_aware_scheduler.py
computational_storage.py
context_compressor.py
conversation.py
crag_pipeline.py
create_v2_modules.py
cross_lingual.py
cxl_optimizer.py
dep_checker.py
distributed_search.py
exceptions.py
failover.py
fma_accelerator.py
full_recovery.py
gpu_optimizer.py
hardware_optimize.py
hugepage_manager.py
hybrid_memory_search.py
hybrid_search.py
install.json
io_optimizer.py
irq_isolator.py
kunpeng_optimizer.py
late_chunking.py
llm_client.py
llm_streaming.py
logging_config.py
mkl_accelerator.py
model_performance.py
model_router.py
module_coordinator.py
multimodal_search.py
multiresolution_search.py
numa_optimizer.py
opq_quantization.py
platform_adapter.py