logo
0
0
WeChat Login

/Release/v3.0.0

v3.0.0: 论文级 RAG/LLM 模块 + CRAG 管线 + 12 项深度 Bug 修复
latest
OverviewDeployMetadata

新增模块(7 项论文级)

  • speculative_decoder.py 投机解码(Leviathan 2023)
  • hybrid_search.py Dense+Sparse 混合检索+RRF+查询改写
  • proposition_retriever.py 原子命题级检索粒度
  • context_compressor.py LLMLingua 上下文压缩
  • rag_failure_detector.py RAG 7 大失败点检测与纠正
  • late_chunking.py 上下文感知分块(Late Chunking 2024)
  • streaming_llm.py StreamingLLM Attention Sink 流式推理

新增管线

  • crag_pipeline.py CRAG 自纠正管线
  • semantic_cache.py 语义缓存

Bug 修复(12 项)

  • 致命:speculative_decoder 无限循环+消息列表污染
  • 内存泄漏:KV Cache 预分配+O(n²)驱逐+命题索引无限增长
  • 性能:BM25 avgdl 重算+O(n)查找
  • 逻辑:压缩比平均值+TTFT 作用域+failure_report 丢失+循环内 import
Attachment
2026-04-17 16:25:52
2026-04-17 16:25:52