/Release/v3.0.0
speculative_decoder.py 投机解码(Leviathan 2023)hybrid_search.py Dense+Sparse 混合检索+RRF+查询改写proposition_retriever.py 原子命题级检索粒度context_compressor.py LLMLingua 上下文压缩rag_failure_detector.py RAG 7 大失败点检测与纠正late_chunking.py 上下文感知分块(Late Chunking 2024)streaming_llm.py StreamingLLM Attention Sink 流式推理crag_pipeline.py CRAG 自纠正管线semantic_cache.py 语义缓存