logo
3
0
WeChat Login
Forkfromjohannli/paddleOCR-VL, aheadmain8 commits

paddleOCR-VL

快速开始

自动化工作流(推荐)

使用 run_paddleocr_with_docker.py 一键完成所有步骤:

python run_paddleocr_with_docker.py
docker stop paddleocr-vl
test_pdf

该脚本会自动:

  1. 前置校验
    • 检查当前机器是否有可用的 NVIDIA GPU
    • 检查 GPU 显存是否足够(至少 16 GB 可用显存)
  2. 智能容器管理:检查容器是否已运行,如已运行则复用,避免重复启动
  3. 健康检查:等待服务完全就绪(最多 3 分钟)
  4. 批量处理:自动解析 test_pdf/ 目录下的所有 PDF 文件
  5. 错误诊断:失败时自动打印容器日志,便于排查问题

手动启动容器

如需手动管理容器:

# 拉取新构建的镜像
docker pull docker.cnb.cool/ai-models/paddlepaddle/paddleocr-vl-vllm:latest

# 启动新容器
docker run -d \
  --name paddleocr-vl \
  -p 8080:8080 \
  --gpus all \
  --shm-size 16g \
  --restart unless-stopped \
  docker.cnb.cool/ai-models/paddlepaddle/paddleocr-vl-vllm:latest

# 实时查看日志
docker logs -f paddleocr-vl
nvidia-smi --query-gpu=index,name,memory.total,memory.free --format=csv,noheader,nounits

客户端

先尝试最小依赖

python -m pip install paddlepaddle-gpu==3.2.0 -i https://www.paddlepaddle.org.cn/packages/stable/cu126/
python -m pip install paddleocr
python -m pip install -U "paddleocr[doc-parser]"

备份依赖

python -m pip install paddlepaddle-gpu==3.2.0 -i https://www.paddlepaddle.org.cn/packages/stable/cu126/
python -m pip install -U "paddleocr[doc-parser]"
python -m pip install https://paddle-whl.bj.bcebos.com/nightly/cu126/safetensors/safetensors-0.6.2.dev0-cp38-abi3-linux_x86_64.whl

Call the PaddleOCR CLI or Python API(vllm-server):

paddleocr doc_parser \
    -i https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/paddleocr_vl_demo.png \
    --vl_rec_backend vllm-server \
    --vl_rec_server_url http://127.0.0.1:8080/v1
from paddleocr import PaddleOCRVL
pipeline = PaddleOCRVL(vl_rec_backend="vllm-server", vl_rec_server_url="http://127.0.0.1:8080/v1")
output = pipeline.predict("https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/paddleocr_vl_demo.png")
for res in output:
    res.print()
    res.save_to_json(save_path="output")
    res.save_to_markdown(save_path="output")

About

paddleOCR-VL

Language
Python88.4%
Dockerfile11.6%