基于 CNB 提供的 GPU 运行的 Ollama + qwen3:8b + PDFMathTranslate 的 PDF 文档翻译
环境已启动
Ollama+qwen3:8b,相关日志存放在logs/文件夹
直接拖拽本地文件到浏览器即可上传
右键 Web IDE 中的文件选择 下载 按钮即可下载到本地
请查看 CNB_VSCODE_PROXY_URI 文件具体的 ssh endpoint
VSCode Remote 内 PC 打开本地终端
ctrl + shift + p>Terminal: New Local Terminal
# 上传文件
scp E:\document.pdf xxx@cnb.space:/workspace/data/
# 下载文件
scp xxx@cnb.space:/workspace/output/document.pdf E:\
# 执行翻译,文件生成在 当前工作目录 output
pdf2zh ./data/document.pdf -li en -lo zh -o output -s ollama:qwen3:8b
# 部分翻译,翻译第二页
pdf2zh ./data/document.pdf -p 2 -li en -lo zh -o output -s ollama:qwen3:8b
# 多线程翻译,128线程
pdf2zh ./data/document.pdf -t 128 -li en -lo zh -o output -s ollama:qwen3:8b
更多使用方法请查阅进一步了解 https://github.com/PDFMathTranslate/PDFMathTranslate/blob/main/docs/ADVANCED.md
由于 CNB 的 免费 GPU 环境一次最大连续使用时间不能超过 4H,所以文档无法在四小时内翻译完成的,需要在环境关闭前开启一个新的环境,并通过 sync_cache.sh 继承当前翻译的缓存,用来实现 接续翻译
具体操作步骤如下
fork 仓库时需要 fork 两份,下面命名为 fork1 fork2
启动 fork1 上传文档翻译
fork1 快结束时启动 fork2 (为了避免 fork1 环境已经关闭无法操作,请预留至少 10分钟 并仔细阅读本文档)
查看 fork1 的 CNB_VSCODE_PROXY_URI 中的 ssh endpoint 并复制
fork2 终端执行 sync_cache.sh + fork1 复制的 ssh endpoint

fork2 中重新上传文档,执行翻译命令

如果使用完毕,可以执行 kill 1 快速关闭环境,避免资源浪费
kill 1
环境默认 10 分钟无操作自动回收
CNB 云原生构建 Cloud Native BuildPDFMathTranslate 科学 PDF 文档翻译及双语对照工具