logo
1
1
WeChat Login
编辑文件 README.md

PDFMathTranslate

ref: https://github.com/PDFMathTranslate/PDFMathTranslate

基于 CNB 提供的 GPU 运行的 Ollama + qwen3:8b + PDFMathTranslate 的 PDF 文档翻译

运行

环境已启动 Ollama + qwen3:8b,相关日志存放在 logs/ 文件夹

上传/下载 文件

Web IDE

直接拖拽本地文件到浏览器即可上传

右键 Web IDE 中的文件选择 下载 按钮即可下载到本地

VScode Remote

请查看 CNB_VSCODE_PROXY_URI 文件具体的 ssh endpoint

VSCode Remote 内 PC 打开本地终端

  • 按住 ctrl + shift + p
  • 输入 >Terminal: New Local Terminal

alt text

# 上传文件 scp E:\document.pdf xxx@cnb.space:/workspace/data/ # 下载文件 scp xxx@cnb.space:/workspace/output/document.pdf E:\

翻译

# 执行翻译,文件生成在 当前工作目录 output pdf2zh ./data/document.pdf -li en -lo zh -o output -s ollama:qwen3:8b # 部分翻译,翻译第二页 pdf2zh ./data/document.pdf -p 2 -li en -lo zh -o output -s ollama:qwen3:8b # 多线程翻译,128线程 pdf2zh ./data/document.pdf -t 128 -li en -lo zh -o output -s ollama:qwen3:8b

更多使用方法请查阅进一步了解 https://github.com/PDFMathTranslate/PDFMathTranslate/blob/main/docs/ADVANCED.md

特别提醒

大文档翻译

由于 CNB 的 免费 GPU 环境一次最大连续使用时间不能超过 4H,所以文档无法在四小时内翻译完成的,需要在环境关闭前开启一个新的环境,并通过 sync_cache.sh 继承当前翻译的缓存,用来实现 接续翻译

具体操作步骤如下

  • fork 仓库时需要 fork 两份,下面命名为 fork1 fork2

  • 启动 fork1 上传文档翻译

  • fork1 快结束时启动 fork2 (为了避免 fork1 环境已经关闭无法操作,请预留至少 10分钟 并仔细阅读本文档)

  • 查看 fork1CNB_VSCODE_PROXY_URI 中的 ssh endpoint 并复制

  • fork2 终端执行 sync_cache.sh + fork1 复制的 ssh endpoint alt text

  • fork2 中重新上传文档,执行翻译命令 alt text

关于环境回收

如果使用完毕,可以执行 kill 1 快速关闭环境,避免资源浪费

kill 1

环境默认 10 分钟无操作自动回收

特别鸣谢

  • CNB 云原生构建 Cloud Native Build
  • PDFMathTranslate 科学 PDF 文档翻译及双语对照工具

参考