首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

完整保留排版的 PDF 文档全文双语翻译,双语对照,保留公式和图表

PDFMathTranslate

完整保留排版的 PDF 文档全文双语翻译,支持Google,DeepL,Ollama,OpenAI 翻译

Github地址

https://github.com/Byaidu/PDFMathTranslate

特点

• PDF 文档翻译及双语对照

•  保留公式和图表

•  保留可索引目录

•  支持多种翻译服务

安装

要求 Python 版本 >=3.8, <=3.12

pip install pdf2zh使用

命令行中执行翻译指令,在工作目录下生成翻译文档example-zh.pdf和双语对照文档example-dual.pdf,默认使用 Google 作为翻译服务

翻译完整文档

pdf2zh example.pdf翻译部分文档

pdf2zh example.pdf -p 1-3,5使用指定语言翻译

参考 Google Languages Codes, DeepL Languages Codes

pdf2zh example.pdf -li en -lo ja使用 DeepL/DeepLX 翻译

参考 DeepLX

环境变量构建接入点:{DEEPL_SERVER_URL}/{DEEPL_AUTH_KEY}/translate

•DEEPL_AUTH_KEY, e.g.,export DEEPL_AUTH_KEY=xxx

pdf2zh example.pdf -s deepl使用 Ollama 翻译

参考 Ollama

设置环境变量构建接入点:{OLLAMA_HOST}/api/chat

•OLLAMA_HOST(可选), e.g.,export OLLAMA_HOST=https://localhost:11434

pdf2zh example.pdf -s ollama:gemma2使用 OpenAI/SiliconCloud 翻译

参考 SiliconCloud, Zhipu

使用正则表达式指定需要保留样式的字体和字符

pdf2zh example.pdf -f "(CM[^RT].*|MS.*|.*Ital)" -c "(\(|\||\)|\+|=|\d|[\u0080-\ufaff])"

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OLrr0Uiw3Wt1fho1xkfsu7Yg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券