繁中

BabelDoc:創建高質量雙語PDF翻譯的新工具

在線用途:(每月免費1000頁)
BabelDoc專注於翻譯科學論文,可以準確處理數學公式和數據表等複雜的印刷術。
該項目由funstory.ai贊助(http://funstory.ai/)發展,公司主要提供在線文本海外服務,因此在長文檔翻譯方面具有一定優勢

1.項目居間

BabelDoc(Yet Another Document Translator,簡稱YADT)是一款專門為科學論文和複雜PDF文檔設計的翻譯工具。它支持命令行操作和Python API,可以獨立使用或嵌入到其他程式中。其核心優勢是:

  • 保留原始PDF的結構和排字並生成高質量的雙語或單語PDF。
  • 支持多種翻譯引擎,包括OpenAI、Bing和Google。
  • 提供插件架構,方便OCR、渲染器等模塊的擴展。

此外,BabelDoc還提供在線服務(Immersive Translate-BabelDoc),每月免費翻譯1000頁。引用turn 0 search 2

2.安裝和使用

安裝方法:

  1. 通過PyPI安裝:
 uv工具安裝--Python 3.12 BabelDoc
 babelDoc --幫助

  1. 從原始碼安裝:
 git克隆https://github.com/funstory-ai/BabelDOC
 cd BabelDOC
 uv run babeldoc --help

基本使用示例:

babelDoc --openai --文件example.pdf

或者使用OpenAI模型:


uv運行babelDoc --文件example.pdf --openai --openai-mode「gpt-4o-mini」--openai-base-url「https://api.openai.com/v1」--openai-api-key「your-api-key-here」

常用參數說明:

  • --lang-in / -lang-out:設置源語言和目標語言(默認英中翻譯)。
  • --qps:限制每秒查詢次數(默認為4)。
  • --no-dual / --no-mono:控制雙語或單語PDF的輸出。
  • --Deliverre-ache:忽略緩存並強制重新翻譯。
  • --配置:使用TOML格式的配置文件集中管理參數。

三.核心結構和優勢

BabelDoc採用「解析+渲染」的雙階段架構:

  1. 解析階段:從PDF中提取文本塊、圖像和表格等結構信息。
  2. 渲染階段(渲染):根據解析結果生成新的PDF,保留原始布局。

與Mathpix或Adobe PDF Parser等其他工具相比,BabelDoc具有以下優勢:

  • 保留原來的排字,避免結構損失。
  • 支持插件擴展,輕鬆與新型號或OCR工具集成。
  • 適應移動終端閱讀,提升用戶體驗。

4.發展計劃和已知問題

發展計劃:

  • 支持行和表的分析。
  • 實現跨頁/跨欄段落處理。
  • 增強排字功能並支持輪廓等高級功能。
  • 目標翻譯語言包括簡體中文、繁體中文、日語和西班牙語。
  • 力爭印刷錯誤率低於1%,內容丟失率低於1%。

已知問題:

  • 作者和參考文獻部分的解釋可能存在錯誤,翻譯後將合併為一個段落。
  • 目前不支持線和下限。
  • 可能會跳過大頁面。

5.適用場景和推薦人群

BabelDoc可供以下用戶使用:

  • 需要高質量PDF翻譯的研究人員和學生。
  • 想要保留原來的排字技術文件翻譯要求。
  • 需要批量處理PDF文檔的開發人員和工程師。
  • 對翻譯質量和排字要求高的專業用戶。

對於普通用戶,建議使用其在線服務(Immersive Translate - BabelDOC),每月可免費翻譯1000頁。

6.如何參與和貢獻

BabelDoc鼓勵社區參與和貢獻:

  • 歡迎提交代碼、文檔或測試反饋。
  • 活躍貢獻者可以獲得Immersive Translate的Pro會員兌換代碼獎勵。
  • 有關更多信息,請參閱該項目的貢獻指南。

七.項目連結

Github:https://github.com/funstory-ai/BabelDOC

輸油管:

返回頂端