在線用途:(每月免費1000頁)
BabelDoc專注於翻譯科學論文,可以準確處理數學公式和數據表等複雜的印刷術。
該項目由funstory.ai贊助(http://funstory.ai/)發展,公司主要提供在線文本海外服務,因此在長文檔翻譯方面具有一定優勢
1.項目居間
BabelDoc(Yet Another Document Translator,簡稱YADT)是一款專門為科學論文和複雜PDF文檔設計的翻譯工具。它支持命令行操作和Python API,可以獨立使用或嵌入到其他程式中。其核心優勢是:
- 保留原始PDF的結構和排字並生成高質量的雙語或單語PDF。
- 支持多種翻譯引擎,包括OpenAI、Bing和Google。
- 提供插件架構,方便OCR、渲染器等模塊的擴展。
此外,BabelDoc還提供在線服務(Immersive Translate-BabelDoc),每月免費翻譯1000頁。引用turn 0 search 2
2.安裝和使用
安裝方法:
- 通過PyPI安裝:
uv工具安裝--Python 3.12 BabelDoc
babelDoc --幫助
- 從原始碼安裝:
git克隆https://github.com/funstory-ai/BabelDOC
cd BabelDOC
uv run babeldoc --help
基本使用示例:
babelDoc --openai --文件example.pdf
或者使用OpenAI模型:
uv運行babelDoc --文件example.pdf --openai --openai-mode「gpt-4o-mini」--openai-base-url「https://api.openai.com/v1」--openai-api-key「your-api-key-here」
常用參數說明:
- --lang-in / -lang-out:設置源語言和目標語言(默認英中翻譯)。
- --qps:限制每秒查詢次數(默認為4)。
- --no-dual / --no-mono:控制雙語或單語PDF的輸出。
- --Deliverre-ache:忽略緩存並強制重新翻譯。
- --配置:使用TOML格式的配置文件集中管理參數。
三.核心結構和優勢
BabelDoc採用「解析+渲染」的雙階段架構:
- 解析階段:從PDF中提取文本塊、圖像和表格等結構信息。
- 渲染階段(渲染):根據解析結果生成新的PDF,保留原始布局。
與Mathpix或Adobe PDF Parser等其他工具相比,BabelDoc具有以下優勢:
- 保留原來的排字,避免結構損失。
- 支持插件擴展,輕鬆與新型號或OCR工具集成。
- 適應移動終端閱讀,提升用戶體驗。
4.發展計劃和已知問題
發展計劃:
- 支持行和表的分析。
- 實現跨頁/跨欄段落處理。
- 增強排字功能並支持輪廓等高級功能。
- 目標翻譯語言包括簡體中文、繁體中文、日語和西班牙語。
- 力爭印刷錯誤率低於1%,內容丟失率低於1%。
已知問題:
- 作者和參考文獻部分的解釋可能存在錯誤,翻譯後將合併為一個段落。
- 目前不支持線和下限。
- 可能會跳過大頁面。
5.適用場景和推薦人群
BabelDoc可供以下用戶使用:
- 需要高質量PDF翻譯的研究人員和學生。
- 想要保留原來的排字技術文件翻譯要求。
- 需要批量處理PDF文檔的開發人員和工程師。
- 對翻譯質量和排字要求高的專業用戶。
對於普通用戶,建議使用其在線服務(Immersive Translate - BabelDOC),每月可免費翻譯1000頁。
6.如何參與和貢獻
BabelDoc鼓勵社區參與和貢獻:
- 歡迎提交代碼、文檔或測試反饋。
- 活躍貢獻者可以獲得Immersive Translate的Pro會員兌換代碼獎勵。
- 有關更多信息,請參閱該項目的貢獻指南。
七.項目連結
- GitHub存儲庫:https://github.com/funstory-ai/BabelDOC
- 在線服務:https://app.immersivetranslate.com/babel-doc/
Github:https://github.com/funstory-ai/BabelDOC
輸油管: