본문 바로가기
개발

[ETC] PDFMathTranslate 이용하여 논문 번역 (PDF 번역)

by ▶ Carpe diem ◀ 2025. 2. 12.

이번 글에서는 논문의 레이아웃을 유지하면서 번역을 할 수 있는 툴인 PDFMathTranslate에 대해 알아보겠습니다.

 

 

목차

     

     

    PDFMathTranslate

    PDFMathTranslate는 수식이 포함된 과학 논문을 번역하고 원본 서식을 유지하면서 양방향 비교를 지원하는 오픈소스 도구로 원본 서식이 유지되는 강력한 장점이 있습니다.

     

    GitHub에 올라온 번역된 결과물은 다음과 같습니다.

    변환된 결과물

     

     

    GitHub - Byaidu/PDFMathTranslate: PDF scientific paper translation with preserved formats - 基于 AI 完整保留排版的 PDF

    PDF scientific paper translation with preserved formats - 基于 AI 完整保留排版的 PDF 文档全文双语翻译,支持 Google/DeepL/Ollama/OpenAI 等服务,提供 CLI/GUI/Docker/Zotero - Byaidu/PDFMathTranslate

    github.com

     

    주요 기능

     수식, 차트, 목차, 주석 보존 – 번역 후에도 원본 서식 유지
     다국어 지원 – 한국어, 영어, 중국어, 일본어 등 다양한 언어 번역 가능
     다양한 번역 서비스 연동 – Google, DeepL, OpenAI, Ollama 등

     

    온라인 서비스

    온라인 서비스를 제공하고 있어 손쉽게 PDF 변환 작업을 진행할 수 있습니다. 제공되는 온라인 서비스는 이미지를 클릭하면 확인할 수 있습니다.

    pdf2zh 온라인 서비스
    pdf2zh 온라인 서비스

     

    로컬에서 사용하기

    로컬 PC에 설치해서 사용하는 방법도 어렵지 않습니다. 아래 명령어를 이용하여 pdf2zh 프로그램을 설치해주시면 됩니다.

    pip install pdf2zh

     

    설치가 완료되었으면, 다음과 같이 사용하면 됩니다.

    pdf2zh [paper_name].pdf -li en -lo ko


    옵션에 대한 설명은 아래와 같습니다.

    • li: 논문 원본 언어 (영어: en)
    • lo: 번역할 언어 (한국어: ko)

    lo 기본값이 중국어로 되어있어 lo 파라미터 없이 실행하면 중국어로 번역된 결과물을 확인할 수 있습니다.

     

    번역 서비스를 변경하기 위한 옵션은 s 로 deepl 을 입력값으로 넣어주면 DeepL을 사용하여 번역할 수 있습니다.

    pdf2zh [paper_name].pdf -li en -lo ko -s deepl

    지원하는 파라미터는 google, deepl, openai, ollama 가 있습니다.

     

    실행 결과

    실행이 정상적으로 완료되었다면 [paper_name]-dual, [paper_name]-mono 이름의 pdf 파일 2개가 생성된 것을 확인할 수 있습니다.

    실행 결과 이미지
    실행 결과 이미지

     

    [paper_name]-mono.pdf

    [paper_name]-mono.pdf 파일은 lo 옵션에 설정한 언어로 번역된 결과물입니다.

    [paper_name]-mono.pdf 파일
    [paper_name]-mono.pdf 파일

     

    [paper_name]-dual.pdf

    [paper_name]-dual.pdf 파일은 lo 옵션에 설정한 언어로 번역된 결과물과 함께 논문의 원본을 같이 보여줍니다.

    [paper_name]-dual.pdf 파일
    [paper_name]-dual.pdf 파일