이번 글에서는 논문의 레이아웃을 유지하면서 번역을 할 수 있는 툴인 PDFMathTranslate에 대해 알아보겠습니다.
목차
PDFMathTranslate
PDFMathTranslate는 수식이 포함된 과학 논문을 번역하고 원본 서식을 유지하면서 양방향 비교를 지원하는 오픈소스 도구로 원본 서식이 유지되는 강력한 장점이 있습니다.
GitHub에 올라온 번역된 결과물은 다음과 같습니다.
주요 기능
✅ 수식, 차트, 목차, 주석 보존 – 번역 후에도 원본 서식 유지
✅ 다국어 지원 – 한국어, 영어, 중국어, 일본어 등 다양한 언어 번역 가능
✅ 다양한 번역 서비스 연동 – Google, DeepL, OpenAI, Ollama 등
온라인 서비스
온라인 서비스를 제공하고 있어 손쉽게 PDF 변환 작업을 진행할 수 있습니다. 제공되는 온라인 서비스는 이미지를 클릭하면 확인할 수 있습니다.
로컬에서 사용하기
로컬 PC에 설치해서 사용하는 방법도 어렵지 않습니다. 아래 명령어를 이용하여 pdf2zh 프로그램을 설치해주시면 됩니다.
pip install pdf2zh
설치가 완료되었으면, 다음과 같이 사용하면 됩니다.
pdf2zh [paper_name].pdf -li en -lo ko
옵션에 대한 설명은 아래와 같습니다.
- li: 논문 원본 언어 (영어: en)
- lo: 번역할 언어 (한국어: ko)
lo 기본값이 중국어로 되어있어 lo 파라미터 없이 실행하면 중국어로 번역된 결과물을 확인할 수 있습니다.
번역 서비스를 변경하기 위한 옵션은 s 로 deepl 을 입력값으로 넣어주면 DeepL을 사용하여 번역할 수 있습니다.
pdf2zh [paper_name].pdf -li en -lo ko -s deepl
지원하는 파라미터는 google, deepl, openai, ollama 가 있습니다.
실행 결과
실행이 정상적으로 완료되었다면 [paper_name]-dual, [paper_name]-mono 이름의 pdf 파일 2개가 생성된 것을 확인할 수 있습니다.
[paper_name]-mono.pdf
[paper_name]-mono.pdf 파일은 lo 옵션에 설정한 언어로 번역된 결과물입니다.
[paper_name]-dual.pdf
[paper_name]-dual.pdf 파일은 lo 옵션에 설정한 언어로 번역된 결과물과 함께 논문의 원본을 같이 보여줍니다.
'개발' 카테고리의 다른 글
[최적화 및 문제풀이] 두 개의 정렬된 배열에서 공통 원소 찾는 문제 (0) | 2024.09.02 |
---|---|
[최적화 및 문제풀이] 문자열 순열 찾기 문제 (1) | 2024.09.01 |
[최적화 및 문제풀이] 자연수 a³ + b³ = c³ + d³ 문제 (2) | 2024.08.31 |
배열 교집합 계산: 알고리즘 분석과 Big-O 시간 복잡도 (0) | 2024.08.30 |
[Algorithm] 알고리즘 시간 복잡도 이해하기 (4) | 2024.04.09 |