개요
OCRmyPDF는 스캔한 PDF 파일에 OCR(광학 문자 인식) 텍스트 레이어를 추가하여 검색하거나 복사하여 붙여넣을 수 있도록 설계된 오픈 소스 도구입니다. 여러 언어를 지원하며 PDF 파일 크기를 최적화하고 원본 이미지의 해상도를 유지할 수 있습니다. 이 프로젝트는 깃허브에서 26.8천 개 이상의 별을 받았으며 개발자들 사이에서 널리 인기를 얻고 있습니다.

주요 기능
- OCR 텍스트 레이어스캔한 PDF를 검색 가능한 PDF/A 형식으로 변환하여 텍스트를 쉽게 검색하거나 복사할 수 있습니다.
- 다국어 지원100개 이상의 언어 지원, 사용자는 다음을 수행할 수 있습니다.
-l매개변수를 사용하여 언어를 지정할 수 있습니다(예-l eng+fra(영어와 프랑스어가 지원됩니다). - 이미지 최적화OCR 중 PDF 이미지를 최적화하면 일반적으로 원본 파일보다 작은 PDF 파일이 생성됩니다.
- 페이지 수정기울어진 페이지의 자동 회전 지원(
--회전 페이지) 및 구부러진 페이지 수정(--데스큐). - 멀티코어 처리멀티코어 CPU를 사용하여 OCR 처리를 가속화하여 효율성을 향상시킵니다.
- 개인 정보 보호사용자의 개인 데이터가 유출되지 않도록 합니다.
- 배치 파일수천 페이지에 달하는 대용량 PDF 파일을 효율적으로 처리할 수 있습니다.
사람에게 적합
- 직장인: 스캔한 종이 문서를 편집 가능한 전자 문서로 변환해야 합니다.
- 라이브러리 또는 아카이브수많은 역사적 문서를 디지털화해야 할 필요성.
- 개발자OCR 기능을 자체 애플리케이션에 통합하고 싶습니다.
- 일반 사용자개인 사용자 : 가끔 스캔한 PDF 문서를 처리해야 하는 경우.
설치
다음은 일반적인 설치 방법이며 Linux, Windows, macOS 및 FreeBSD를 포함한 여러 운영 체제를 지원합니다:
- 데비안/우분투::
apt 설치 ocrmypdf - macOS(홈브루)::
brew 설치 ocrmypdf - Linux용 Windows 하위 시스템::
apt 설치 ocrmypdf - Dockerx64 및 ARM 아키텍처용 미러를 사용할 수 있습니다.
더 많은 설치 옵션은 다음에서 확인할 수 있습니다.공식 문서.
요약
OCRmyPDF는 스캔한 PDF 파일을 검색 가능한 전자 문서로 변환하는 강력하고 사용하기 쉬운 도구입니다. 개인 사용자와 기업 모두 문서 처리의 효율성을 향상시키는 데 사용할 수 있습니다. 스캔한 PDF 파일을 자주 처리해야 한다면 OCRmyPDF를 꼭 사용해 보세요.