본문 바로가기
컴퓨터/Python

[Python] 파이썬, PDF 파일을 이미지로 변환 (pdf2image)

by sjblog 2022. 5. 30.
반응형

pdf 파일을 이미파일 (jpg, png)로 변환해보겠습니다.

 

1. 준비물

vscode, Python

 

2. 설치

2-1. poppler 준비

pdf2image 패키지는 poppler를 필요로 합니다.

 

Windows

Windows users will have to build or download poppler for Windows. I recommend @oschwartz10612 version which is the most up-to-date. You will then have to add the bin/ folder to PATH or use poppler_path = r"C:\path\to\poppler-xx\bin" as an argument in convert_from_path.

 

<출처>

https://github.com/Belval/pdf2image

 

GitHub - Belval/pdf2image: A python module that wraps the pdftoppm utility to convert PDF to PIL Image object

A python module that wraps the pdftoppm utility to convert PDF to PIL Image object - GitHub - Belval/pdf2image: A python module that wraps the pdftoppm utility to convert PDF to PIL Image object

github.com

 

 

 

 

 

따라서, 밑의 주소에서 최신 .zip 파일을 다운받아야 합니다.

https://github.com/oschwartz10612/poppler-windows/releases/

 

Releases · oschwartz10612/poppler-windows

Prebuilt Poppler binaries packaged for windows with dependencies - oschwartz10612/poppler-windows

github.com

 

압축을 해제한 후,

\Release-22.04.0-0\poppler-22.04.0\Library

경로의 bin 폴더를 사용하게 되니 따로 복사하여 보관해둡니다.

 

2-2. 패키지 설치

from pdf2image import convert_from_path

pip install pdf2image

 

3. 이미지 변환

file_name = 'File'
file_path = 'C:\\Users\\owner\\Desktop\\' + file_name + '.PDF'
pop_path = 'C:\\Users\\owner\\Desktop\\bin'

pages = convert_from_path(file_path, poppler_path=pop_path)

for i, page in enumerate(pages):
    page.save(file_name + str(i) + '.png', 'PNG')

파일 경로는 사용에 맞게 변경해주세요.

pop_path는 poppler의 bin 폴더가 복사되어 있는 경로입니다.

jpg 포맷을 사용하고 싶다면, png를 jpg로 변경해주세요.

 

 

반응형