컴퓨터/Python
[Python] 파이썬, PDF 파일을 이미지로 변환 (pdf2image)
sjblog
2022. 5. 30. 15:33
반응형
pdf 파일을 이미파일 (jpg, png)로 변환해보겠습니다.
1. 준비물
vscode, Python
2. 설치
2-1. poppler 준비
pdf2image 패키지는 poppler를 필요로 합니다.
Windows
Windows users will have to build or download poppler for Windows. I recommend @oschwartz10612 version which is the most up-to-date. You will then have to add the bin/ folder to PATH or use poppler_path = r"C:\path\to\poppler-xx\bin" as an argument in convert_from_path.
<출처>
https://github.com/Belval/pdf2image
따라서, 밑의 주소에서 최신 .zip 파일을 다운받아야 합니다.
https://github.com/oschwartz10612/poppler-windows/releases/
압축을 해제한 후,
\Release-22.04.0-0\poppler-22.04.0\Library
경로의 bin 폴더를 사용하게 되니 따로 복사하여 보관해둡니다.
2-2. 패키지 설치
from pdf2image import convert_from_path
pip install pdf2image
3. 이미지 변환
file_name = 'File'
file_path = 'C:\\Users\\owner\\Desktop\\' + file_name + '.PDF'
pop_path = 'C:\\Users\\owner\\Desktop\\bin'
pages = convert_from_path(file_path, poppler_path=pop_path)
for i, page in enumerate(pages):
page.save(file_name + str(i) + '.png', 'PNG')
파일 경로는 사용에 맞게 변경해주세요.
pop_path는 poppler의 bin 폴더가 복사되어 있는 경로입니다.
jpg 포맷을 사용하고 싶다면, png를 jpg로 변경해주세요.
반응형