2011년 7월 19일 화요일

html을 pdf로 바꾸기...

html 문서를 pdf로 변환해야 할 일이 생겼다.
딱 떠오르는게 오픈오피스...
오픈오피스를 서버로 구동시키고 jodconverter를 이용해서 ms office 문서를 html이나 pdf로 쉽게 바꿀수 있었기에...

당연히 쉽게 변환 했다. 오픈오피스 서버로 띄우고, jodconverter를 사용하는 쉘 스크립트 한개 만들고... 자동으로 모든게 돌아간다.

그런데 문제는... html을 pdf로 바꾼경우 오픈오피스가 그렇게 좋은 품질의 문서를 만들어 주지 않는다는 거였다. 가장큰 문제가 테이블!

테이블 로우의 높이가 죽어도 줄어들지 않는다. 넓은 쎌 위쪽 구석에 덩그러니 놓여있는 제목들...

이렇게는 안되겠어서 다른 툴을 찾아 봤다.

xhtml2pdf... python으로 만들었단다. 잘된다... 그런데 한글이 들어있는 문서는 변환이 안된다. euc-kr로해도 안되고 utf-8로 해도 안되고... 좌절이다.
다음으로 찾은게 html2ps 그리고 ps2pdf를 이용한 이중 변환.
아무려면 어떠냐 변환만 된다면...

그런데 이것도 한글을 만나자 지랄같이 동작한다.

인터넷여기저기 찾아보면 했다는 사람들은 많은데 정작 "어떻게"는 설명이 안되어 있다.
된다고 잘 설명해 놓은건 10년쯤 된자료.. 지금의 리눅스에 적용하긴 너무 시차가 크다.

이렇게 한 3일 좌절하고 있다가 천사와 같은 툴을 찾았다.

wkhtmltopdf 라는 기가막힌 툴.

오픈소스다. 그리고 한글이 들어 있는 문서 변환도 잘 한다.

리눅스와 OS-X 만 지원한다.(현재까지는)

다행히 내가 사용하는 플랫폼이 리눅스라 아무 문제 없이 사용할 수 있었다.

관심 있으신분은

http://github.com/antialize/wkhtmltopdf

위 링크를 긇어서 접속해 보기 바란다.

댓글 없음:

댓글 쓰기