Skip to content

Latest commit

 

History

History
18 lines (12 loc) · 680 Bytes

README.md

File metadata and controls

18 lines (12 loc) · 680 Bytes

pdf2text

为解决使用 lwarp 过程中内部调用 poppler 中的 pdftotext.exe 转换 pdf 时出现的文章顺序错误问题,用 pdf-extract 的测试例子改了下做成 pdf2text

用法:

编译后把 pdf2text.exe 复制到 pdftotext.exe 同一目录,找到 lwarpmk.lua 中的 pdftohtml 函数,把

os.execute("pdftotext  -enc " .. pdftotextenc .. "  -nopgbrk  -layout "
    .. sourcename .. "_html.pdf " .. sourcename .. "_html.html")

改为

os.execute("pdf2text " .. sourcename .. "_html.pdf " .. sourcename .. "_html.html")