pdfkit | 自动化利器,生成PDF就靠它了

栏目: IT技术 · 发布时间: 4年前

在用jupyter notebook写代码文档的时候,有时需要导出pdf版本,但jupyter会报错。我在想,除了网上的debug方法,还没有其他方案可以生成pdf。

度娘搜了下,很多博客推荐 Python 的第三方库 pdfkit ,可以将 网页、html文件以及字符串 生成pdf文件。

其实也有很多软件提供pdf生成服务,但这样太不python了,那下面就来试试 pdfkit 怎么用吧!

三步实现自动生成pdf文档:

  1. 使用 pip 安装 pdfkit

python版本 3.x,在命令行输入:

pip install pdfkit

pdfkit | 自动化利器,生成PDF就靠它了

安装过程基本不会有啥问题,出现上面的 Successfully installed pdfkit-0.6.1 提示,说明安装成功了。

  1. 安装 wkhtmltopdf.exe 文件

注:pdfkit是基于wkhtmltopdf的python封装,所以需要安装wkhtmltopdf.exe。wkhtmltopdf是轻量级软件,非常很容易安装。

下载地址:

https://wkhtmltopdf.org/downloads.html

pdfkit | 自动化利器,生成PDF就靠它了
下载wkhtmltopdf

下载完成后,一路next,将wkhtmltopdf安装好。

务必要记住安装地址,找到 wkhtmltopdf.exe 文件所在的绝对路径,后面要用到。

我这里是默认路径 ""C:\Program Files\wkhtmltopdf\bin\wkhtmltopdf.exe""

pdfkit | 自动化利器,生成PDF就靠它了
安装wkhtmltopdf
  1. 使用 pdfkit 库生成pdf文件

前面说过 pdfkit 可以将 网页、html文件、字符串 生成pdf文件。

  • 网页生成pdf【 pdfkit.from_url() 函数】
# 导入库
import pdfkit

'''将网页生成pdf文件'''
def url_to_pdf(url, to_file):
    # 将wkhtmltopdf.exe程序绝对路径传入config对象
    path_wkthmltopdf = r'C:\\Program Files\\wkhtmltopdf\\bin\\wkhtmltopdf.exe'
    config = pdfkit.configuration(wkhtmltopdf=path_wkthmltopdf)
    # 生成pdf文件,to_file为文件路径
    pdfkit.from_url(url, to_file, configuration=config)
    print('完成')

# 这里传入我知乎专栏文章url,转换为pdf
url_to_pdf(r'https://zhuanlan.zhihu.com/p/69869004', 'out_1.pdf')
  • html文件生成pdf【 pdfkit.from_file() 函数】
# 导入库
import pdfkit

'''将html文件生成pdf文件'''
def html_to_pdf(html, to_file):
    # 将wkhtmltopdf.exe程序绝对路径传入config对象
    path_wkthmltopdf = r'C:\\Program Files\\wkhtmltopdf\\bin\\wkhtmltopdf.exe'
    config = pdfkit.configuration(wkhtmltopdf=path_wkthmltopdf)
    # 生成pdf文件,to_file为文件路径
    pdfkit.from_file(html, to_file, configuration=config)
    print('完成')

html_to_pdf('sample.html','out_2.pdf')
  • 字符串生成pdf【 pdfkit.from_string() 函数】
# 导入库
import pdfkit

'''将字符串生成pdf文件'''
def str_to_pdf(string, to_file):
    # 将wkhtmltopdf.exe程序绝对路径传入config对象
    path_wkthmltopdf = r'C:\\Program Files\\wkhtmltopdf\\bin\\wkhtmltopdf.exe'
    config = pdfkit.configuration(wkhtmltopdf=path_wkthmltopdf)
    # 生成pdf文件,to_file为文件路径
    pdfkit.from_string(string, to_file, configuration=config)
    print('完成')

str_to_pdf('This is test!','out_3.pdf')
  1. 结论

本文讲了如何在Python中使用 pdfkit 库生成pdf文件,非常方便快捷,适合批量自动化操作。

我们看看生成的pdf效果如何:

pdfkit | 自动化利器,生成PDF就靠它了
pdf效果展示

整体页面视觉不错呦,赶快用起来吧!

精彩回顾

Python网络爬虫与文本数据分析

如何使用Python快速构建领域内情感词典

Pandas 50题练习

Pandas数据处理——盘点那些常用的函数(上)

Pandas数据处理——盘点那些常用的函数(下)

中文文本数据逻辑性分析库

中文文本分析相关资源汇总

cnsenti中文情绪情感分析库

Python全栈-60天精通之路

Python数据分析相关学习资源汇总帖

漂亮~pandas可以无缝衔接Bokeh

综述:文本分析在市场营销研究中的应用

2020年B站跨年晚会弹幕内容分析

YelpDaset: 酒店管理类数据集10+G

Loughran&McDonald金融文本情感分析库

测试代码获取,在后台留言:pdfkit


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

重来

重来

[美] 贾森·弗里德、[丹] 戴维·海涅迈尔·汉森 / 李瑜偲 / 中信出版社 / 2010-10 / 36.00元

大多数的企业管理的书籍都会告诉你:制定商业计划、分析竞争形势、寻找投资人等等。如果你要找的是那样的书,那么把这本书放回书架吧。 这本书呈现的是一种更好、更简单的经商成功之道。读完这本书,你就会明白为什么计划实际上百害而无一益,为什么你不需要外界投资人,为什么将竞争视而不见反倒会发展得更好。事实是你所需要的比你想象的少得多。你不必成为工作狂,你不必大量招兵买马,你不必把时间浪费在案头工作和会议......一起来看看 《重来》 这本书的介绍吧!

在线进制转换器
在线进制转换器

各进制数互转换器

UNIX 时间戳转换
UNIX 时间戳转换

UNIX 时间戳转换

HEX CMYK 转换工具
HEX CMYK 转换工具

HEX CMYK 互转工具