首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >在线文档电子书化

在线文档电子书化

作者头像
jeremyxu
发布2019-03-15 15:39:47
发布2019-03-15 15:39:47
1.6K0
举报

在网上看到某技术产品的文档,想把文档弄下来在电子书阅读器上离线看,可发现这个技术文档没有提供pdf等电子书格式,于是想办法自己做一个,这里记录一下。

首先将文档全下载下来

代码语言:javascript
复制
wget -k --recursive --no-parent https://rook.github.io/docs/rook/v0.9/

然后写个脚本将所有html文件都转成pdf

代码语言:javascript
复制
$ wget -k --recursive --no-parent https://rook.github.io/docs/rook/v0.9/
$ cd rook.github.io/docs/rook/
$ mkdir pdfs
$ cat convert2pdf.sh

# names of files (without extension)
files=$(ls -1 v0.9 | sed -e 's/\.html$//')
# convert files
for file in $files
do
	echo "converting ${file}.html to ${file}.pdf"
	wkhtmltopdf -p socks5://127.0.0.1:1086  --javascript-delay 1000 v0.9/${file}.html pdfs/${file}.pdf
done

$ bash ./convert2pdf.sh

注意由于这些html文件引用了外部css/js,必须设置代理才能下载回来。另外文档里用到了google字体,得设置一会儿延迟,生成的pdf中字体才比较正常。

最后用常用的pdf编辑工具(如PDF Export)将这些pdf合并成一个pdf,可以参考这里

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019-03-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档