首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >用腾讯轻量云服务器来搭建PDF在线工具箱

用腾讯轻量云服务器来搭建PDF在线工具箱

原创
作者头像
李小飞
修改于 2021-09-17 08:55:07
修改于 2021-09-17 08:55:07
1.9K0
举报

上篇文章中我们讲了怎么利用腾讯轻量云服务器搭建一个PDF在线压缩工具,今天我们来搭建一个更强大的工具,不仅支持PDF在线压缩,还支持PDF OCR文字识别

前言

前两天需要压缩一个pdf文件,由于pdf中涉及到了一些个人信息,不想使用在线的网站的压缩。下载了几个离线的压缩工具,大部分居然都需要收费,虽然后来找到了一个免费的工具搞定了这件事,不过想到后面可能还会碰到这样的事情,因此萌生了自己做一个在线压缩pdf的网站的想法。查阅了相关资料,最后借助ghostscript 实现了我的需求。不过有小伙伴觉得网站功能太单调了,还有小伙伴想要OCR的功能,我看了一下ghostscript的文档,发现ghostscript是支持OCR的,那还等什么,集成就完事了。如果小伙伴们觉得有用的话,给我的仓库https://github.com/lixiaofei123/pdftoolbox点一个star吧。由于新的工具网站不仅仅是只支持pdf压缩,现在也支持OCR,后面可能还会增加别的功能,因此我将原来的pdfcomress名字改成了pdftoolbox。

下面是网站的首页,可以看到,是非常简洁的。

网站首页
网站首页

下面讲一下怎么在腾讯云轻量服务器部署这个pdf在线工具箱,有兴趣的小伙伴可以玩一下

购买腾讯云轻量服务器

既然要在轻量服务器上部署,那么就需要先购买一个轻量服务器。现在轻量服务器在做活动,2核4G的配置一年只需要74元,详情可以点击这个链接了解。如下图所示,点击购买即可

秒杀页面
秒杀页面

然后选择【地域】和【镜像】,地域的话选择距离自己最近的地域,我们后面要使用Docker进行安装,因此这里直接选择【Docker基础镜像】,下面系统可以选一个自己熟悉的,如果无所谓的话,就保持默认好了。

然后提交订单并付款,稍等一会,我们的轻量服务器实例就创建成功了。为了方便操作,需要用终端来连接服务器,这个涉及到一些配置,官方文档讲的很清楚,可以自己看着操作一下。后面的步骤默认在终端上操作。

启动Docker容器

部署一个应用最简单的方法,当然使用docker镜像了。今天的教程也不例外,我将pdf工具箱直接做成了镜像,里面已经封装好了相应的环境。因此,就不需要那么麻烦的配置环境了。只需要一行命令就可以搞定。

代码语言:txt
AI代码解释
复制
mkdir -p /data/pdftoolbox/input
mkdir -p /data/pdftoolbox/output
docker run -d --name pdftoolbox --restart=always -p 8082:8082 -v /data/pdftoolbox/input:/opt/pdftoolbox/input  -v /data/pdftoolbox/output:/opt/pdftoolbox/output  mrlee326/pdftoolbox

其中//opt/pdftoolbox/input是用来放置用户上传文件的目录,/opt/pdftoolbox/output是用来放转换后的文件的目录,建议将其挂载在宿主机上,这样就方便后面清理文件了。有能力的话,可以自己写一个定时脚本来清理过期的文件。

启动完毕后,就可以通过浏览器来访问我们的pdf在线工具箱了。目前提供了两个功能,一个是pdf压缩、一个是pdf OCR

PDF压缩

先来试用一下pdf压缩功能。在低质量模式下,可以将pdf的体积压缩到原来的1/4大小。

pdf压缩
pdf压缩

pdf压缩主要针对的是包含图片比较多的pdf,如果原pdf中基本上都是文字的话,那么压缩的效果就不太理想。因为基本上没压缩的空间了。

PDF OCR

然后就来试一下pdf的文字提取吧。这个功能同样是基于ghostscript来实现的。激活【PDF文字提取】选项,然后根据需要来选择额外支持的语言,目前内部默认支持简体中文和英文,因此基本上不需要选择。点击上传文件,就会自动进行转换,如果机器的性能比较低的话,这一步可能会比较慢,请耐心等待几分钟。等下面的进度条全部走完,并出现【点击下载】按钮,说明转换完毕,这时候点击下载即可。

文字提取
文字提取
转换结果
转换结果

证书配置

如果想要https证书的话,可以使用acme-companion容器来进行证书的自动颁发。这个操作起来也很简单。只需要额外启动两个容器即可

代码语言:txt
AI代码解释
复制
docker run --detach \
    --name nginx-proxy \
    --publish 80:80 \
    --publish 443:443 \
    --volume certs:/etc/nginx/certs \
    --volume vhost:/etc/nginx/vhost.d \
    --volume html:/usr/share/nginx/html \
    --volume /var/run/docker.sock:/tmp/docker.sock:ro \
    nginxproxy/nginx-proxy
代码语言:txt
AI代码解释
复制
 docker run --detach \
    --name nginx-proxy-acme \
    --volumes-from nginx-proxy \
    --volume /var/run/docker.sock:/var/run/docker.sock:ro \
    --volume acme:/etc/acme.sh \
    --env "DEFAULT_EMAIL=mail@yourdomain.tld" \
    nginxproxy/acme-companion

最后启动pdftoolbox。注意多了几个环境变量VIRTUAL_HOST、VIRTUAL_PORT、ETSENCRYPT_HOST,同时需要提前将pdf.bar.foo解析到轻量服务器的ip上。

代码语言:txt
AI代码解释
复制
docker run --detach \
	--restart=always --name pdftoolbox \
	-v /data/pdftoolbox/input:/opt/pdftoolbox/input \
	-v  /data/pdftoolbox/output:/opt/pdftoolbox/output \
	--env "VIRTUAL_HOST=pdf.bar.foo"  \
	--env "VIRTUAL_PORT=8082"   \
	--env "LETSENCRYPT_HOST=pdf.bar.foo" \
	mrlee326/pdftoolbox

然后通过浏览器访问https://pdf.bar.foo,就可以看到绿色的小锁了,表示我们的网站是安全的了。

总结

通过上面的过程,我们就有了一个属于自己的在线pdf工具箱网站,这样也不用担心自己的个人信息被别人保存,同时更换电脑的话也不需要重新安装软件。如果小伙伴们觉得有用的话,给我的仓库https://github.com/lixiaofei123/pdftoolbox点一个star吧

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
用轻量服务器搭建自己的专属pdf在线压缩网站
今天需要压缩一个pdf文件,由于pdf中涉及到了一些个人信息,不想使用在线的网站的压缩。下载了几个离线的压缩工具,大部分居然都需要收费,虽然后来找到了一个免费的工具搞定了这件事,不过想到后面可能还会碰到这样的事情,因此萌生了自己做一个在线压缩pdf的网站的想法。查了下相关资料,看到有一个ghostscript 工具可以来压缩pdf文件,基于这个工具做了一个简单的版本。 具体怎么做的就不说了,最终效果如下图所示。可以看到页面非常的简洁,支持同时上传多个pdf文件,适合个人使用。小伙伴们觉得有用的话,给我的仓库点个star吧。https://github.com/lixiaofei123/pdfcompress
李小飞
2021/09/16
1.7K0
用轻量服务器搭建自己的专属pdf在线压缩网站
ELK 不香了!我用 Graylog,轻量多了...
点击关注公众号,Java干货及时送达 作者:Escape 来源:www.escapelife.site/posts/38c81b25.html 服务日志收集方案:Filebeat + Graylog! 当我们公司内部部署很多服务以及测试、正式环境的时候,查看日志就变成了一个非常刚需的需求了。是多个环境的日志统一收集,然后使用 Nginx 对外提供服务,还是使用专用的日志收集服务 ELK 呢? 这就变成了一个问题!而 Graylog 作为整合方案,使用 elasticsearch 来存储,使用 mongod
Java技术栈
2022/06/08
8.5K0
ELK 不香了!我用 Graylog,轻量多了...
基于Docker快速搭建一个开源的IT人员在线工具箱-it-tools
在日常的开发工作中,我们经常需要使用各种工具来提高工作效率。为了方便快速搭建和使用这些工具。
星哥玩云
2025/01/03
2390
基于Docker快速搭建一个开源的IT人员在线工具箱-it-tools
【好用的个人工具】搭建一款实用的个人IT工具箱——it-tools
江湖有缘
2023/11/26
2.3K0
轻量应用服务器实践-安装gitlab-runner
腾讯云轻量应用服务器是一款开箱即用、面向轻量应用场景,恰逢11.11活动,新人仅需28元立享一年,每天限时抢购,手快有手慢无。传送门直达
堕落飞鸟
2024/11/04
1920
告别付费束缚,拥抱Stirling-PDF:本地部署的PDF编辑利器,最强开源PDF工具箱!
在日常工作流程中,PDF文件扮演着至关重要的角色,无论是打印标书、分享资料还是保存电子合同,PDF都是首选。尽管PDF文件的不可编辑性常常让人感到不便,但它的稳定性和安全性赢得了众多用户的青睐。
释然IT杂谈
2024/11/23
1.9K0
告别付费束缚,拥抱Stirling-PDF:本地部署的PDF编辑利器,最强开源PDF工具箱!
【好玩儿的Docker项目】10分钟搭建一个高颜值的在线工具箱,用户体验很棒!
GitHub官方仓库:https://github.com/CorentinTh/it-tools
二十五画生
2023/10/24
2.2K2
【好玩儿的Docker项目】10分钟搭建一个高颜值的在线工具箱,用户体验很棒!
Reproxy:一款功能强大的边缘服务器&反向代理工具
Reproxy是一个简单且功能强大的边缘HTTP(S)服务器和反向代理工具,该工具支持多种提供程序,比如说Docker或文件等等。这些提供程序负责给工具提供有关请求服务器的基础信息、URL地址、目标URL和运行状况检查URL等数据,能够以单个二进制文件或Docker容器的形式进行分发。
FB客服
2021/07/02
9480
使用Docker搭建poste,自建邮件服务器
自建邮件服务可以不受发件量限制,批量发件成本更低,但部署相对复杂,而且容易进垃圾箱。不过现在越来越多的服务商已经开发好了产品,支持一键部署等方式,极大降低了部署和使用难度。这次给各位小伙伴安利一款开源邮件服务poste.
星哥玩云
2022/08/13
7.7K0
使用Docker搭建poste,自建邮件服务器
云服务器的N种玩法,拥有腾讯云服务器构建你的数字世界
每年一度的双十一购物节,不仅是电商平台的狂欢盛宴,更是云计算行业的“黄金时段”。作为国内领先的云服务提供商之一,腾讯云每年都会推出一系列丰富的优惠活动,让企业和个人用户可以以更加实惠的价格,享受到云服务带来的强大能力。
星哥玩云
2024/11/13
6290
云服务器的N种玩法,拥有腾讯云服务器构建你的数字世界
玩转云服务 怎么在服务器安装Docker可视化面板-Portainer
Portainer(基于 Go)是Docker的图形化管理工具,提供状态显示面板、应用模板快速部署、容器镜像网络数据卷的基本操作(包括上传下载镜像,创建容器等操作)、事件日志显示、容器控制台操作、Swarm集群和服务等集中管理和操作、登录用户管理和控制等功能。portainer 允许您管理 Docker 容器、image、volume、network 等。 它与独立的 Docker 引擎和 Docker Swarm 兼容。
青阳
2021/08/25
6.4K1
玩转云服务 怎么在服务器安装Docker可视化面板-Portainer
【5分钟玩转Lighthouse】轻量应用服务器轻松玩转Docker
之前Lighthouse 5分钟系列教程里,介绍了使用Docker在轻量应用服务器上搭建应用服务,比如搭建bitwarden个人密码管理器,搭建calibre-web个人在线图书馆,打造沉浸式Markdown写作环境。这些教程中使用命令的方式来操作Docker,而且多台轻量应用服务器中的Docker容器需要登录多台服务器分别进行管理,不是很方便。本文为大家介绍一下,使用Portainer以可视化的方式来管理多台轻量应用服务器的Docker容器。
风之泪
2021/06/30
4.7K8
【5分钟玩转Lighthouse】轻量应用服务器轻松玩转Docker
基于腾讯云轻量应用服务器和Umami部署网站流量统计后台
想知道自己网站,每天有多少人浏览?或者想更直观的查看自己网站的访客统计?很多人会使用Google Analytics等工具进行统计。一般统计的数据:
Mintimate
2022/03/01
5.9K2
基于腾讯云轻量应用服务器和Umami部署网站流量统计后台
锐驰云端 轻速上云 腾讯云锐驰型轻量云服务器简单测评及其一应用——部署PhotoPrism
继2024年12月26日阿里云上架了200M峰值带宽不限制流量的轻量云服务器后,昨晚22:30,腾讯云也正式推出并全量发售自家的200M峰值带宽不限制流量的轻量云服务器——“腾讯云轻量应用服务器锐驰型套餐”,那么,小俊第一时间自费自购了一台2C2G200M的机器,接下来就带大家来抢先实机测评一下腾讯云轻量应用服务器锐驰型套餐以及小俊想到的其中一个主要应用场景吧!
小俊是我
2025/01/22
1.4K0
锐驰云端 轻速上云 腾讯云锐驰型轻量云服务器简单测评及其一应用——部署PhotoPrism
《树莓派4B家庭服务器搭建指南》第十一期
在本系列第九期《树莓派4B家庭服务器搭建指南》第九期:用树莓派低成本给热心老哥搭个窝,在树莓派建立BBS论坛flarum并映射到公网全攻略 https://www.v2fy.com/p/2021-11-26-flarum-1637921368000/ 中,我们完成了PHP环境的搭建,数据库,Nginx的安装...
zhaoolee
2021/12/07
1.8K0
《树莓派4B家庭服务器搭建指南》第十一期
《树莓派4B家庭服务器搭建指南》第九期
前段时间我出过一个 给热心老哥搭个窝,2021年30分钟用Discourse搭建新一代BBS论坛站全攻略 https://v2fy.com/p/2021-06-12-discourse-2021-1623477573000/ Discourse很强大,但使用了Redis数据库,很吃内存,BBS论坛这种东西,后续还需要大量的硬盘空间存图片,zhaoolee想尽可能的压缩运营成本,于是把Discourse往树莓派移植,但Discourse官方不支持树莓派armv8架构的CPU,Discourse所需的ruby包在树莓派上也有各种各样的问题, 于是我开始寻找替代品,最终找到了flarum!
zhaoolee
2021/12/07
1.2K0
《树莓派4B家庭服务器搭建指南》第九期
全面解析腾讯云轻量服务器:从基础操作到高级应用的实践指南
在双十一这个购物狂欢节,腾讯云轻量应用服务器为开发者带来了前所未有的优惠!无论你是刚刚入门的小白,还是经验丰富的开发者,腾讯云轻量应用服务器都能为你提供强大且高效的技术支持。简化的操作界面、灵活的配置选项、超高性价比,让你无需复杂的设置,就能轻松部署网站和应用,迅速搭建属于自己的云端环境。现在正是入手的最佳时机,赶紧抓住双十一的优惠,让你的项目更快上线,享受云计算带来的无限可能!
一键难忘
2024/11/29
3460
【好玩儿的Docker项目】用腾讯云轻量应用服务器10分钟搭建一个轻量的视频分享网站——Fireshare
文章首发于:https://blog.laoda.de/archives/docker-compose-install-fireshare
二十五画生
2022/11/10
4K0
【好玩儿的Docker项目】用腾讯云轻量应用服务器10分钟搭建一个轻量的视频分享网站——Fireshare
用轻量服务器搭建在线协作绘图白板
WBO是一个自由和开源的在线协作白板。它允许多个用户同时在一个虚拟的大型白板上画图。该白板对所有线上用户实时更新,并且状态始终保持。它可以用于许多不同的目的,包括艺术、娱乐、设计和教学,使用起来也非常有趣。同时,WBO支持公共模式和私有模式,既可以让所有的访问者一起绘制,也可以几个好友创建一个私密共享的白板。下面是公共白板的截图,所有打开这个公共白板的人都可以实时看到别人的绘制成功。
李小飞
2021/11/22
1.9K0
用腾讯云轻量服务器搭建一个漂亮的导航主页
经常看到别人有一个漂亮的导航主页而羡慕不已,想自己也搭建一个,但是只能留下没技术的泪水。今天无意间看到了一个开源的主页项目,看起来非常的漂亮,可以高度自定义,而且还提供了docker镜像,安装起来也十分的方便。
李小飞
2021/11/22
2.1K0
推荐阅读
用轻量服务器搭建自己的专属pdf在线压缩网站
1.7K0
ELK 不香了!我用 Graylog,轻量多了...
8.5K0
基于Docker快速搭建一个开源的IT人员在线工具箱-it-tools
2390
【好用的个人工具】搭建一款实用的个人IT工具箱——it-tools
2.3K0
轻量应用服务器实践-安装gitlab-runner
1920
告别付费束缚,拥抱Stirling-PDF:本地部署的PDF编辑利器,最强开源PDF工具箱!
1.9K0
【好玩儿的Docker项目】10分钟搭建一个高颜值的在线工具箱,用户体验很棒!
2.2K2
Reproxy:一款功能强大的边缘服务器&反向代理工具
9480
使用Docker搭建poste,自建邮件服务器
7.7K0
云服务器的N种玩法,拥有腾讯云服务器构建你的数字世界
6290
玩转云服务 怎么在服务器安装Docker可视化面板-Portainer
6.4K1
【5分钟玩转Lighthouse】轻量应用服务器轻松玩转Docker
4.7K8
基于腾讯云轻量应用服务器和Umami部署网站流量统计后台
5.9K2
锐驰云端 轻速上云 腾讯云锐驰型轻量云服务器简单测评及其一应用——部署PhotoPrism
1.4K0
《树莓派4B家庭服务器搭建指南》第十一期
1.8K0
《树莓派4B家庭服务器搭建指南》第九期
1.2K0
全面解析腾讯云轻量服务器:从基础操作到高级应用的实践指南
3460
【好玩儿的Docker项目】用腾讯云轻量应用服务器10分钟搭建一个轻量的视频分享网站——Fireshare
4K0
用轻量服务器搭建在线协作绘图白板
1.9K0
用腾讯云轻量服务器搭建一个漂亮的导航主页
2.1K0
相关推荐
用轻量服务器搭建自己的专属pdf在线压缩网站
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档