首页
学习
活动
专区
圈层
工具
发布
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    MinerU、Magic-PDF、Magic-Doc

    关于 MinerU MinerU 是一款一站式、开源、高质量的数据提取工具,主要包含以下功能: Magic-PDF PDF文档提取 Magic-Doc 网页与电子书提取 github: https://...自动识别并转换 支持cpu和gpu环境 支持windows/linux/mac平台 项目全景 流程图 子模块仓库 PDF-Extract-Kit 高质量的PDF内容提取工具包 Magic-PDF...github:https://github.com/opendatalab/magic-doc 简介 Magic-Doc 是一个轻量级、开源的用于将多种格式的文档(PPT/PPTX/DOC/DOCX/...跨模态精准解析图文、表格、公式信息 电子书文献提取 支持 epub,mobi等多格式文献,文本图片全适配 语言类型鉴定 支持176种语言的准确识别 安装 前置依赖: python3.10 安装依赖 linux...) 347 (page/s) PDF (ocr) 2.7 (page/s) PPT 20 (page/s) PPTX 149 (page/s) DOC 600 (page/s) DOCX 1482 (page

    2.2K10

    pdf转图片

    pdf转图片把 PDF 转成图片是个很简单的事,可以让你更方便地分享、查看或编辑页面。很多人需要把 PDF 的页面做成图片去发到网站、放到演示文稿里,或发送到不支持 PDF 的设备。...你会学到在 Windows、macOS、Linux 上以及在线选项的快速方法,还有一些保持图片质量和文件大小平衡的小贴士。最后你就能知道哪种方法适合你,和如何避免常见问题。...另外我也见过人用磨针工具软件在 Windows 上快速批量转图,设置好分辨率一键导出,挺方便的。...Linux 和命令行方法在 Linux 上常见的工具有 ImageMagick 和 pdftoppm。pdftoppm 属于 poppler 工具集,可以很快把 PDF 页面转成 PNG。...有人推荐过磨针工具软件的网页版,可以直接上传小文件快速转,使用体验挺直观的,不过别上传敏感文件。质量和文件大小小贴士更高的分辨率会得到更清晰的图片,但文件会更大。

    31400

    pdf转markdown

    六个开源的PDF转Markdown项目 ✨ 1: gptpdf gptpdf 是一个利用VLLM解析PDF为Markdown的工具,几乎完美支持数学公式、表格等。...例如,如果你在Linux系统上使用CUDA 10.2,安装命令如下: pip install torch torchvision torchaudio --extra-index-url https:/...--max 设定要转换的PDF文件最大数量。省略此参数将以转换文件夹内的所有PDF。 --min_length 是从PDF中提取字符的最小数量,达到这个限制后PDF才会被考虑处理。...格式如下: { "pdf1.pdf": {"languages": ["英语"]}, "pdf2.pdf": {"languages": ["西班牙语", "俄语"]}, ... } ✨ 3...文档 兼容 CPU 和 GPU 环境 可在 Windows、Linux 和 macOS 平台上使用 Magic-Doc 功能介绍:Magic-Doc 能将网页或多格式电子书转换为 Markdown 格式

    1.8K10

    JAVA开源的html转pdf、png转pdf项目

    总览 Open HTML to PDF是一个纯Java库,用于使用CSS 2.1(以及更高版本的标准)对合理子集的格式良好的XML/XHTML(甚至一些HTML5)进行布局和格式化,输出为PDF或图像。...使用该库生成漂亮的PDF文档。但请注意,您不能将现代HTML5+直接应用于该引擎并期望获得出色的结果。...特性 使用维护良好且开源(兼容LGPL)的PDFBOX作为PDF库,而不是iText。 提供适当的支持生成无障碍PDF(Section 508,PDF/UA,WCAG 2.0)。...提供适当的支持生成符合PDF/A标准的PDF。 新的、更快的渲染器意味着对于非常大的文档,该项目可以快几倍。 更好地支持CSS3变换。 自动视觉回归测试PDF,有许多端到端测试。...OPEN HTML TO PDF已经在OpenJDK 8、11和17(早期版本)上进行了测试。至少需要Java 8才能运行。 不,你不能在Android上使用它。 你应该能

    1.4K10

    pdf转word图片转word

    通常情况下,我们需要将pdf格式的文件或者图片格式的文件转换为可编辑的word格式,之前多数人都使用OCR识别软件来进行转换,现在教大家一种方法,百试不爽。...破解(试用的也可以,只有30天的使用时长)完后打开选择需要转换的图片或者PDF文件。 右键使用Adobe PDF软件打开。 ?...点击左上角的“文件—另存为(s)”即可存储为其他文件格式;如:word ,pdf等可编辑文件格式,另存到自定义的路径就可以了,有个别文字会出现错误的情况,对照一下源文件修改一下即可。...往期推荐文章教程: 开启Windows“超级性能”卓越模式 安全攻防-Kali linux 让对方断网(arp欺骗) Windows10获得永久授权 Linux运维学习之数据库备份与恢复 Linux...运维基础篇之(笔记本篇) U盘安装Windows和Ubuntu Linux双系统图解教程 win10下安装linux子系统 你猜黑客都用Linux系统还是Windows系统?

    10.8K50
    领券