首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Nougat:一种用于科学文档OCR的Transformer 模型

    Meta AI的一组研究人员推出了一种名为Nougat的解决方案,它代表“Neural Optical Understanding for Academic Documents”。...为了对科学文本进行光学字符识别(OCR),Nougat是一种VIT模型。它的目标是将这些文件转换为标记语言,以便更容易访问和机器可读。 为了显示该方法的有效性,该团队还制作了一个新的学术论文数据集。...Nougat基本上是一个基于Transformer的模型,用于将文档页面的图像(特别是来自pdf的图像)转换为格式化的标记文本。...这种数据集开发方法对于测试和改进Nougat模型至关重要,也可能对未来的文档分析研究和应用有用。...可以说Nougat通过利用VIT模型的功能,开创了OCR的新时代。它具有理解复杂科学文档并将其转换为结构化标记语言的能力,为无缝的信息可访问性铺平了道路,弥合了人类理解和机器分析之间的差距。

    77220

    —款能将各类文件转换为 Markdown 格式的AI工具—Marker

    nougat 论文中我们观察到:在测试集中有 1.5% 的页面出现了重复,但对于非领域(非 arXiv)文档,这种频率会增加。...Nougat是一个惊人的模型,但我需要一个更快速且更通用的解决方案。Marker 的速度是 nougat 的 10 倍,并且因为它只通过 LLM 前向传递处理方程式块,所以具有较低的幻觉风险。...基准测试显示,marker 比 nougat 快 10 倍,在 arXiv 之外更准确(nougat 是在 arXiv 数据上训练的)。...它为 nougat 和 marker 设置批量大小,以使每个使用相似数量的 GPU RAM。省略 --nougat 以从基准测试中排除 nougat。...我不建议在 CPU 上运行 nougat,因为它非常慢。 商业使用 由于底层模型如 layoutlmv3 和 nougat 的许可证,这只适用于非商业用途。

    2.6K10

    Meta祭出Nougat,PDF格式转换,公式表格精准识别,扫描版文档也可以

    新智元报道 编辑:桃子 【新智元导读】最新科研神器Nougat,可以把PDF中公示、文本提取出来。 做研究的童鞋们简直要狂喜!...不过有柱状图的文档,Nougat暂时还不能呈现。 这么神的科研利器,究竟是什么来头? 科研OCR神器,怎么来?...对此,Meta的研究人员基于Vision Transformer架构,为处理科学文档量身订制定制了一款光学字符识别(OCR)——Nougat。...实验结果 测试中,Nougat从科学论文中提取文本、公式和表格的准确率很高。 对于连续文本,它在BLEU分数超过91%,准确率超过96%。...根据实验结果,logits重复检测示例如下: Meta团队表示,Nougat是将PDF研究论文转换为结构化的机器可读文本,从而改善科学知识获取的一种有前途的解决方案。

    62720

    细数Android7.0 Nougat的几大安全增强功能

    2016年8月22日,Google开始正式向用户推送Android7.0 Nougat正式版。 在性能方面,AndroidN不仅对编译器进行了优化,而且还在图形处理方面做了更新。...Nougat不仅加入了全新的分屏多任务功能,而且还加入了多任务快速切换功能。这个功能可以帮助用户解决在两个任务之间频繁切换的问题。...接下来,我给大家简单描述一下新版的Android7.0 Nougat中到底新增了哪些安全保护功能。...新的安全特性 在今年夏天,Google公司的Android开发团队向外界展示了Android7.0 Nougat(牛轧糖)中很多新添加的安全增强特性。...除此之外,Android还提升了Nougat下应用程序的安全性,并且会对设备启动过程进行更为严格的检测。

    1.1K60

    学术党狂喜,Meta推出OCR神器,PDF、数学公式都能转

    现在,Meta AI 推出了一个 OCR 神器,可以很好的解决这个难题,该神器被命名为 Nougat。...论文地址:https://arxiv.org/pdf/2308.13418v1.pdf 项目主页:https://facebookresearch.github.io/nougat/ Nougat 不但可以识别文本中出现的简单公式...公式中出现的上标、下标等各种数学格式也分的清清楚楚: Nougat 还能识别表格: 扫描产生畸变的文本也能处理: 不过,Nougat 生成的文档中不包含图片,如下面的柱状图: 看到这,网友纷纷表示...Nougat 优于其他方法,在所有指标中取得最高分,并且具有 250M 参数模型的性能与 350M 参数模型相当。...下图为 Nougat 优对一篇论文的转换结果: Meta 表示,Nougat 在配备 NVIDIA A10G 显卡和 24GB VRAM 机器上可并行处理 6 个页面,生成速度在很大程度上取决于给定页面上的文本量

    72040
    领券