首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏PaddlePaddle

    不容错过,产业级PaddleNLP全景图大揭秘!

    导读:PaddleNLP开源的产业级NLP工具与预训练模型集,提供了依托于百度实际产品打磨,通过百亿级大数据训练的预训练模型,能够极大地方便 NLP 研究者和工程师快速应用。 这两个系统是由和Pytorch实现的。两个系统的性能如下表所示。 ? 百度提出的D-NET框架主要包括以下优势: 在预训练阶段,采用了基于飞深度学习框架中的多种预训练模型,融合了多种预训练模型的优势,获得了比官方基线更好的效果。 在微调结束后,D-NET使用知识蒸馏框架提升单模型效果,以满足本次评测对模型效率的要求。 本模型预计于Paddle Fluid v1.6版本开源,敬请期待 3.2. 4.1.Transformer on PaddlePaddle 本项目是机器翻译领域主流模型Transformer 的实现, 包含模型训练,预测以及使用自定义数据等内容。

    1.1K10发布于 2019-09-25
  • 来自专栏NLP/KG

    百度:ERNIE 3.0 、通用信息抽取 UIE、paddleNLP的安装使用

     相关文章: 基础知识介绍: 【一】ERNIE:开源开发套件,入门学习,看看行业顶尖持续学习语义理解框架,如何取得世界多个实战的SOTA效果? _汀、的博客-CSDN博客_ernie模型 百度:ERNIE 3.0 、通用信息抽取 UIE、paddleNLP的安装使用[一]_汀、的博客-CSDN博客_paddlenlp 安装  项目实战: PaddleHub --预训练模型应用工具{风格迁移模型、词法分析情感分析、Fine-tune API微调}【一】_汀、的博客-CSDN博客 PaddleHub--{超参优化AutoDL Finetuner}【二】_ https://github.com/PaddlePaddle/PaddleNLP 1.安装paddle 参考官网:开始使用_-源于产业实践的开源深度学习平台 首先在anaconda下创建虚拟环境 3.PaddleNLP Transformer预训练模型 PaddleNLP Transformer预训练模型 — PaddleNLP 文档 PaddleNLP的Transformer预训练模型包含从 

    3K10编辑于 2022-12-21
  • 来自专栏PaddlePaddle

    史上最全解读 | 模型库重大升级,主流算法模型全覆盖

    今天给大家带来的是系列文章之的基础模型库解读。 模型库,包含智能视觉(PaddleCV),智能文本处理(PaddleNLP),智能语音(PaddleSpeech)和智能推荐(PaddleRec)四大领域,官方支持 100 多个经过产业实践长期打磨的主流模型 截至目前,已经可以支持人工智能领域应用主流算法模型的。开发者在工业应用项目落地中,可以利用模型库中快速实现。 ? 这个模型也毫无保留的开放给广大开发者。 智能文本处理PaddleNLP PaddleNLP 是基于飞深度学习框架开发的自然语言处理 (NLP) 工具,算法,模型和数据的开源项目。

    99930发布于 2019-11-18
  • 来自专栏机器之心

    开箱即用的产业级NLP工具库,性能加速最高可达28倍!

    传送门:https://github.com/PaddlePaddle/PaddleNLP PaddleNLP 整体开源能力速览 PaddleNLP生态的自然语言处理开发库,旨在提升文本领域的开发效率 PaddleNLP 功能全景图 PaddleNLP 项目自发布以来,就受到广大 NLPer 的关注。 ,并凭借核心框架的能力升级提供开箱即用、极致优化的高性能一键预测能力——Taskflow。 同时结合核心框架 2.1 版本全新的自定义 OP 的功能,提供了与框架无缝衔接的使用体验。 直播预告 除了重磅发版以外呢,我们还为大家精心准备了配套课程,在 10 月 13-15 日,连续三天 PaddleNLP 技术精讲课程,百度的明星讲师们历时一个月呕心沥血打磨的三日课,小伙伴们速度扫码报名

    74630编辑于 2023-03-29
  • 来自专栏PaddlePaddle

    使用PaddleNLP打造精准文献检索系统,看万方系统升级放大招!

    今天就来聊聊,我们如何使用百度PaddleNLP升级论文检索系统。 在这些业务上,我们经历了长期的探索,最终使用。 技术选型和项目实践 在产业实践方面提供了强悍的产品功能和技术支持,我们基于PaddleNLP中丰富前沿的预训练模型、使用Paddle Serving实现了服务端的快速部署,解决了实际业务落地中的痛点 我们通过PaddleNLP提供的高质量中文预训练Word Embedding构造训练数据标签,结合SimCSE以及深度优化过的文本匹配预训练模型Sentence-BERT,大幅提升了算法精度。 为了满足线上业务对于性能上的要求,我们通过原生推理库Paddle Inference 结合服务化部署框架Paddle Serving进行推理预测。

    80810发布于 2021-09-27
  • 来自专栏学弱猹的精品小屋

    性能加速最高可达28倍!这个NLP工具包太NB了!

    传送门: GitHub项目: https://github.com/PaddlePaddle/PaddleNLP 二、PaddleNLP整体开源 能力速览 PaddleNLP生态的自然语言处理开发库 PaddleNLP功能全景图 PaddleNLP项目自发布以来,就受到广大NLPer的关注。 在2021年6月PaddleNLP官方直播打卡课中,有7000+ 用户参加PaddleNLP的项目学习和实践,加速了自身科研和业务实践进程,同时也带动PaddleNLP多次登上GitHub Trending 开箱即用的工业级NLP预置任务能力——Taskflow 依托于百度在多年语言与知识领域的业务积淀,PaddleNLP面向NLP八种任务场景,聚合了众多百度自研的算法以及社区开源模型,并凭借核心框架的能力升级提供开箱即用 同时结合核心框架2.1版本全新的自定义OP的功能,提供了与框架无缝衔接的使用体验。

    81920发布于 2021-10-18
  • 来自专栏PaddlePaddle

    ​金融产业应用详解 | 表单自动识别、保险智能问答端到端方案

    本次产业实践范例库开源表单自动识别、保险智能问答两个金融行业典型场景应用,提供了从数据准备、模型训练及优化的全流程可复用方案,降低产业落地门槛。 图3 表单识别解决方案流程图 模型优化策略和效果 本方案的OCR核心能力基于百度自研PP-OCRv2模型,包含文本检测和识别模型,分别进行优化。 范例使用工具介绍 PaddleOCR是百度OCR模型库,依托于飞核心框架,在模型算法、预训练模型库、工业级部署等层面均提供了丰富的解决方案,并且提供了数据合成、半自动数据标注工具,满足开发者的数据生产需求 本次产业实践范例,基于PaddleNLP实现智能问答方案,在没有标注数据的情况下,也可以得到一个效果不错的智能问答模型。 范例使用工具介绍 PaddleNLP是百度自然语言处理模型库,具备易用的文本领域API、丰富的预训练模型、多场景的应用示例、以及依托框架底层算子优化的高性能推理能力,旨在提升开发者在文本领域的开发效率

    1.1K30编辑于 2022-09-01
  • 来自专栏算法之名

    paddle技术点整理

    前面的步骤跟乌班图安装Pytorch、Tensorflow Cuda环境 是一样。

    70230编辑于 2022-09-19
  • 来自专栏PaddlePaddle

    AI Studio精品项目合集 | NLP领域的Transformer实践

    项目维护者:PaddleEdu 主要框架/模型库:核心框架PaddlePaddle,自然语言处理模型库PaddleNLP 项目链接: https://aistudio.baidu.com/aistudio 项目维护者:PaddleEdu 主要框架/模型库:核心框架PaddlePaddle,自然语言处理模型库PaddleNLP 项目链接: https://aistudio.baidu.com/aistudio 项目维护者:PaddleEdu 主要框架/模型库:核心框架PaddlePaddle,自然语言处理模型库PaddleNLP 项目链接: https://aistudio.baidu.com/aistudio 项目维护者:PaddleEdu 主要框架/模型库:核心框架PaddlePaddle,自然语言处理模型库PaddleNLP 项目链接: https://aistudio.baidu.com/aistudio

    44720发布于 2021-09-27
  • 来自专栏AI派

    政务问答机器人,助推数字化服务升级

    百度自然语言处理模型库PaddleNLP近期开源的FAQ问答系统,提出了针对无监督数据的端到端检索式问答系统方案,无需标注数据也能够轻松构建起检索系统,并且提供训练、预测、最近邻搜索一站式能力。 RocketQA效果领先 问答系统RocketQA+SimCSE+WR效果说明 性能强:与开源向量数据库Milvus打通,结合百度原生推理库Paddle Inference,实现高性能建库,并在千万级数据中做到毫秒级快速查询 PaddleNLP介绍 PaddleNLP是百度自然语言处理模型库,具备易用的文本领域API、丰富的预训练模型、多场景的应用示例、以及依托框架底层算子优化的高性能推理能力,旨在提升开发者在文本领域的开发效率 前往GitHub获取FAQ问答系统开源代码和模型: https://github.com/PaddlePaddle/PaddleNLP/tree/develop/applications/question_answering

    1.6K20编辑于 2022-04-19
  • 来自专栏PaddlePaddle

    『跟着雨哥学AI』系列之八:趣味案例——有关NLP任务数据预处理的那些事儿

    课程简介: “跟着雨哥学AI”是百度开源框架近期针对高层API推出的系列课。 本课程由多位资深工程师精心打造,不仅提供了从数据处理、到模型组网、模型训练、模型评估和推理部署全流程讲解;还提供了丰富的趣味案例,旨在帮助开发者更全面清晰地掌握百度框架的用法,并能够举一反三、灵活使用框架进行深度学习实践 回顾往期: 『跟着雨哥学AI』系列:详解框架数据管道 『跟着雨哥学AI』系列之二:详解框架模型组网 『跟着雨哥学AI』系列之三:详解框架模型训练 『跟着雨哥学AI』系列之四:详解框架高阶用法 、功能完备的产业级深度学习平台,包括开源平台和企业版。 企业版基于飞开源平台,针对企业级需求增强了相应特性,包含零门槛AI开发平台EasyDL和全功能AI开发平台BML。

    83640发布于 2021-05-07
  • 来自专栏Niuery的技术日记

    百度 --- 试玩PaddleOCR

    简介 介绍「PaddleOCR」之前,先来介绍一下百度的项目: 「百度(PaddlePaddle)」 是百度推出的开源深度学习平台。 作为国内领先的深度学习框架之一,提供了丰富的工具和资源,帮助开发者和研究者轻松地构建、训练和部署各种深度学习模型。

    1.3K31编辑于 2023-10-22
  • 来自专栏机器之心

    百度发布螺旋PaddleHelix

    机器之心发布 机器之心编辑部 百度正式发布基于飞的生物计算平台 - 螺旋 PaddleHelix,进军生物计算领域。 在本月 20 号召开的 WAVE SUMMIT+2020 深度学习开发者峰会上,百度正式发布了基于飞的生物计算平台 - 螺旋 PaddleHelix,进军生物计算领域。 螺旋 PaddleHelix 官网地址:https://www.paddlepaddle.org.cn/paddle/paddlehelix 螺旋 PaddleHelixGitHub 地址:https 螺旋 PaddleHelix 也提供了一些通过了验证的,可以有效应用于下游任务的模型,效果如表 2 所示。 我们也期待,螺旋 PaddleHelix 的发布能带来更多的跨界惊喜,在生物医药、精准医疗、疫苗设计等领域发挥出更大的价值。

    44710编辑于 2023-03-29
  • 本地化部署DeepSeek-R1蒸馏大模型:基于飞PaddleNLP 3.0的实战指南

    一、框架3.0:大模型推理新范式的开启在AI大模型不断迈向更高参数规模和更强通用能力的当下,基础框架的演进已经成为大模型落地的关键支点。 在这样的架构革新下,框架3.0为大模型的快速部署、灵活适配和性能压榨提供了坚实支撑。 1.1 自动并行机制革新:解放多卡推理框架3.0引入的动静统一自动并行机制,彻底改变了传统手动编写分布式通信逻辑的繁琐方式。 2.1 机器环境说明宿主机系统:Ubuntu 20.04CUDA版本:12.4Docker版本:23+镜像:paddlepaddle/paddlenlp:llm-serving-cuda124-cudnn9 在“大模型国产化”的背景下,框架3.0 不仅是一套技术工具,更是一条从科研走向产业、从训练走向落地的智能之路。

    52010编辑于 2025-04-03
  • 本地化部署DeepSeek-R1蒸馏大模型:基于飞PaddleNLP 3.0的实战指南

    在这样的架构革新下,框架3.0为大模型的快速部署、灵活适配和性能压榨提供了坚实支撑。 1.1 自动并行机制革新:解放多卡推理 框架3.0引入的动静统一自动并行机制,彻底改变了传统手动编写分布式通信逻辑的繁琐方式。 1.2 推理-训练统一设计:一套代码全流程复用 框架3.0秉承“训推一体”理念,解决了以往模型在训练与部署之间需要重复构建的难题。 2.1 机器环境说明 宿主机系统:Ubuntu 20.04 CUDA版本:12.4 Docker版本:23+ 镜像:paddlepaddle/paddlenlp:llm-serving-cuda124 在“大模型国产化”的背景下,3.0 不仅是一套技术工具,更是一条从科研走向产业、从训练走向落地的智能之路。

    42000编辑于 2025-04-07
  • 来自专栏PaddlePaddle

    ​NLP产业应用实战,评论观点抽取与分析和文本语义检索深度详解

    本次产业实践范例库开源评论观点抽取与分析、文本语义检索两个NLP技术典型场景应用,提供了从数据准备、模型训练优化,到模型部署的全流程可复用方案,降低产业落地门槛。 为了提升模型预测效果,本项目采用了PaddleNLP 联合 PaddleSlim 发布的模型蒸馏、剪裁、量化等级联模型压缩方案。 方案设计 针对上述难点,本项目最终选用了PaddleNLP的Neural Search中的技术方案,并且使用服务化部署框架Paddle Serving 进行服务化部署。 范例使用工具介绍 PaddleNLP是百度自然语言处理模型库,具备易用的文本领域API、丰富的预训练模型、多场景的应用示例、以及依托框架底层算子优化的高性能推理能力,旨在提升开发者在文本领域的开发效率 PaddleNLP提供了语义检索、情感分析、FAQ问答等产业级系统方案,采用前沿技术方案,打通数据标注、模型预训练及微调、部署全流程,十分简单易用,极大地降低开发门槛。

    95730编辑于 2022-04-20
  • 来自专栏PaddlePaddle

    如何基于OpenVINO加速模型推理?

    团队和OpenVINO团队的合作推进下,目前OpenVINO已支持直接导入模型格式进行模型优化转换和部署;而为了给开发者带去更好的体验,我们也正在开展将OpenVINO作为后端引擎向原生推理框架 基于飞及OpenVINO进行项目开发的典型工作流程为: (1)模型训练部分: (2)模型转换及应用部分 搭建开发环境及模型训练 为了兼顾效率和精度,在实际案例中采用了PaddleDetection 1.配置框架 安装CPU或GPU版本的,本文所安装的版本为paddlepaddle-gpu==2.1.3.post112,python版本为3.6.2。 下面介绍如何将的.pdmodel模型转换至OpenVINO的IR格式。 IR格式的模型,包含XML和BIN两个文件。 ,可通过mo.py脚本直接将模型转换成IR格式,需要我们做的就是指定模型类型、模型的输入输出、路径等各项参数,整个过程非常地高效和便捷。

    1.4K20发布于 2021-11-17
  • 来自专栏PaddlePaddle

    玩明日方舟

    不过,在这个项目中,我将带大家暂时忘却现实的烦恼,用深度强化学习框架PARL来实现这个“英雄梦”!先放效果图: ? 知识回顾 大家是不是迫不及待了呢? 如果您想详细了解更多的相关内容,请参阅以下文档。 ·官网地址· https://www.paddlepaddle.org.cn/ ·开源框架项目地址· GitHub: https://github.com/PaddlePaddle/Paddle Gitee: https://gitee.com/paddlepaddle/Paddle ·深度强化学习框架项目地址· https://github.com/PaddlePaddle/PARL

    93420发布于 2021-04-20
  • 来自专栏PaddlePaddle

    走进机器阅读理解的世界,开源升级版 BiDAF模型解读

    导读:(PaddlePaddle)致力于让深度学习技术的创新与应用更简单。 在重要的机器阅读领域,基于DuReader数据集,升级并开源了一个经典的阅读理解模型 —— BiDAF,相较于DuReader原始论文中的基线,在效果上有了大幅提升,验证集上的ROUGE-L指标由原来的 此次开源的BiDAF模型,是基于DuReader阅读理解数据集来训练的。 数据集地址: https://ai.baidu.com/broad/subordinate? BiDAF快速上手 3.1.基础环境 (1)安装 关于飞框架的安装教程,可以参考官方网站。 想与更多的深度学习开发者交流,请加入官方QQ群:432676488。 如果您想详细了解更多的相关内容,请参阅以下文档。

    1K20发布于 2019-09-05
  • 来自专栏微卡智享

    PaddleOCR C++预测库布署

    7分钟 前言 关于OCR这块以前《Android通过OpenCV和TesserartOCR实时进行识别》中用过TesserartOCR,原来用的模型库也挺大,最近也研究了下别的OCR,最终决定采用百度 PaddleOCR,本篇就是基于百度的PaddleOCR在Window版下C++的布署。 Q1 为什么使用PaddleOCR?

    3.1K20发布于 2021-07-07
领券