首页
学习
活动
专区
圈层
工具
发布
首页标签自然语言处理

#自然语言处理

自然语言处理(Natural Language Processing,简称NLP)是一种人工智能技术,它是指让计算机能够理解、处理和生成自然语言的能力

AI语言理解的相变时刻

用户11764306

一项发表在《统计力学杂志:理论与实验》上的研究描述了神经网络训练过程中文本理解策略的急剧转变。

8410

什么是用户短期兴趣和长期兴趣建模?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

9810

从非结构化到结构化:基于少样本学习的文档抽取系统架构与应用场景

中科逸视OCR专家

在企业的日常运营中,海量的非结构化文档——合同、订单、票据、法律文书、企业证照等承载着核心业务信息。然而,这些文档格式各异、布局多变,传统基于固定模板或规则引擎...

13910

对话式AI与信息抽取技术探索

用户11764306

Ji应对这一挑战的关键方法是自然语言处理(NLP)以及她在信息抽取(IE)方面的开创性工作。

12510

什么是信息茧房?推荐系统怎么平衡个性化和多样性?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

21810

什么是RAG文档切分策略?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

26720

什么是Semantic Chunking?与固定长度切分有什么区别?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

8510

知识融合(Knowledge Fusion)是什么?多个知识源怎么整合?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

16610

基于大模型与光学字符识别(OCR)融合的文档抽取技术,为证照管理提供了新的技术路径

中科逸视OCR专家

企业证照管理是组织运营中的基础性工作,涉及营业执照、资质证书、许可文件等多种类型文档的归档、核验与更新。传统管理方式多依赖人工录入与复核,存在效率瓶颈与差错风险...

10100

什么是上下文压缩?如何减少Token消耗?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

33610

什么是远程监督?怎么自动生成训练数据?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

11210

什么是GraphRAG?知识图谱如何增强RAG系统?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

50010

什么是RAG中的幻觉问题?引用溯源如何实现?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

24310

面向复杂多语言问答的Mintaka数据集发布

用户11764306

问答(QA)是机器学习中的一项任务,旨在学习预测问题的答案。例如,给定问题“娜塔莉·波特曼出生在哪里?”,一个问答模型可以利用网络文章、知识图谱中的事实或模型内...

7910

计算机视觉+自然语言处理:机动车登记证识别背后的技术组合

中科逸视OCR专家

机动车登记证书(即“大绿本”)是车辆产权归属的核心法律文件,在流通、金融、司法等环节中具有关键作用。传统的人工核验与信息录入方式存在效率低、易出错、防篡改能力弱...

6900
领券