Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >学习大型语言模型,有哪些书籍、论文、在线课程可以学习,推荐的呢?

学习大型语言模型,有哪些书籍、论文、在线课程可以学习,推荐的呢?

原创
作者头像
gavin1024
发布于 2023-05-18 11:56:55
发布于 2023-05-18 11:56:55
1.4K0
举报
文章被收录于专栏:百科知识百科知识

以下是学习大型语言模型的一些书籍、论文和在线课程的推荐:

  1. 书籍:
  • 深度学习》(花书):该书是深度学习领域的经典教材,包括自然语言处理和语言模型等内容。
  • 《自然语言处理综论》:该书是自然语言处理领域的经典教材,包括语言模型、文本分类、情感分析等内容。
  • 《动手学深度学习》:该书是一本实践性的深度学习教材,包括自然语言处理和语言模型等内容。
  1. 论文:
  • GPT-3: Language Models are Few-Shot Learners:该论文介绍了GPT-3模型,是目前最先进的大型语言模型之一。
  • BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding:该论文介绍了BERT模型,是一种基于Transformer的预训练语言模型。
  • XLNet: Generalized Autoregressive Pretraining for Language Understanding:该论文介绍了XLNet模型,是一种基于自回归和自编码的预训练语言模型。
  1. 在线课程:
  • Coursera深度学习课程:该课程由deeplearning.ai提供,包括自然语言处理和语言模型等内容。
  • 斯坦福大学CS224n自然语言处理课程:该课程由斯坦福大学提供,包括语言模型、文本分类、情感分析等内容。
  • B站深度学习课程:该课程由吴恩达等知名专家提供,包括自然语言处理和语言模型等内容。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
LLM大语言模型原理、发展历程、训练方法、应用场景和未来趋势
LLM,全称Large Language Model,即大型语言模型。LLM是一种强大的人工智能算法,它通过训练大量文本数据,学习语言的语法、语义和上下文信息,从而能够对自然语言文本进行建模。这种模型在自然语言处理(NLP)领域具有广泛的应用,包括文本生成、文本分类、机器翻译、情感分析等。本文将详细介绍LLM大语言模型的原理、发展历程、训练方法、应用场景和未来趋势。
正在走向自律
2024/12/18
1.7K0
LLM大语言模型原理、发展历程、训练方法、应用场景和未来趋势
多模态大模型技术原理与实战学习笔记(1)
GPT ( Generative Pre-trained Transformer,生成式预训练Transformer )
顾翔
2024/09/10
1770
多模态大模型技术原理与实战学习笔记(1)
ChatGPT 与世界:对话式 AI 模型对比
来源:InfoQ AI前线 本文约1000字,建议阅读5分钟 本文简单介绍了 ChatGPT 的竞争对手中最突出的几个模型。   作为一种人工智能语言模型,ChatGPT 已经成为自然语言处理领域最流行、最有效的工具之一。不过,值得注意的是,ChatGPT 并不是唯一一个 AI 语言模型。这几年,还出现了许多其他的模型,每个竞争对手都提供了独到的功能和优点。本文简单介绍了 ChatGPT 的竞争对手中最突出的几个模型。 本文最初发布于 Analytics Vidhya。 简介 作为一种人工智能语言模型,C
数据派THU
2023/05/11
2960
ChatGPT 与世界:对话式 AI 模型对比
NLP秘笈,从入门到进阶
自然语言处理(NLP)作为人工智能研究的核心领域之一,长久以来都受到广泛关注。微软全球执行副总裁沈向洋博士曾表示“ 懂语言者得天下,人工智能对人类影响最为深刻的就是自然语言方面。 ”现在很多研究人员都在进入自然语言领域,希望可以解决“让机器理解人类语言”这一难题。 为了帮助大家更好地学习NLP,我们邀请微软亚洲研究院自然语言计算组资深研究员韦福如为大家推荐了一些关于自然语言学习方面经典的书籍和课程,分为入门级和进阶级两大类。 好,同学们现在都准备好了吗?请系好安全带,我们这辆开往“NLP大佬界”方向的车就要
企鹅号小编
2018/02/06
1.3K0
NLP秘笈,从入门到进阶
【NLP】NLP爱好者学习资源推荐汇总
导读:本文旨在整理汇总一些NLPer的学习资源,包括书籍、在线课程、博客等。本文中涉及的原始失效链接均已剔除或替换,博客部分均整理为近期仍在更新的博客,欢迎文末留言区交流补充。
黄博的机器学习圈子
2021/04/16
2.4K0
【NLP】NLP爱好者学习资源推荐汇总
斯坦福机器学习课程上新!一课打尽基础机器学习模型+NLP+社交网络
——小编已经为你物色好了一门斯坦福机器学习课程!糅合基础机器学习模型、自然语言处理(NLP)和社交网络为一体,《CS 124: From Languages to Information》即将开课!这波扎实的学习局赶快安排起来!
大数据文摘
2019/12/05
7310
斯坦福机器学习课程上新!一课打尽基础机器学习模型+NLP+社交网络
GPT与大语言模型
近年来,随着人工智能技术的飞速发展,尤其是自然语言处理(NLP)领域,大语言模型(Large Language Models, LLMs)取得了显著进展。其中,GPT系列模型(Generative Pre-trained Transformer)作为最具代表性的架构之一,从GPT-1到GPT-4的演变过程,展示了AI在理解和生成自然语言方面的巨大飞跃。
刘君
2025/02/10
2660
比Transformer好用!前谷歌大脑员工创业公司获4000万美元融资,Hinton、李飞飞等支持
近日,自然语言处理 (NLP) 预训练模型提供商 Cohere 宣布了 4000 万美元的 A 轮融资。此次融资由 Index Ventures 领投,Section 32、Radical Ventures等参投。Index 合伙人 Mike Volpi 加入 Cohere 董事会。
新智元
2021/09/17
5380
2023年!自然语言处理(NLP)10 大预训练模型
语言模型是构建NLP应用程序的关键。现在人们普遍相信基于预训练模型来构建NLP语言模型是切实有效的方法。随着疫情阴霾的散去,相信NLP技术会继续渗透到众多行业中。在此过程中,肯定有很多同学会用到或者学习NLP预训练模型,为此作者整理了目前2023年NLP的十大预训练模型及论文,模型效果不分先后。
ShuYini
2023/03/06
6.7K1
2023年!自然语言处理(NLP)10 大预训练模型
2019斯坦福自然语言理解课程开放:视频代码PDF都有,名师上课还免费 | 资源
新课程名为自然语言理解(Natural Language Understanding),代号CS224U,是斯坦福大学今年春季的新课程。
深度学习与Python
2019/07/01
6310
2019斯坦福自然语言理解课程开放:视频代码PDF都有,名师上课还免费 | 资源
NLP七十年!斯坦福教授Manning长文梳理:十年后的基础模型能成AGI吗?
过去十年间,仅靠简单的神经网络计算,以及大规模的训练数据支持,自然语言处理领域取得了相当大的突破,由此训练得到的预训练语言模型,如BERT、GPT-3等模型都提供了强大的通用语言理解、生成和推理能力。
新智元
2023/09/09
2820
NLP七十年!斯坦福教授Manning长文梳理:十年后的基础模型能成AGI吗?
不可错过!普林斯顿陈丹琦最新《大语言模型理解》2022课程!全面讲述BERT、GPT、T5等大模型,附Slides
在过去3-4年中,大型语言模型(LLMs)彻底改变了自然语言处理(NLP)领域。它们构成了最先进的系统的基础,在解决广泛的自然语言理解和生成任务时无处不在。随着前所未有的潜力和能力,这些模型也带来了新的道德和可扩展性挑战。本课程旨在涵盖围绕预训练语言模型的前沿研究课题。我们将讨论它们的技术基础(BERT、GPT、T5模型、专家混合模型、基于检索的模型)、新出现的功能(知识、推理、少样本学习、上下文学习)、微调和适应、系统设计以及安全和伦理。我们将涵盖每个主题,并深入讨论重要论文。学生将被期望定期阅读和提交研究论文,并在结束时完成一个研究项目。
新智元
2023/01/07
6590
不可错过!普林斯顿陈丹琦最新《大语言模型理解》2022课程!全面讲述BERT、GPT、T5等大模型,附Slides
帮我梳理一下,我该如何学习大型语言模型的学习路径,需要哪些知识点,学习步骤是什么?
学习大型语言模型需要一定的数学和编程基础,如线性代数、微积分、Python编程等。同时,还需要不断地阅读相关文献和实践项目,以便深入理解大型语言模型的原理和应用。
gavin1024
2023/05/18
1.4K1
AI写作(四)预训练语言模型:开启 AI 写作新时代(4/10)
预训练语言模型在自然语言处理领域占据着至关重要的地位。它以其卓越的语言理解和生成能力,成为众多自然语言处理任务的关键工具。
正在走向自律
2024/12/18
2400
AI写作(四)预训练语言模型:开启 AI 写作新时代(4/10)
研究人员提出针对GPT-3等语言模型的偏差修正
快速学习或从几个示例中学习任务的能力是人工智能的关键与强项。像OpenAI的GPT-3这样的大型AI自然语言模型无需精调即可执行多次学习。
大数据文摘
2021/03/10
4120
研究人员提出针对GPT-3等语言模型的偏差修正
BERT与GPT的对比分析
在自然语言处理(NLP)领域,BERT(Bidirectional Encoder Representations from Transformers)和GPT(Generative Pre-trained Transformer)是两种具有里程碑意义的深度学习模型。它们都基于Transformer架构,但在训练方式、应用场景以及生成能力上有显著的不同。理解这两个模型的异同,将有助于在实际应用中选择最适合的模型。
刘君
2025/02/10
4440
万字长文解读:从Transformer到ChatGPT,通用人工智能曙光初现
ChatGPT掀起的NLP大语言模型热浪,不仅将各家科技巨头和独角兽们推向风口浪尖,在它背后的神经网络也被纷纷热议。但实际上,除了神经网络之外,知识图谱在AI的发展历程中也被寄予厚望。自然语言处理是如何伴随人工智能各个流派不断发展、沉淀,直至爆发的?本文作者将带来他的思考。 作者 | 王文广 出品 | 新程序员 自ChatGPT推出以来,不仅业内津津乐道并纷纷赞叹自然语言处理(Natural Language Processing, NLP)大模型的魔力,更有探讨通用人工智能(Artificial gene
AI科技大本营
2023/04/14
6490
万字长文解读:从Transformer到ChatGPT,通用人工智能曙光初现
【课程】斯坦福大学NLP大牛Dan和Chirs《自然语言处理》课件(附下载)
【导读】斯坦福大学《自然语言处理》经典课程,于2012年3月在Coursera启动了在线自然语言处理课程,由NLP领域大牛Dan Jurafsky 和 Chirs Manning教授授课。 网址链接:
WZEARW
2018/04/11
1.8K1
【课程】斯坦福大学NLP大牛Dan和Chirs《自然语言处理》课件(附下载)
NLP 学习秘笈,从入门到进阶 | 书单
来源 | 微软研究院AI头条 自然语言处理(NLP)作为人工智能研究的核心领域之一,长久以来都受到广泛关注。微软全球执行副总裁沈向洋博士曾表示“懂语言者得天下,人工智能对人类影响最为深刻的就是自然语言方面。”现在很多研究人员都在进入自然语言领域,希望可以解决“让机器理解人类语言”这一难题。 为了帮助大家更好地学习NLP,微软亚洲研究院自然语言计算组资深研究员韦福如为大家推荐了一些关于自然语言学习方面经典的书籍和课程,分为入门级和进阶级两大类。 好,同学们现在都准备好了吗?请系好安全带,我们这辆开往“NLP
用户1737318
2018/06/05
8770
文本分类综述 | 迈向NLP大师的第一步(中)
本系列文章总结自然语言处理(NLP)中最基础最常用的「文本分类」任务,主要包括以下几大部分:
NewBeeNLP
2020/12/08
8400
推荐阅读
相关推荐
LLM大语言模型原理、发展历程、训练方法、应用场景和未来趋势
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档