首页
学习
活动
专区
圈层
工具
发布
首页标签huggingface-transformers

#huggingface-transformers

Transformer模型中的线性层与激活函数解析

用户11764306

注意力机制是Transformer模型的标志性组件,但并非唯一构建模块。线性层与激活函数同样至关重要。本文将介绍:

17310

利用Transformer模型提升商品检索效果

用户11764306

当顾客在商品搜索结果列表中点击某个商品时,意味着该商品比未点击的结果更相关。"学习排序"模型利用这种隐式反馈来改进搜索结果,通过"成对"(比较结果对)或列表式(...

8910

基于Transformer的百万级文本分类技术

用户11764306

文本分类是自然语言理解领域最基础的任务。例如,某中心智能助手的用户请求需要按领域分类(天气、音乐、智能家居等),许多自然语言处理应用依赖词性分类解析器。对于类别...

6410

预训练速度提升50%?MoE的加速秘密全揭露

聚客AI

近年来,混合专家模型(Mixture of Experts, MoE)技术在大模型领域迅速崛起,成为解决计算效率和扩展性问题的关键创新。我将从核心原理、显著优势...

24110

局部注意力机制提升Transformer长序列时间预测

用户11764306

Transformer已成为自然语言处理领域的主流架构,其在时间序列分析(尤其是长周期预测)中也展现出卓越的性能与效率。本文提出局部注意力机制(LAM),一种专...

8210

系统拆解LLM的核心技术栈,助您掌握从模型选型到部署优化的全流程

聚客AI

在人工智能的浪潮中,大型语言模型(LLM)已成为推动产业变革的核心引擎。作为AI应用开发工程师,理解大模型的内在机制和开发范式至关重要。本文将从零开始,系统拆解...

55620

TTS-1技术报告:基于Transformer的文本转语音模型

用户11764306

我们介绍了Inworld TTS-1,这是一组两个基于Transformer的自回归文本转语音(TTS)模型。我们最大的模型TTS-1-Max拥有88亿参数,专...

14210

利用Transformer模型提升产品检索效果

用户11764306

当顾客点击产品搜索结果列表中的某个商品时,暗示该商品优于未点击项。传统"学习排序"模型通过比较点击/未点击结果的"成对比较"或"列表排序"方式利用这种隐式反馈。...

6100

统一多模态 Transformer 架构在跨模态表示学习中的应用与优化

一键难忘

腾讯云TDP | KOL (已认证)

随着人工智能的发展,文本与图像等多模态数据的统一建模成为研究热点。统一多模态 Transformer(Unified Multimodal Transforme...

29710

LLM学习笔记02:两行Python代码,如何实现情感分析

叫我阿柒啊

腾讯云TDP | 产品KOL (已认证)

在上一篇文章LLM学习笔记:如何理解LLM中的Transformer架构中,我们了解了在GPT、stable diffusion以及情感分析等AI领域常见的 T...

33333

LLM学习笔记:如何理解LLM中的Transformer架构

叫我阿柒啊

腾讯云TDP | 产品KOL (已认证)

AI已经在我们的工作和生活中全面开花了,好久之前在GPT、混元大模型出来的时候,就想着能够学习一下关于AI的知识,所以这次打算从LLM开始学习,就问DeepSe...

29920

Linguists Should Find Self-Attention Intuitively Familiar

立委

For linguists bewildered by large language models (LLMs), the confusion often st...

9610

Transformer 和注意力机制简介

立委

基础大模型通过原始大数据的“自监督学习”(self-srupervised learning),利用多层神经网络,获得数据相关的知识。自监督学习是一种特别的监督...

34810

文档图像矫正任务的前沿进展:引入Transformer框架、极坐标的思路

合合技术团队

在《文档数字化采集与智能处理:图像弯曲矫正技术概述》一文中,我们介绍了文档图像矫正技术的发展沿革与代表性方案。随着文档智能处理的需求逐步升级,文档图像去畸变技术...

23210

Transformer 模型示例

软件架构师Michael

Transformer 架构是现代深度学习中非常重要的模型,广泛应用于自然语言处理(NLP)和计算机视觉(CV)领域。以下是一个使用 Python 和 PyTo...

39310

闲聊AI:Transformer 短篇故事之一

蛋先生DX

腾讯 | 前端研发 (已认证)

蛋先生:是的,它是 Google 在2017年发表的一篇名为“Attention Is All You Need”的论文中提出的神经网络架构

9301

使用Python实现深度学习模型:智能广告创意生成

Echo_Wish

在数字营销领域,广告创意的质量直接影响广告的效果和转化率。随着人工智能技术的发展,深度学习在广告创意生成方面展现出了巨大的潜力。本文将介绍如何使用Python实...

18410

Mixtral混合专家模型

aaronwjzhao

模型地址:mistralai (Mistral AI_) (huggingface.co),需要在这个网页上申请权限(地址填国外)

19210

Llama3.1技术报告解读

aaronwjzhao

Llama3.1共开源了8B、70B、405B三种参数量的模型,三个模型具体信息如下图,其中405B除了BF16精度,还有FP8量化版模型,针对8B额外开源了经...

4.6K101
领券