首页
学习
活动
专区
圈层
工具
发布
首页标签神经网络

#神经网络

模仿生物神经网络的结构和功能的数学模型或计算模型,用于对函数进行估计或近似

推开AI的门

白玉光

当第一次体验到大模型带给你的惊喜时,你有没有想过,它到底是怎么思考的?你或许忙碌、疲惫,连思考“它是怎么思考的”都来不及去思考。可是在过去的很长时间里,模型参数...

6610

深入 CANN 图编译引擎:如何让神经网络“跑得更快、吃得更少”?

晚霞的不甘

相关资源链接 cann组织链接:cann组织 ops-nn仓库链接:ops-nn仓库

2610

LLM 系列(十九):前馈神经网络 FFN

磊叔的技术博客

当我们谈到 Transformer 模型时,往往聚光灯都会打在 自注意力机制(Self-Attention) 上。然而,Transformer 中还有一个 “不...

11910

NLP深度学习的四步公式详解

用户11764306

在过去六个月中,一种强大的神经网络新方法已为自然语言处理领域整合成型。这种新方法可以概括为一个简单的四步公式:嵌入(Embed)、编码(Encode)、注意力机...

7510

人工智能辅助发现流体方程中的隐藏奇点

用户11764306

近200年前,物理学家Claude-Louis Navier和George Gabriel Stokes完成了描述流体如何旋转的一组方程。近200年来,Navi...

6610

文本转语音技术突破:让计算机拥有更自然的“声音”

用户11764306

编者按: Alexa团队最近推出了一种新的长篇内容朗读风格,使Alexa在阅读长篇文章时听起来更加自然。如果您更喜欢听而不是阅读,下文是利用此长篇朗读风格制作的...

7610

不止于Prompt:揭秘「神经网络可重编程性」

机器之心

过去几年,这类方法在不同社区中以各自独立的形式快速发展 —— 有的来自对抗鲁棒性与迁移学习,有的服务于下游任务适配,有的则成为大模型对齐与应用的基础工具。然而,...

11510

非Transformer架构的新突破,液态神经网络的推理小模型只用900M内存

机器之心

不知道大家是否还有印象,当年有一个尝试给大模型装上「虫脑」的初创公司,他们的研究人员受到秀丽隐杆线虫的神经结构启发,研发出一种新型的灵活神经网络,也被称为液态神...

28210

烧2万亿美元却难用?Gary Marcus狂喷AI赛道不靠谱:推理模型只是“模仿秀”,OpenAI一年后倒闭?

深度学习与Python

“一圈又一圈的循环融资,投资回报率却不尽如人意,这些 AI 系统实际用起来也远没有想象中好用,或许方向本身就站不住脚。”

16910

对抗样本:20行Python代码让95%准确率的图像分类器彻底失效

deephub

改变一个像素,可能肉眼完全看不出区别,但分类器会彻底崩溃。本文会用FGSM(快速梯度符号法)演示如何制作对抗样本,并解释神经网络为何如此脆弱。

8710

Nat. Commun. | 引入动量守恒约束的物理信息图神经网络: 面向动力系统的建模新框架

DrugAI

对多体动力系统进行高精度、可解释且可实时的建模,是理解自然系统与工程系统行为的关键。传统基于物理的模型在复杂系统中难以扩展且计算代价高,而纯数据驱动方法(如图神...

9310

人工智能 | 高速公路相关的人工智能基础知识普及:模型特点及常见数据分析方法

高速公路那点事儿

卷积神经网络(CNN)、循环神经网络(RNN)和Transformer架构推动了计算机视觉、自然语言处理(NLP)等领域的革命,如AlphaGo、ChatGPT...

8010

深度学习为何有效及其极限的探讨

用户11764306

人工智能领域的传统观点认为,神经网络的大小必须根据其要解决的问题和可用训练数据的量来仔细调整。如果网络太小,它无法学习数据中的复杂模式;但如果变得太大,它可能只...

9400

Transformer亲爹痛斥:当前AI陷死胡同,微调纯属浪费时间!

新智元

Sakana AI的创始人、研究科学家Llion Jones,和其他7位合著者,一起发明了Transformer。

8510

Nat. Commun. | 引入动量守恒约束的物理信息图神经网络: 面向动力系统的建模新框架

DrugOne

对多体动力系统进行高精度、可解释且可实时的建模,是理解自然系统与工程系统行为的关键。传统基于物理的模型在复杂系统中难以扩展且计算代价高,而纯数据驱动方法(如图神...

14310

多模态预训练分子表征学习及其在药物发现中的应用

DrugOne

基于分子的不同表示,研究者通过DNN,CNN,RNN,Transformer等不同的神经网络进行药物发现。该论文介绍了这些网络的基本原理和框架,并且介绍了它们之...

5910

使用超复数减少深度学习模型参数规模的研究获奖

用户11764306

An Amazon Web Services (AWS) senior applied scientist and collaborators learned ...

6000

电子病历中神经症状标注的一致性研究

用户11764306

从电子健康记录中提取以自由文本形式记录的患者体征和症状对于精准医学至关重要。一旦提取出来,通过映射到本体中的体征和症状,可以使这些信息变得可计算。从自由文本中提...

6700

Nat. Commun. | 引入动量守恒约束的物理信息图神经网络: 面向动力系统的建模新框架

MindDance

对多体动力系统进行高精度、可解释且可实时的建模,是理解自然系统与工程系统行为的关键。传统基于物理的模型在复杂系统中难以扩展且计算代价高,而纯数据驱动方法(如图神...

13110
领券