首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

将句子表示为向量(下):基于监督学习的句子表示学习(sentence embedding)

), 一种特殊的simple RNN,其weight矩阵初始化为单位矩阵,bias初始化为0向量,激活函数为恒等函数,最终的句子编码向量为最后一个隐状态向量除以句子中词的个数。...Language Inference Data提出使用自然语言推理(natural language inference, NLI)数据集来学习通用的句子表示。...T } )\),然后与可学习(可训练)的query向量(上下文向量)计算得到\(\{a_i\}\),然后进行加权得到句子表示\(u\),如下图所示: ?...{ w } ^ { 1 } , u _ { w } ^ { 2 } , u _ { w } ^ { 3 } , u _ { w } ^ { 4 }​\)(multiple views),对应产生4个表示后进行连结作为最终的句子表示...Hierarchical ConvNet,多层卷积(4层),每层卷积的maxpooling输出进行连结得到最终句子表示,模型结构如下图: ?

1.4K30

MixCSE:困难样本在句子表示中的使用

同时,随机采样负样本对于句子表示是无效的。...因此,才会有一系列的论文旨在解决各向异性,比如bert-flow、bert-whitening。 对比学习在句子表示中的使用? ​...Kim, Yoo, and Lee利用bert的隐含层表示和最后的句嵌入构建正样本对。SimCSE 使用不同的dropout mask将相同的句子传递给预训练模型两次,以构建正样本对。...我们先定义一个anchor(锚,可以是任意一个句子) ,定义 是一个正样本对,N个负样本是随机采样得到, 表示一个负样本对,那么我们就有最小化以下的对比损失: ​ 其中 是一个标量温度超参数...对于锚特征 ,通过混合正特征 和随机负特征 构建负特征: 是一个超参数,用于控制混合的程度。

1.9K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    从监督数据中学习句子表示的方法InferSent评测实验

    如何利用一些现成的句子语料来完成句子的嵌入表示,并支撑一些上层应用,是词嵌入技术在句子层面的一种拓展应用。...Inference)数据集上训练,SNLI包含570K个人类产生的句子对,每个句子对都已经做好了标签,标签总共分为三类:蕴含、矛盾和中立(Entailment、contradiction and neutral...(2)将训练好的模型当做特征提取器,以此来获得一个句子的向量表示,再将这个句子的表示应用在新的分类任务上,来评估句子向量的优劣。 ? 输入:句子对(text,hypothesis)的向量表示。...二者用同一个sentence encoder进行编码,得到的U和V就是这两个句子的向量,也就是这个模型的输入。至于这个encoder怎么理解,下文会有讲。...bidirectional=True, dropout=self.dpout_model) 2、评测结果 (1)基于infersent的句子相似性度量

    1.1K30

    ESimCSE:无监督句子表示对比学习的增强样本构建方法

    对比学习通常使用各种数据增强方法为每个句子生成两个互为正例的句子表示,并与其他句子表示互为负例。...具体来说,SimCSE 在 batch 中组成 N 个句子,并将每个句子输入预先训练过的 BERT 两次,以得到两个不同的句子表示。...这样,来自同一个句子的表示构成了一个“正对”,而来自两个不同句子的表示构成了一个“负对”。  使用 dropout 作为数据增强方法虽然简单而有效,但也存在一个明显的弱点。...由于 SimCSE 模型是建立在 Transformer 上的,而 Transformer 通过位置向量编码一个句子的长度信息,在一个正对中,两个来自同一句子的表示会包含相同长度的信息。...Learning应用于句子特征学习 苏州大学NLP团队文本生成&预训练方向招收研究生/博士生(含直博生) NIPS'22 | 重新审视区域视觉特征在基于知识的视觉问答中的作用 ---- 投稿或交流学习

    1.6K10

    学习用于视觉跟踪的深度紧凑图像表示

    此外,由于表示跟踪对象不需要解决基于稀疏编码的先前跟踪器中的优化问题,因此DLT明显更有效,因此更适合于实时应用。 2 视觉跟踪的粒子滤波方法 粒子滤波方法通常用于视觉跟踪。...从统计角度来看,它是一种顺序蒙特卡罗重要抽样方法,用于根据观测序列估计动态系统的潜状态变量。在时间t,Supppse st 和 yt 分别表示潜状态和观察变量。...通过向七个搜索引擎提供非抽象的英语名词,从网络上收集数据集,涵盖现实世界中发现的许多对象和场景。从每张尺寸为32×32的近8000万张微小图像中,我们随机抽样100万张图像进行离线训练。...如果使用逻辑sigmoid激活函数,则可以将每个单元的输出视为其活动的概率。设ρj表示第j个单位的目标稀疏度,ρj表示其平均经验激活率。...之后,我们用五个小 DAE 的权重初始化一个大 DAE,然后正常训练大 DAE。第一层中的一些随机选择的滤波器如图2所示。正如所料,大多数滤波器起到高度局部化的边缘检测器的作用。

    1.4K52

    WWW2021 | 基于图视角的用于推荐系统的公平表示

    推荐系统作为人工智能的一个重要应用,是最普遍的计算机辅助系统之一,帮助用户找到潜在的兴趣项目。近年来,人工智能应用的公平性问题引起了研究人员的广泛关注。...这些方法大多假定实例独立,并设计复杂的模型来消除敏感信息,以促进公平。然而,推荐系统与这些方法有很大的不同,因为用户和商品自然形成一个用户-商品二部图,并且在图结构中相互协作。...在本文中,我们提出了一种新的基于图的技术来保证任何推荐模型的公平性。这里的公平性要求指的是在用户建模过程中不暴露敏感特性集。...具体来说,给定任何推荐模型的原始嵌入,我们学习一组过滤器,这些过滤器将每个用户和每个物品的原始嵌入转换为一个基于敏感特征集的过滤嵌入空间。...对于每个用户,这种转换是在以用户为中心的图的对抗学习下实现的,以便在过滤后的用户嵌入和该用户的子图结构之间模糊每个敏感特征。最后,大量的实验结果清楚地表明了我们所提出的模型在公平推荐方面的有效性。

    44010

    COLING22 | ESimCSE:无监督句子表示对比学习的增强样本构建方法

    对比学习通常使用各种数据增强方法为每个句子生成两个互为正例的句子表示,并与其他句子表示互为负例。...具体来说,SimCSE 在 batch 中组成 N 个句子,并将每个句子输入预先训练过的 BERT 两次,以得到两个不同的句子表示。...这样,来自同一个句子的表示构成了一个“正对”,而来自两个不同句子的表示构成了一个“负对”。  使用 dropout 作为数据增强方法虽然简单而有效,但也存在一个明显的弱点。...由于 SimCSE 模型是建立在 Transformer 上的,而 Transformer 通过位置向量编码一个句子的长度信息,在一个正对中,两个来自同一句子的表示会包含相同长度的信息。...Learning应用于句子特征学习 苏州大学NLP团队文本生成&预训练方向招收研究生/博士生(含直博生) ---- 投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。

    1.1K30

    DeepCluster:用于表示视觉特征的无监督学习聚类算法

    这些参数传统上是通过监督学习的,即每个图像 xn 都与 {0, 1}^k 中的标签 yn 相关联。这个标签表示图像与k个可能的预定义类中的一个的关s系。...这个问题是由于缺乏防止空簇的机制造成的。更详细的说,当一个簇变空时随机选择一个非空簇,并将其质心与一个小的随机扰动一起用作空簇的新质心。然后将属于非空簇的点重新分配给两个结果簇。...(NMI),用于评估: 其中 I 表示互信息,H 表示熵。...可视化 从 YFCC100M 的 100 万张图像的子集中过滤可视化和前 9 个激活图像 正如预想的那样,网络中更深的层似乎捕获了更大的纹理结构。...上层的过滤器包含有关与对象类高度相关的结构的信息。底层的过滤器似乎根据样式触发,例如绘图或抽象形状。

    1.6K30

    【NAACL 2021】AugSBERT:用于改进成对句子评分任务的 Bi-encoder 数据增强方法

    但是,它必须重新计算每个输入和标签的编码;结果,它们无法检索端到端信息,因为它们不会为输入产生独立的表示,并且在测试时速度非常慢。...因此,Bi-encoders 能够索引编码的候选并比较每个输入的这些表示,从而加快预测时间。在聚类 10,000 个句子的相同复杂度下,时间从 65 小时减少到大约 5 秒。...然而,“Poly-encoders”仍然有一些缺点:由于不对称的得分函数,它们不能应用于具有对称相似性关系的任务,并且“Poly-encoders”的表示不能被有效地索引,导致大语料库大小的检索任务出现问题...因此,简单来说,我们可以认为它是自然语言处理中的自监督学习。有关详细信息,将在下一节中介绍。 技术亮点 用于成对句子回归或分类任务的增强 SBERT 方法存在三种主要场景。...语义搜索采样 (SS):预训练的 Bi-Encoders (SBERT) 用于检索我们集合中前 k 个最相似的句子。

    48710

    【扩散模型的应用】用于红外小目标检测的基于Diffusion的连续特征表示

    为了克服这些限制,我们提出了一种基于扩散的连续特征表示网络(DCFR-Net),包括两个关键分支:基于扩散的连续高分辨率特征表示(DCHFR)和ISDTD。...为了更有效地克服上述限制,我们提出了一种基于扩散的连续特征表示网络(DCFR-Net)用于ISDTD。我们的网络包括两个关键分支:基于扩散的连续高分辨率特征表示(DCHFR)和ISDTD。...卷积编码后,得到多个分辨率特征{g1, g2, ..., gN},以指导网络在建模潜在表示时: 其中,i ∈ {2, 3, ..., N}表示IDN的深度,f_d i和f_u i分别表示U-Net的解码器和编码器的特征图...为了解决这个限制,我们使用位置编码函数ψ(·)在将这些坐标输入INR之前对其进行编码: 其中,频率ωk初始化为ωk = 2ek,k ∈ {1, 2, ..., K},然后在训练阶段进一步微调。...1)多尺度隐式特征对齐:为了实现多尺度特征图的精确对齐,一个有效的方法是使用隐式特征函数将多层离散特征图转换并对齐到连续的。因此,我们实现了一个具有一个多层感知器的隐式神经函数Daθ用于对齐过程。

    19410

    经典论文 | Nerf: 将场景表示为用于视图合成的神经辐射场

    MLP 直接从 3D 空间位置映射到形状的隐式表示。...“隐式表示”3D场景通常用一个函数来描述场景几何,在表达大分辨率场景的时候它的参数量相对于“显示表示”是较少的,并且隐式表示函数是种连续化的表达,对于场景的表达会更为精细[1]。...,从而形成了 3D 场景的隐式表示 。...下图为 NeRF 中使用的神经网络构架,其中网络的输入向量用绿色表示,中间隐藏层用蓝色表示,输出向量用红色表示;“+” 符号表示向量串联;黑色实线箭头表示隐藏层使用 ReLU 激活,橙色实线箭头表示隐藏层不使用激活函数...将ϜΘ重写成由两组函数组成:ϜΘ = Ϝ′Θ ∘ γ,其中Ϝ′Θ仍为常规MLP网络,需要通过训练学习得到,而γ用于将输入映射到高维空间中,论文中使用的是R→R^2L的正余弦周期函数的形式: 在实验中对位置和视角信息使用不同的参数

    3.4K20

    用于抗癌药物协同预测的多向关系增强超图表示学习

    然而,由于组合爆炸,协同药物组合的体外筛选既费时又费力。尽管已经开发了许多用于预测协同药物组合的计算方法,但药物协同数据中存在的药物组合与细胞系之间的多向关系尚未得到很好的利用。...结果: 作者提出了一种多向关系增强的超图表示学习方法来预测抗癌药物的协同作用,命名为 HypergraphSynergy。...HypergraphSynergy 将癌细胞系上的协同药物组合制定为超图,其中药物和细胞系由节点表示,协同药物-药物-细胞系三联体由超边表示,并利用药物和细胞系的生化特征作为节点属性....然后,设计一个超图神经网络,从超图中学习药物和细胞系的嵌入,并预测药物协同作用。此外,还考虑了重建药物和细胞系相似性网络的辅助任务,以增强模型的泛化能力。...在计算实验中,HypergraphSynergy 在分类和回归任务的两个基准数据集上优于其他最先进的协同预测方法,适用于未见的药物组合或细胞系。

    58520

    BMC Bioinform | 拓扑增强的分子图表示用于抗乳腺癌药物的筛选

    ABCD-GGNN通过每个不同化合物的原子描述符构建原子级图,可以拓扑地学习候选药物的隐式结构和子结构特征,然后将表示与显式离散分子描述符集成,生成分子级表示。...在候选药物的原子级图构建方面。V表示分子中的原子集,E表示分子中化学键集。...在每个原子节点的特征初始化方面,作者从相应的SMILES和729个分子描述符中总结了8个原子描述符,分别是原子类型、键数、形式电荷、手性、氢键数、杂化、芳香性和原子质量。...每个原子描述符被转换为一个独热向量,并连接起来形成一个39维向量,作为原子特征的初始化。...读出函数如[3]所述设计,旨在反映所有原子节点表示通过平均函数和最大池函数有助于信息聚合的事实,而只有部分由注意机制分配的权重较高的原子节点贡献更多。

    52820

    NIPS 2024 | 眼动引导的多模态对齐用于医学表示学习

    论文信息 题目:Eye-gaze Guided Multi-modal Alignment for Medical Representation Learning 眼动引导的多模态对齐用于医学表示学习...通过根据每个单词发音前后的时间分割音频,作者可以将转录与音频对齐,从而将句子级别的文本与眼动数据对齐。随后,作者根据眼动数据和图像生成注意力热图,表示放射科医生关注的图像区域。...然后,图像到文本的对比损失和文本到图像的对比损失可以表示为: 其中,是一个可学习的温度参数。...然后,作者计算句子到图像块和图像块到句子在一个实例中的相似度: 对于每个与句子对应的热图,作者首先将其划分为个图像块。随后,作者将个句子的热图连接起来,得到输入的眼动引导相似度矩阵(如图2.B所示)。...在该矩阵中,非零元素表示相应句子与图像块之间的语义相关性。因此,作者将二值化,将非零区域设置为1,得到眼动引导标签矩阵。

    6910

    时序论文24|TSLANet:重新思考用于时间序列表示学习的Transformers

    近期一些研究对其适应性提出了质疑,Transformer的自注意力排列不变性,损害了时序信息的保留。实验表明,一个单一的线性层出人意料地超越了复杂的Transformer架构。...本文思路 卷积神经网络(CNNs)传统上在捕捉时间序列中的短期模式方面表现出色,这得益于它们的局部感受野,如图所示,一个简单的三层CNN网络在分类性能上优于最先进的基于Transformer的架构。...例如,CNN在具有短10分钟频率的天气数据集上展现出与这些基于Transformer的模型相竞争的性能,但在处理时间间隔更长的小时级ETTh1数据集时则表现不佳,这表明它在处理频率较低的时间变化时存在困难...这种差异突出了一个关键问题:如何增强CNNs以扩展它们在更广泛的时间序列任务中的稳健性能?显然,通过学习时间序列数据中的短期和长期依赖性,可以扩展CNNs的能力。...第一个是自适应频谱块(Adaptive Spectral Block, ASB),它利用频域表示进行稳健的特征提取,并采用自适应阈值来减轻噪声。

    40410

    NeurIPS TAPE | 用于评估蛋白质表示学习性能的多任务平台

    1、摘要 蛋白质表示学习是机器学习研究的一个日益热门的领域。由于获取监督蛋白质标签的成本较高,但目前的文献在数据集和标准化评价技术方面比较零散,因此半监督学习作为蛋白质表示学习中的一种重要范式。...尽管如此,在某些情况下,通过自监督预训练学习的特征仍然落后于由最先进的非神经技术提取的特征。这种性能上的差距为创新的架构设计和改进的建模模式提供了巨大的机会,这些模式可以更好地捕捉生物序列中的信号。...所有用于运行这些实验的数据和代码都可在下文的链接中找到 2、简介 在过去的几十年里,新的测序技术导致蛋白质数据库的规模激增。这些数据库呈指数级增长,序列总数每两年翻一番。...表1 4、实验 4.1二级结构预测(结构预测任务) 二级结构预测(如图1)是了解蛋白质功能的一个重要特征,特别是当感兴趣的蛋白质在进化上与具有已知结构的蛋白质不相关时,二级结构预测工具通常用于为更高级别的模型构建提供更丰富的输入特征...表9:蛋白质拓扑稳定性预测结果 5、总结 实验结果表明,基于对齐的输入在多个任务上由于当前自监督模型,目前可用于二级结构预测、接触预测和远程同源分类的最新方法都基于对齐的输入,这些方法将基于对齐的输入与其他技术

    1.1K30

    ICCV2023论文精读:用于三维分析的基于聚类的点云表示学习

    为此,作者提出了一种基于聚类的点云分析表示学习方案。 2. 方法前瞻 本文介绍了一种用于点云分析的无监督点云聚类表示学习方法。这种方法有以下三个优点:首先,它提出了一个数据集级上下文意识训练策略。..., \langle \cdot \rangle 是Frobenius点积,log作用于元素。...聚类中心最初随机初始化,并在每批次逐步更新,顺应表示 \phi 的变化。这些设计导致了可扩展的在线聚类,允许从庞大的训练点数据中自动挖掘潜在的子类模式。...我们的点对点对比学习是通过比较点对来将不同子类的点表示推离,同时将来自同一子类的点表示拉近。...原则上,它可以应用于任何能够学习逐点特征的分割网络。在我们的实验中,我们在四种典型的分割网络上测试我们的算法,包括基于体素的、基于点的、基于Transformer的和基于NAS的。 推理。

    1.2K30

    SMICLR:用于半监督和无监督表示学习的多模态分子表征对比学习

    ,拓宽了人们研究已知和未知分子的视野。...其核心是分子表征,这是提高构效关系学习的关键。最近,对比学习框架在不同领域的表征学习方面显示出了令人印象深刻的结果。因此,本文提出了一个包含多模态分子数据的对比框架。...作者的方法联合训练一个图编码器和一个普通编码器对SMILES字符串执行对比学习。...当在SMICLR的预训练编码器上叠加一个非线性回归器并对整个模型进行微调时,作者将QM9数据集上的能量和电子相关性质的预测误差平均分别降低了44%和25%。...当在每个分子输入表示中应用数据增强时,可以进一步改进框架的性能。此外,SMICLR在无监督的环境下取得了有竞争力的表示学习结果。

    54220

    Neural Eigenmap: 基于谱学习的结构化表示学习,可用于自监督学习,图节点表示学习和谱聚类上

    我们在 Neural Eigenmaps paper 中 revisit 了表示学习的 eigenmap 原则。...,实验结果很有竞争力: 表示学习的eigenmap原则 Eigenmaps 是特征函数(eigenfunctions)的输出。...上述 Eigenmaps 是谱学习中的核心概念,也被证明是能够维持数据流形上的局部邻域结构的最优表示。...kernel),定义如下 其中, 表示原始干净数据的分布, 表示随机扰动对应的分布。...我们在迁移性的图像检索这个任务中验证了我们学得的表示中的这种结构: 相比于现有方法,Neural Eigenmaps可以实现在不显著降低检索性能的情况下,减少至多94%的表示长度,这对于资源有限的应用场景十分重要

    42320
    领券