首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Rust 语言风靡学术界

AWS 将 Rust 编译器团队负责人收入麾下的新闻让开发者们再次聚焦于这门兼具安全性与高性能的编程语言。...近日,著名科学期刊 Nature 刊登了一篇文章,表明 Rust 语言也正在成为学术界最受欢迎的编程语言之一。...因此,他开始寻求一种新的编程语言。 Köster 认为,他需要的语言既要能提供 Python 的“表达能力”,也要能提供 C/C ++ 的运行效率。...GitHub 上的数据也显示,Rust 是 2019 年平台上增长第二快的语言,比去年同期增长了 235% 。 而在学术研究界,科学家们也正在转向使用 Rust。...测试结果显示,Rust 力压 C 语言成为效率最高的编程语言。“当我们要使用多个线程编写高性能程序,同时又需要它非常快速且节省内存,那么 Rust 是理想的选择。” Li 说。

59130
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    自然语言处理学术速递

    我们提出了一种在预先训练的语言模型表示中探测逻辑推理的语言信息的方法。我们的探测数据集涵盖了主要符号推理系统所需的语言现象列表。...我们发现(i)预先训练的语言模型确实编码了几种类型的语言信息用于推理,但也有一些类型的信息是弱编码的,(ii)语言模型可以通过微调有效地学习缺失的语言信息。...总的来说,我们的研究结果提供了语言模型及其训练前程序捕捉逻辑推理的语言信息的哪些方面的见解。此外,我们还展示了语言模型作为支持符号推理方法的语义和背景知识库的潜力。...尽管德拉维甸语包含大量的语言,但公共可用资源相对较少。此外,文本分类任务作为自然语言处理的一项基本任务,如何将其与德拉威语中的多种语言相结合,仍然是德拉威语自然语言处理的一大难点。...(CLUB)包含代表不同NLU任务的各种数据集,这些数据集能够准确评估语言模型,遵循通用语言理解评估(GLUE)示例。

    60620

    自然语言处理学术速递

    、资源严重不足的语言。...尽管最近的预训练语言模型(PLM)在各种下游任务中表现出色,但如果模型真正理解语言,它们应该表现出一致的行为。...在此基础上,我们设置了各种评估场景,并从不同角度对几种流行的多语言生成模型进行了深入分析。我们的基准套件将鼓励文本生成社区使用多种语言,提供更多人工注释的并行数据和更多样化的生成场景。...of Technology and Design, University of Saskatchewan, China Merchants Bank 摘要:图表的分析描述是一个激动人心的重要研究领域,在学术界和工业界都有许多应用...特别是,我们研究了在我们的小训练数据集上微调几个最先进的预训练语言模型的性能。结果表明,通过预先训练的语言模型和精心调整的超参数,我们在这项任务上已经达到或略优于最先进的系统。

    42210

    自然语言处理学术速递

    已经发布了120多个涵盖50多种语言的单语言BERT模型,以及104种语言的多语言模型。我们介绍,加BERT,爱尔兰语言的单语BERT模型。...(PrLM)对自然语言处理产生了重大影响,但用英语以外的语言训练PrLM是不切实际的,原因有二:其他语言往往缺乏足够的语料库来训练强大的PrLM,而且由于人类语言的共性,不同语言的PrLM训练在计算上比较昂贵...在语言理解和结构分析任务上的实验表明,该框架在性能和效率上都明显优于从零开始训练的语言模型。...最近的自然语言处理技术依赖于深度学习和大量预先训练的语言模型。然而,无论是大型的深层神经模型还是语言模型,都是用大量的数据来训练的,而这些数据通常都在服务器端。...特别是,我们发现在语言基础模型中添加视图估计可以提高SNARE和在机器人平台上识别语言中引用的对象的准确性。

    67130

    自然语言处理学术速递

    最近,在大量未标记语料库上预先训练的基于变换器的语言模型(PTLMs)在许多下游自然语言处理任务中产生了最新的结果。...我们的数据集提供了24198个丰富的自然语言观测值和(1)以地图形式反映世界状态的知识图之间的映射(2) 自然语言的行为,保证会引起特定世界状态的变化。...本文研究了现代超参数优化方法(HPO)在微调预训练语言模型上的性能。首先,我们研究并报告了三种HPO算法在GLUE数据集上微调两种最新语言模型的性能。...我们用九种不同的低资源语言对一组三项任务进行了评估,结果喜忧参半,支持了这些方法的可行性,同时提出了如何使多语言模型最佳地适应低资源环境的新问题。...该数据集包含25种语言的简短语句,并由专家事实核查员对其准确性进行标记。该数据集包括一个多语言评估基准,该基准测量了多语言模型的域外泛化和Zero-Shot能力。

    70920

    自然语言处理学术速递

    然后,这些增强的数据被用来微调一组语言模型,这些语言模型是在一般领域Twitter内容上预先训练过的。所提出的方法优于先前最先进的Kusuri算法,并在所选目标函数(重叠F1分数)的竞争中排名靠前。...,该系统完全不使用来自目标语言的转录训练数据,也不使用有关语言的语音知识。...我们将这种破译应用于通用电话识别器在语言外语音语料库上训练生成的电话序列,然后进行平启动半监督训练,以获得新语言的声学模型。据我们所知,这是第一个不依赖任何手工语音信息的零资源跨语言ASR的实用方法。...NLP应用取得了巨大的发展势头,主要原因是在印度、墨西哥、欧洲、美国部分地区等多语言社会的社交媒体通信中,语言混合非常普遍。...单词嵌入是当今任何NLP系统的基本构建块,CM语言的单词嵌入是一个尚未探索的领域。CM单词嵌入的主要瓶颈是语言切换的切换点。

    27130

    自然语言处理学术速递

    DB-BERT将预先训练好的大型语言模型(特别是BERT模型)应用于文本分析。在初始训练阶段,它会微调模型权重,以便将自然语言提示转换为推荐设置。...在第二部分中,我们在一系列Zero-Shot语言和领域转移CLIR实验中评估了以监督方式(即,我们学习排名)对英语相关数据进行微调的多语言编码器。...我们揭示了目标语言单语检索的跨语言检索结果和(零炮)跨语言迁移结果之间的实质性经验差异,这表明基于单语数据训练的检索模型“单语过度拟合”。...Pendharkar,Kinjal Basu,Farhad Shakerin,Gopal Gupta 机构:The University of Texas at Dallas 摘要:提出了一种基于答案集编程...(ASP)的自然语言文本知识表示方法。

    33320

    自然语言处理学术速递

    这种方法的其他优点之一是它的可解释性和不需要语言知识。...介绍了符号和亚符号模型集成的几种方法;然而,在可以使用各种底层算法的情况下,没有库以通用方式促进此类集成的编程。我们的库旨在简化在训练和推理阶段进行集成的编程,同时将知识表示与学习算法分离。...由于德拉威语资源不足,我们的方法增加了语言模型的训练数据量。我们在新构建的数据集上微调了几个最近的预训练语言模型。我们提取预训练的语言嵌入并将其传递到递归神经网络。...在本文中,我们解释了性别和语言的复杂性,并调查了非二元性的人,以了解在英语语言技术中将性别视为二元性所带来的危害。...我们首先表明,5%到10%的训练数据足以使基于BERT的错误检测方法达到与基于非语言模型的方法在完整训练数据下所能达到的性能相当的性能;与非语言模型方法相比,基于BERT的方法在训练数据大小方面的召回率提高得更快

    77920

    自然语言处理学术速递

    (NLVL)是视觉语言理解领域的一项重要任务,它不仅要求深入理解计算机视觉和自然语言方面,更重要的是深入理解两者之间的相互作用。...尽管对视频和语言任务进行了广泛而独立的研究,但目前对NLVL等视觉-语言联合任务中对抗性稳健性的理解还不太成熟。...为了解决这个问题,我们设计了一个多模式的音乐和语言预训练体系结构(MuLaP),通过一组代理任务进行优化。以嘈杂的自然语言描述的形式提供微弱的监督,传达曲目的整体音乐内容。...一个有前途的方向是使用一个整体的通用模型,作为一个“基础”,同时针对所有的模式——一个真正的视觉和语言基础模型应该擅长于视觉任务、语言任务和跨和多模态视觉和语言任务。...(VLN)任务要求agent在自然语言指令的指导下到达目标。

    47420

    自然语言处理学术速递

    A Comprehensive Assessment for Catalan 标题:对于资源适度不足的语言,多语言模式是最佳选择吗?...,因为它们大大减少了资源不足的语言对数据的需求。...然而,特定语言模型的优越性已经被证明适用于能够访问大量数据的语言。在这项工作中,我们将重点放在加泰罗尼亚语上,目的是探索一个中等规模的单语语言模型在多大程度上与最先进的大型多语言模型相竞争。...为此,我们:(1)建立了一个干净、高质量的加泰罗尼亚语文本语料库(CaText),这是迄今为止最大的语料库(但仅是以往单语语言模型研究的一小部分),(2)为加泰罗尼亚语(BERTa)建立了一个基于转换器的语言模型...结果是一个新的基准,加泰罗尼亚语言理解基准(CLUB),我们将其作为一个开放资源,与干净的文本语料库、语言模型和清理管道一起发布。

    57430

    自然语言处理学术速递

    目前最好的方法是使用迁移学习:使用来自多个资源丰富的语言的标记数据训练单个有监督的多语言模型,然后将其应用于目标零资源语言(无需微调)。然而,目前尚不清楚训练语言的具体选择如何影响下游绩效。...为了理解这种差异,我们进行了几项针对参与方面的分析,包括他们的评论是否进一步吸引寻求支持者,以及语言方面,如主导语言和语言风格匹配。...弱监督方法,包括数据编程,解决了这一问题,并通过使用噪声标签源进行监督来降低标签收集的成本。然而,直到最近,数据编程只对知道如何编程的用户开放。...为了弥补这一差距,提出了基于演示框架的数据编程,以便于基于领域专家标注的几个实例自动创建标注函数。该框架已经成功地生成了用于文档分类的高精度标签模型。...我们构建了一个新的工具TagRuler,它使得注释者不需要编程就可以轻松地构建跨级别的标记函数,并鼓励他们在不同的标记模型和主动学习策略之间进行权衡。

    68120

    自然语言处理学术速递

    】 Table Caption Generation in Scholarly Documents Leveraging Pre-trained Language Models 标题:利用预先训练的语言模型在学术文档中生成表格标题...Kato 机构:University of Tsukuba, Ibaraki, Japan 备注:None 摘要:本文讨论了为学术文档生成表标题的问题,这通常需要表外的附加信息。...本文的主要贡献有:(1)讨论了学术文献表格标题的挑战(2) 开发数据集DocBank TB,可公开获取;(3)比较不同检索策略的学术文献标题生成方法。...我们通过引入$\texttt{SenseVM}$来解决这一挑战,这是一种字节码解释的虚拟机,它为微控制器编程提供了基于消息传递的$\texttt{higher-order concurrency}$模型...桥接器由所有驱动程序实现,其设计使得响应软件消息或硬件中断的编程保持统一且不可区分。

    36110

    自然语言处理学术速递

    这使得大多数方法在学术领域的在线数据库和知识图中不实用。在这里,必须核实科学出版物的作者身份,通常只有摘要和标题。...然后,我们将分析扩展到28种不同的语言,发现语际空间呈现出一种特殊的结构,类似于语言的语言关联性。我们还强调了一些似乎无法收敛到共享空间的异常语言。...Darmstadt., ukp.informatik.tu-darmstadt.de, Intelligent Systems Lab, University of Bristol 摘要:同行评议是学术界主要的质量控制机制...在这项研究中,我们调查了计算语言模型或人类的语言预测是否更好地反映了自然语言刺激调节N400振幅的方式。...人类语言预测与计算语言模型的一个重要区别是,虽然语言模型的预测完全基于前面的语言背景,但人类可能依赖其他因素。

    90220

    自然语言处理学术速递

    我们在类似于MLQA数据集的七种语言上使用多语言转换器架构测试了语言和任务适配器的四种组合。此外,我们还提出了使用语言和任务适配器进行低资源问答的Zero-Shot迁移学习。...我们观察到,对于低资源语言,堆叠语言和任务适配器可以显著提高多语言转换器模型的性能。...从学生的经历中学习是教育研究者和学术管理者的基础。在新的知识经济中,从经验中学到的21世纪技能正在成为大学和职业准备以及招聘过程的核心部分。...学术研究者发现了精神健康分类数据不足和未标记的问题。为了解决这个问题,我们研究了数据增强技术对特定领域用户生成的用于心理健康分类的文本的影响。...在这项工作中,我们在覆盖多种语言的平衡语料库上训练多语言自回归语言模型,并研究它们在广泛任务中的少量和零次学习能力。

    55730
    领券