选自Amazon 机器之心编译 参与:机器之心编辑部 随着神经机器翻译(NMT)技术的不断演进,越来越多的科研机构和公司选择开源自己的项目,让更多人能够开发出自己的 NMT 模型。此前,清华大学开源了神经机器翻译工具包 THUMT,谷歌也推出了基于 TensorFlow 的 NMT 模型搭建教程。作为 MXNet 的支持者,亚马逊也开源了自己的 NMT 框架 Sockeye。在本文中,亚马逊宣称这个基于 MXNet 的工具可以用于构建目前业内表现最佳的神经机器翻译模型。 Sockeye GitHub 链接:
从旧式编程语言(例如COBOL)到现代语言(例如Java或C ++)的代码库迁移是一项艰巨的任务,需要源语言和目标语言方面的专业知识。
随着互联网和大数据的快速发展,自然语言处理(Natural Language Processing,简称NLP)作为人工智能领域的重要分支之一,引起了广泛的关注和研究。Python作为一种功能强大、易于学习和使用的编程语言,已经成为自然语言处理领域最常用的开发语言。
导读:机器翻译,能够实现多种语言之间的自动翻译,方便人类的沟通和交流,具有重要的研究和应用价值。Transformer是机器翻译领域的一个经典模型,一经问世,便取得了SOTA效果。本文将带领大家一同探秘Transformer,并送上基于飞桨实现 Transformer的实战教程。
通过https://cloud.tencent.com/register注册腾讯云账号
【AI100 导读】本周的 The Ones 为大家推荐了一篇 GAN 在 Chatbot 领域应用的 paper,一个基于 matlab 的深度学习框架 Lightnet,一篇述说机器翻译真实现状的深度文章,一张描述 Chatbot pipeline 的图,一本来自 Keras 作者的书,旨在帮助零基础的同学通过实例来学习深度学习。 1. One Paper Adversarial Learning for Neural Dialogue Generation 链接: https://arxiv.or
将早期的编程语言(例如COBOL)的代码库迁移到现在的编程语言(例如Java或C++)是一项艰巨的任务,它需要源语言和目标语言方面的专业知识。COBOL如今仍在全球大型的系统中广泛使用,因此公司,政府和其他组织通常必须选择是手动翻译其代码库还是尽力维护使用这个可追溯到1950年代的程序代码。
每天给你送来NLP技术干货! ---- 2022年7月,Meta(原Facebook)AI 发布了一个大规模机器翻译模型NLLB-200,该模型在神经网络架构上混合了稠密和稀疏神经网络,参数规模达545亿,在覆盖202种语言、2440个语向的180亿平行句对上进行训练,训练后的单一模型可支持所有覆盖语言之间的的自动翻译(即202X201=40602个语向的互译)。 该模型的名字是英文No Language Left Behind的缩写,体现了机器翻译实现世界上所有语言互译的美好愿景。 历经70载,机器翻
基于词的翻译模型起源于上世纪IBM关于统计机器翻译的原创性工作,教材主要介绍的是IBM Model 1模型。该模型能够从大量句对齐的语料中自动实现词对齐。
本文介绍机器翻译领域针对质量自动评测的方法-BLEU,让你理解为什么BLEU能够作为翻译质量评估的一种指标,它的原理是什么,怎么使用的,它能解决什么问题,它不能解决什么问题。 什么是BLEU? BLEU (Bilingual Evaluation Understudy) is an algorithm for evaluating the quality of text which has been machine-translated from one natural language to anothe
选自Caffe2 Blog 机器之心编译 近日,Facebook 共享了 Caffe2 在支持循环神经网络(RNN)方面的最新成果。在 Caffe2 RNN 中,最突出的亮点是几乎零开销的 RNN 引擎,它不仅可执行任意 RNN 单元且难以置信地灵活,还可以进行束搜索;Caffe2 RNN 还允许每块 GPU 使用大批量数据进行训练,并实现了所谓的静态 RNN。通过 Caffe2 RNN,Facebook 的神经机器翻译的效率提升高达 2.5x,Facebook 全部的机器翻译模型从基于短语的系统转换为所有
最近NLP方向的资源越来越多,GitHub上又出现了一套新的课程,目前已经获得了1300多颗星星。
人工智能(AI)是当今世界上最令人振奋的技术之一,而自然语言处理(NLP)则是AI领域的一个引人注目的分支。NLP的目标是让计算机能够理解、处理和生成人类语言。这项技术正在不断演进,如今,它已经成为各种领域,从商业到医疗保健,都能够利用的强大工具。在本文中,我们将深入探讨NLP的基础知识,探讨其应用领域,以及如何通过代码演示来解锁文本数据的价值。
前一篇文章分享了生成对抗网络(GAN),详细讲解什么是生成对抗网络,及常用算法(CGAN、DCGAN、infoGAN、WGAN)、发展历程、预备知识。
文章知乎链接 https://zhuanlan.zhihu.com/p/92654122
《圣经》中记载,人类曾经联合起来兴建能通往天堂的高塔,为了阻止人类的计划,上帝让人类说不同的语言,使人类相互之间不能沟通,计划因此失败,人类自此各散东西。
春联传统源远流长,一幅写春联的需要极高的文学素养,不仅要求平仄齐整、意境对称,还要表达辟邪除灾、迎祥纳福的美好愿望。
自然语言处理任务(例如字幕生成和机器翻译)涉及生成单词序列。
关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第一 【Python】:排名第三 【算法】:排名第四 源|将门创投 本文所分享的是清华大学刘洋副教授讲解的“基于深度学习的机器翻译
教程地址:http://www.showmeai.tech/tutorials/36
项目地址:https://github.com/facebookresearch/XLM
没错,就是 Hugging Face (抱抱脸)标星 26.9k 的 Transformer 项目。在最新更新的版本里,抱抱脸发布了 1008 种模型,正式涉足机器翻译领域。
选自arXiv 作者:Felix Hieber等 机器之心编译 参与:黄小天、李亚洲、刘晓坤 今年 7 月份,作为 MXNet 的支持者,亚马逊开源了自己的 NMT 框架 Sockeye。近日,亚马逊在 arXiv 放出了介绍 Sockeye 的论文,让我们能更细致的了解该开源工具的技术细节。机器之心对此论文做了摘要介绍,更多详细内容请查看原论文。 过去两年深度学习革命为机器翻译带来了快速而巨大的变化。相较于基于短语的传统系统,基于神经网络的新模型可以持续地为用户提供更高质量的翻译。神经机器翻译(NMT)同
【新智元导读】谷歌CEO在给投资人的信中写道谷歌搜索将更具有情景意识,其关键技术自然是深度学习。本文中,谷歌资深员工、DeepMind 成员 Oriol Vinyals 全面剖析神经网络序列学习的优势、瓶颈及解决方案。他指出机器翻译实质上是基于序列的深度学习问题,其团队希望用机器学习替代启发式算法,最后推测机器阅读并理解文本将在未来几年实现。 文章来源:O'Reilly 报告《The Future of Machine Intelligence) 作者:David Beyer 题目:Oriol Vinyal
选自Vas3k.com 作者:Ilya Pestov 英语版译者:Vasily Zubarev 中文版译者:Panda 实现高质量机器翻译的梦想已经存在了很多年,很多科学家都为这一梦想贡献了自己的时间和心力。从早期的基于规则的机器翻译到如今广泛应用的神经机器翻译,机器翻译的水平不断提升,已经能满足很多场景的基本应用需求了。近日,Ilya Pestov 用俄语写的机器翻译介绍文章经 Vasily Zubarev 翻译后发表到了 Vas3k.com 上。机器之心又经授权将其转译成了汉语。希望有一天,机器自己就能
今天突然看到有人留言说,原来和大家分享的资料网盘链接根本打不开,今天才看到,这里要和大家说句抱歉。为此作者今天重新整理了一下,希望大家能及时的保存。
模型涵盖 140 种不同语言组合,中文翻英文,英文译法语,法语翻阿拉伯语……还能一对多翻译。
选自谷歌 机器之心编译 参与:机器之心编辑部 近日,谷歌官方在 Github 开放了一份神经机器翻译教程,该教程从基本概念实现开始,首先搭建了一个简单的NMT模型,随后更进一步引进注意力机制和多层 LSTM 加强系统的性能,最后谷歌根据 GNMT 提供了更进一步改进的技巧和细节,这些技巧能令该NMT系统达到极其高的精度。机器之心对该教程进行简要的描述,跟详细和精确的内容请查看项目原网站。 GitHub 链接:https://github.com/tensorflow/nmt 机器翻译,即跨语言间的自动翻译,
【新智元导读】斯坦福大学CS224n(全称:深度学习与自然语言处理)是自然语言处理领域很受欢迎的课程,由 Chris Manning 和 Richard Socher 主讲。本课程所有教学视频和课程材
一周的时间转瞬即逝,今天作者给大家分享一下最近收集关于自然语言处理的一些资料,与大家分享,记得保存喲~不然到期了你还得给我要,^_^
👆点击“博文视点Broadview”,获取更多书讯 广义上讲,“翻译”是指把一个事物转化为另一个事物的过程。 在人类语言的翻译中,一种语言文字通过人脑转化为另一种语言表达,这是一种自然语言的“翻译”。 如图1所示,可以通过计算机将一句汉语自动翻译为英语,汉语被称为源语言(Source Language),英语被称为目标语言(Target Language)。 图 1 通过计算机将一句汉语自动翻译为英语 一直以来,文字的翻译往往是由人完成的。 时至今日,人工智能技术的发展已经大大超越了人类传统的认知,用计
在人类语言的翻译中,一种语言文字通过人脑转化为另一种语言表达,这是一种自然语言的“翻译”。
10月27日晚7点,机器之心最新一期线上分享邀请到东北大学教授、博士生导师肖桐带来分享,系统梳理机器翻译发展的技术脉络,并介绍机器翻译发展历程中的经典工作。直播过程中将送出20本肖桐和朱靖波教授的联合著作《机器翻译:基础与模型》。详情见文末。 广义上讲,“翻译”是指把一个事物转化为另一个事物的过程。 在人类语言的翻译中,一种语言文字通过人脑转化为另一种语言表达,这是一种自然语言的“翻译”。 如图1所示,可以通过计算机将一句汉语自动翻译为英语,汉语被称为源语言(Source Language),英语被称为目标
上周,谷歌AI团队开源了备受关注的“最强NLP模型”BERT的TensorFlow代码和预训练模型,不到一天时间,收获3000多星!
机器翻译(Machine Translation,MT)是一种自然语言处理技术,旨在将一种语言的文本自动翻译成另一种语言。机器翻译是自然语言处理领域的重要应用之一,它可以帮助人们在跨语言交流、文档翻译和信息检索等方面更加便捷和高效。本文将详细介绍自然语言处理的机器翻译。
可以看出,整个seq2seq模型分为两大部分:Encoder RNN和Decoder RNN。
机器翻译是一项具有挑战性的任务,包含一些使用高度复杂的语言知识开发的大型统计模型。 神经机器翻译的工作原理是——利用深层神经网络来解决机器翻译问题。 在本教程中,你将了解如何开发一个神经机器翻译系统,
由于人类语言的流动性, 自动翻译或者机器翻译可能是最具挑战性的人工智能任务之一.20世纪90年代, 统计方法被用于完成这项任务, 取代了此前传统上的基于语法规则的翻译系统. 最近, 深度神经网络模型在命名为神经机器翻译的领域中获得了最先进的成果.
作者:科大讯飞cobbyli、zmwang 摘自:36氪 (36kr.com) 不久前,一个实时翻译视频风靡网络,视频中两名分别说着英语和西班牙语的人借助Skype软件的实时翻译功能竟然实现了无障碍交
👆点击“博文视点Broadview”,获取更多书讯 2022年7月,Meta(原Facebook)AI 发布了一个大规模机器翻译模型NLLB-200,该模型在神经网络架构上混合了稠密和稀疏神经网络,参数规模达545亿,在覆盖202种语言、2440个语向的180亿平行句对上进行训练,训练后的单一模型可支持所有覆盖语言之间的的自动翻译(即202X201=40602个语向的互译)。 该模型的名字是英文No Language Left Behind的缩写,体现了机器翻译实现世界上所有语言互译的美好愿景。 历经7
作为自然语言处理中一项非常重要的应用,现代意义上的机器翻译概念从上世纪40年代提出至今,经过了几代革新,现已初步实现了多场景的落地和应用。而近几年随着机器翻译质量的提高,机器翻译将代替人工翻译的声势逐渐浩大起来,那么机器翻译对于人工翻译而言是威胁还是可利用工具?在多大程度上机器翻译又能帮助普通用户呢?
说到腾讯的翻译大家都不陌生,QQ和微信聊天平台上的翻译,QQ浏览器上的翻译全页等功能都是由腾讯云的机器翻译提供强大支持的,但腾讯云的机器翻译到底是啥?它和百度,有道那些翻译APP有啥不同?我相信有这些疑惑的不止我一个人。所以,今天我要和大家分享的就是我初次接触使用腾讯云机器翻译的一些认识,希望本文章能给想要了解腾讯云机器翻译的伙伴们提供一些小小的帮助。
深度学习用的有一年多了,最近开始 NLP 自然处理方面的研发。刚好趁着这个机会写一系列 NLP 机器翻译深度学习实战课程。
前段时间,随着 GPT-4o、Sora 的陆续问世,多模态模型在生成式方面取得的成绩无可否认,而人工智能的下一个革命性突破将从何处涌现,引起了大量学者和相关人士的关注。
在人工智能发展进程中艾伦·麦席森·图灵,这位著名英国数学家、逻辑学家,最早提出了机器人是否会思考的概念,图灵也被誉为现代计算机科学之父和人工智能之父! 艾伦·麦席森·图灵(1912年6月23日-1954年6月7日),被誉为“人工智能之父” 我们把时间推回到半个多世纪的某个夏天,此时麦卡锡、明斯基等众科学家们正在举办一场Party,在这次聚会上探讨和共同研究了用机器模拟智能的问题,也是在那时,“人工智能(AI)”的理念正式被提出! 如今人工智能商业化正在快速推进中,比如我们所知道和了解的人像识别、图像识别技术
11月13日,深圳 - 腾讯AI Lab今日发布了一款AI辅助翻译产品 - “腾讯辅助翻译”(Transmart),可满足用户快速翻译的需求,用AI辅助人工翻译提高效率和质量。该产品采用业内领先的人机交互式机器翻译技术,融合神经网络机器翻译、统计机器翻译、输入法、语义理解、数据挖掘等多项前沿技术,配合亿级双语平行数据,为用户提供实时智能翻译辅助,帮助用户更好更快地完成翻译任务。产品旨在致敬人工翻译,辅助人工翻译更快、更好地完成任务,探索人工智能赋能翻译行业新思路。
本文是胡新辰针对知乎问题“有哪些LSTM(Long Short Term Memory)和RNN(Recurrent)网络的教程?”的答案,对LSTM学习教程、资料以及最新进展介绍总结的很详细,很有参考价值。 先给出一个最快的了解+上手的教程: 直接看theano官网的LSTM教程+代码:LSTM Networks for Sentiment Analysis 但是,前提是你有RNN的基础,因为LSTM本身不是一个完整的模型,LSTM是对RNN隐含层的改进。一般所称的LSTM网络全叫全了应该是使用LSTM单
朱靖波博士是小牛翻译创始人、东北大学计算机学院教授、博士生导师、辽宁省语言智能技术创新中心主任、讯飞AI大学首批特聘教授、中国中文信息学会常务理事。曾入选教育部新世纪优秀人才计划和辽宁省百人层次人才计划。1992年开始从事语言分析和机器翻译理论研究工作,发表了200多篇研究论文和一本清华大学出版的专著《自然语言理解》。
【导读】机器翻译是自然语言处理的重要组成部分,其目的是使用计算机自动将文本翻译成其他语言的形式。近年来,端到端的神经机器翻译发展迅速,已经成为机器翻译系统的新主流。近日,法国勒芒大学发布了基于pyto
领取专属 10元无门槛券
手把手带您无忧上云