机器学习是一项令人惊叹的技术。如果掌握了正确的使用方法,机器学习技术将势不可当。建造一个在很大程度上表现得像人类的机器,将是多么吸引人。精通机器学习工具有利于处理数据、训练模型、发现新方法并创建自己的算法。
随着机器学习技术的兴起,大量的机器学习(ML)工具、平台和软件纷纷涌现。 而且,机器学习技术也在不断发展。在这一堆机器学习工具中,你只需选择其中任意一种来获得专业知识。本文列出了专家们使用最多的前15个机器学习工具。
Knime是一个基于图形用户界面(Graphical User Interface,GUI)的开源机器学习工具。关于Knime,最值得一提的是,即使没有任何编程知识,仍然可以利用Knime提供的工具。Knime通常用于与数据相关的目的,例如:数据操纵、数据挖掘等。
而且,Knime通过创建并执行不同的工作流程来处理数据。Knime的存储库带有很多不同节点。然后,将这些节点带入Knime门户就能创建并执行节点的工作流程。
Accord.net是一个计算机器学习框架,配有图像和音频包。这样的软件包有助于训练模型和创建交互式应用程序,例如:试听、计算机视觉等。
由于工具名中包含.net,因此该框架的基础库是C#语言。Accord库在测试和处理音频文件中非常有用。
Scikit-Learn是一个开放源代码的机器学习包。 这是一个集成平台,具有多种用途。它有助于进行回归、聚类、分类、降维和预处理。Scikit-Learn创建于三个主要的Python库之上,即NumPy、Matplotlib和SciPy。除此之外,它还有助于测试以及模型训练。
TensorFlow是一个开源框架,适用于大规模及数值机器学习(ML)。它是机器学习和神经网络模型的集合,也是Python的好朋友。
TensorFlow的最大特点是可以在CPU和GPU上运行。TensorFlow常用于自然语言处理和图像分类。
欢迎下一个机器学习工具——Weka,它也是开源软件。用户可以通过图形用户界面访问Weka。 该软件非常人性化。它也被应用于研究和教学中。除此之外,Weka还允许用户访问其他机器学习工具,例如:R、Scikit-Learn等。
Pytorch是一个深度学习框架,既快速又灵活。这是因为Pytorch可以很好地命令GPU。 它是机器学习最重要的工具之一,因为它被用于机器学习最重要的方面,包括构建深度神经网络和张量计算。
Pytorch完全基于Python。除此之外,它是NumPy的最佳替代工具。
于非程序员用户而言,RapidMiner是他们的福音。它是一个数据科学平台,具有非常出色的界面。RapidMiner独立于平台,在跨平台操作系统上工作。
借助该工具,人们可以使用自己的数据,测试他们自己的模型。RapidMiner的界面非常人性化。用户只需要拖放即可。这也是它对非程序员大有裨益的主要原因。
Google Cloud AutoML的目标是使所有人都能使用人工智能。Google Cloud AutoML为用户提供了预训练模型,以便创建各种服务,例如:文本识别、语音识别等。
Google Cloud AutoML在公司中非常受欢迎。公司希望将人工智能应用于行业的各个领域,但由于市场上缺少熟练的人工智能人才,因此Google Cloud AutoML的企业应用一直面临着困难。
Jupyter notebook是使用最广泛的机器学习工具之一。 这是一个非常快速的处理工具,也是一个高效的平台。此外,它支持三种语言,即:Julia、R、Python。
因此,Jupyter的名称是由这三种编程语言组合而成。Jupyter Notebook允许用户以笔记本的形式存储和共享动态代码,也可以通过GUI访问它,例如: winpython navigator,和anaconda navigator等。
Mahout由基于Hadoop的开源平台Apache启动。Mahout通常用于机器学习和数据挖掘。 Mahout使诸如回归、分类和聚类之类的技术成为可能。除此之外,它还利用了基于数学的函数,例如向量等。
Azure机器学习工作室由Microsoft发布。就像Google的Cloud AutoML一样,这是Microsoft的产品,可为用户提供机器学习服务。Azure机器学习工作室是建立模块和数据集连接的一种非常简单的方法。
除此之外,Azure还旨在为用户提供AI功能。与TensorFlow一样,它也可以在CPU和GPU上运行。
与Mahout一样,MLLIB也是Apache Spark的产品。 它用于回归、特征提取、分类、过滤等。通常也称之为Spark MLLIB。MLLIB具有非常好的速度和效率。
Orange3是一款数据挖掘软件,它是Orange软件的最新版本。Orange3协助预处理、数据可视化以及其他与数据相关的工作。用户可以通过Anaconda Navigator访问Orange3。 在Python编程中,这确实很有帮助。除此之外,它还可以充当一个不错的用户界面。
IBM Watson是IBM提供的使用Watson的网页界面。 Watson是基于自然语言处理的人机交互问答系统。Watson应用于各个领域,例如:自动学习、信息提取等。
IBM Watson通常用于研究和测试,其目的是为用户提供类似人的体验。
Pylearn2是建立在Theano之上的机器学习库。因此,它们之间有许多相似的功能。除此之外,它还可以执行数学计算。Pylearn2也能够在CPU和GPU上运行。在进入Pylearn2之前,用户必须熟悉Theano。
综上所述,本文介绍的是一些最流行和广泛使用的机器学习工具。上述工具表明了机器学习的先进性。所有这些工具都使用不同的编程语言运行,例如:其中一些工具在Python上运行,一些在C ++上运行,而另一些在Java上运行。
本文系外文翻译,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文系外文翻译,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。