温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
在我们本期视频更新当中,我们来给大家介绍一下大数据与机器学习它们之间的关系。因为很多学员在开始学习大数据的时候,对这两者的关系不是特别明白,所以呢造成了学习上的困难,下面呢,我来给大家做个介绍,大家可以点点关注,听我下面的分析。首先我们讨论一下机器学习,机器学习的本质是算法,算法本身跟我们使用的编程语言或者使用的框架没有任何的关系。我们可以用加法语言,Python语言,C加加这种语言来实现我们的算法,我这里呢,举一个非常简单的例子。比如我想实现商品推荐的系统,我就可以利用机器学习当中的协同过滤或者是LS最小交替二层这的算法来实现。那么开发应用程序的话,我可以使用Python,或者使用Java,或者使用我们的C的加元等等等等这个语言来实现这样的功能。而机器学习的算法是人工智能的基础,因此我们在学习AI的时候呢,需要学习机器学习的算法,它跟大数据没有任何的关系。
01:23
那讨论完了机器学习算法以后,我们再来讨论一下大数据。大数据实际上它是一种框架,通过这样的一种框架,我们可以提供数据存储的能力和数据计算的能力,因为数据量达到了一定程度以后,我们需要使用大数据的方式来存储数据,来计算我们的数据。那目前在大数据体系当中,它的主流框架,比如说哈多普10巴克flink,它的最底层的编程语言使用的都是Java的编程语言。
02:00
因此呢,这是我们讨论的大数据,大数据跟机器学习算法它是一个什么样的关系呢?首先我们在大数据体系当中,它支持机器学习算法,不同的大数据生态体系都提供相对应的组件,比如哈杜普体系当中的maha,特斯巴克和弗林克体系当中的ML利,嗯,他们都是使用了Java语言或者是斯嘎拉语言实现了机器学习的算法,因此它提供了对应的支持。因此通过刚才的这个介绍,我们给大家讨论了一下大数据和机器学习的算法,还有一点我需要说明的是,离开了大数据平台,单纯的去讨论机器学习的算法,实际上意义并不是很大。为什么这么讲呢?因为我们通过机器学习的算法需要去处理数据,需要是分析数据,当数据量达到了一定程度以后,必然需要依托大数据平台来提供数据的存储的能力和计算能力。因此呢,我们在现实使用场场景当中,通常会把把这两者结合在起。
03:15
那通过上面的介绍,相信各位学员对我们的大数据以及机器学习他们之间的关系呢,应该有了一个比较清楚的了解。
我来说两句