【IT168 资讯】在这一点上,毫无疑问,任何组织都可以通过将机器学习应用到他们的业务流程中来利用机器学习。机器学习的重要性取决于它如何应用以及你试图用它来解决什么样的问题。结果还取决于数据科学家和软件工程师的经验以及技术的采用。
在本文中,我们将学习机器学习开发生命周期的真实外观,并了解组织如何通过机器学习来构建团队解决其业务问题。让我们开始考虑以下图像:
正如你在上面看到的,机器学习过程是一个连续的过程,从各种来源提取数据,然后输入生成模型的机器学习引擎。这些模型被插入业务流程以产生结果,然后将这些模型的结果输入到解决业务问题的过程中。这些模型可以在边缘独立产生结果,具体取决于它们的用途。
在这一点上,关键的问题是了解机器学习开发生命周期的外观。需要什么样的技能才能脱颖而出?这些团队在建立和应用机器学习时会做什么?
随着我们的进一步发展,我们将获得上述问题的答案。如果我们看下面的机器学习开发生命周期图,将看到以下范例:
1.收集各种资源的数据。
2.收集数据后,使其机器学习就绪。
3.机器学习就绪数据进入“构建机器学习”过程,数据科学小组从数据中获取结果。
以上你可以看到,“构建机器学习”过程是非常重要的数据科学工作。然而,申请机器主要涉及软件工程的过程。你可以使用上图来了解,为你的组织实施端到端机器学习管道所需的技术资源。
下一个问题涉及构建机器学习和机器学习的分离。这两个过程有何不同?机器学习过程的最终结果是什么?软件工程如何应用?
看下面的图片,我们可以看到“构建机器学习”过程的产品是企业或企业用作最终产品的模型。该模型已准备好根据需要生成结果。
该模型可以应用于各种消费者、企业和工业用例,以提供边缘级智能,或者在过程智能中,将模型结果输入到另一个过程中。有时,模型会被输入到另一个机器学习过程中以产生更多结果。
一旦我们了解到关键人员在端到端机器学习过程中的重要性,需要考虑的下一个问题是,关键人员在日常过程中做了什么?他们如何真正参与建立机器学习的过程?他们采用或创建什么样的工具和技术来解决组织的业务问题?
为了理解数据科学家在构建机器学习时所做的工作类型,我们应该明白他们的主要重点是根据需要使用和应用尽可能多的机器学习引擎以及各种算法来解决特定问题。有时候,他们创造了一些全新的解决方案,因为没有可用的东西,有时他们只需要改进可用的解决方案。
上面的图片将各种引擎的概念思想汇总在一起,可供数据科学家团队用来完成他们的任务。
软件工程的角色对整个机器学习管道至关重要。他们在应用数据科学的软件工程方法的同时,帮助加快和改进数据科学过程,以产生更快的结果。
下图解释了软件工程师如何通过创建完全自动化的机器学习系统来加速数据科学家的工作,该系统以全自动方式执行数据科学家的重复任务。在这一点上,数据科学家可以利用他们的时间来解决新问题,只需要关注自动化系统以确保其按预期工作。
谷歌(CloudML)和H2O(AutoML)等各种组织已经创建了可供任何组织使用的自动化机器学习软件。也有可用的开源软件包,即Auto-SKLearn或TPOT。
任何组织都可以遵循上述细节,将机器学习应用到他们的组织中并产生预期结果。
领取专属 10元无门槛券
私享最新 技术干货