机器学习有大量的算法,往往很容易让人感到不知所措。也正因为有太多的选择,导致人们不知道应该从哪里开始和要怎么去做。
这么多的选择,常常会让人感到麻木。
你需要先克服这种恐惧再开始。
没有魔法书或课程会告诉你什么时候应该使用什么算法。实际上,在实践中你不可能事先知道这一点。你必须通过反复试验才能发现它。这也意味着你会犯一些错误。
在这篇文章中,你会发现一个简单的技巧,让你应用在刚开始的机器学习上。
这个技巧将会引人深思,激励你更深入的钻研,还会增强你最喜欢的算法或工具,加速你的机器学习的旅程。
这是一个简单的策略,甚至一些有经验的从业者也会因为它的简单而忽略或忘记这个策略。
你需要用各种不同的算法建立信心。
你解决机器学习问题的技巧大部分都掌握在你掌握的工具和能自信运用的能力上。
在这条道路上的第一步是打开一个工具或者库,并开始应用算法。就像学习编程一样,你需要从hello world开始。应用机器学习的hello world就是加载数据集并运行算法。
运行算法就是你建立自信的方式。
你应该运行大量的算法。运行完一个工具或库提供的所有算法后,接着尝试另一个库或工具的。
你不要想着找到最好的算法,没有最好的机器学习算法,如果对所有问题使用同一种算法或一类算法,则会严重的限制你可以实现的结果。
你会惊讶于有兴趣应用机器学习,但没有运行算法问题的人数。
同样,在你运行完你的第一个算法之后,你也会惊奇地发现,这是多么的微不足道,而你还有更多的东西需要你做。
很简单的流程:
上面的流程很简单。事实上,正因为这么简单,你更应该这么做,这让你在所有主流的机器学习工具和库中,都能轻松地处理简单的问题。
除了选择最喜欢的算法之外,另一个问题是选择一个最喜欢的工具或库。
要想真正有效的解决问题,你需要使用任何能给你带来更好结果的工具。而且还要学习如何充分地使用每个工具,但要做好这些工具过时的准备。
你暂时还不需要了解工具或算法的问题。您正在建立对这个工具的信心和熟悉它提供的东西。
你刚开始应该问这样的问题:
在机器学习的应用方面有很多东西需要学习,这也正是为什么它是一个激动人心的领域。
希望这个练习能激励你深入一点,并开始研究一定的算法或算法参数来回答这些问题。
这个技巧不只是克服算法的选择困难症,对这个工具建立信心和熟练使用它,我还希望它能激发你的好奇心。毕竟知道更多需要的东西可以让你走很长一段路,帮助你理解以前觉得难以理解的事情。
可以随时在想要演示的数据集上运行给定的算法的好处在于,你可以把书籍,博客和其他资料所阅读和学习的内容加以理解融入你使用的工具。这种将创意付诸行动的能力将会提高你的学习动力并促进你的学习。
这里有很多工具,几乎和机器学习算法一样多。
我喜欢尝试其中的大部分,但只是看看他们提供什么,他们可以做什么。
有一个小技巧,您可以在文本文件比如word文档或程序代码中创建一套属于你自己的方法或执行计划。这让你以后再使用这个工具时,可以针对问题和算法快速的开始。
你的好奇心会让你更进一步,因为你可能想要开始建立一个机器学习算法列表,描述这些算法,甚至运用在小型的研究项目中从而研究他们。
在这篇文章中,你发现的这个简单的技巧,可以用来压倒性的克服算法。这关键在于开始使用现成的工具和库将算法应用于小内存问题。
这个技巧的妙处在于它让你熟悉算法和工具,但更重要的是让你对算法,算法的实现和参数产生了好奇心。这种好奇心可以激励你更深入的了解,追求知道更多相关知识。
当你在学习机器学习的过程中遇到它们,熟悉工具和算法是你发现新东西想进行尝试并付诸行动的基础,这也可以促进你的学习。
请选择一个工具,然后运行你的第一个算法。
如果你仍然感到迷惑,请按照这个循序渐进的教程在Weka中运行你的第一个机器学习算法。然后运行更多的算法。
请分享你的经验。比如说你选择了哪一种工具,运行了哪种算法,引发了什么问题?