相信对于数据分析人员来说,一定不会对爬虫感到陌生,在网上的有很多基于python的爬虫资料,今天和大家简单介绍一下基于r语言的爬虫。
在r语言中要实现爬虫,需要调用rvest包和xml2包,把这两个包下载并安转后便可以用简单的几行代码去实现爬虫的功能。以下,用一个例子作为说明:实现r爬虫爬取光明日报的内容并制作词云。
由于小编的网络问题,在这里就不能为大家提供词云了,其实想获得词云,方法很简单,只需要调用r语言的wordcloud2包就行了。故下面提供r爬虫爬取的光明日报内容。
输入:
输出:
以上就是使用r语言爬取的光明日报内容,只要调用wordcloud2包就可以针对以上内容制作出漂亮的词云。
领取专属 10元无门槛券
私享最新 技术干货