将'html_attr‘添加到使用rvest抓取多个urls的函数中

、

我想使用下面的scrape_change_page函数将单个请愿的链接添加到数据帧中，但我不确定如何调整以包含html_attr函数，该函数将从多个页面中抓取url链接。欢迎有任何想法！library(pacman) pacman::p_load(rvest, dplyr, stringr, purrr, lubridate, tibble, tidyr, str

浏览 28提问于2020-08-03得票数 0

回答已采纳

2回答

这个URL循环中的错误是什么？

、、、

对于一个url，代码可以工作，但是对于一个列表中的多个url，这是不起作用的，这会产生一个错误。我是新来的，请帮帮忙。library(rvest) rvest::html_nodes("a") %>% rvest::html_att

浏览 6提问于2022-03-16得票数 0

1回答

html()未正确读取列表中的urls

、

我想从一个网站刮的pdf。我可以手动下载它们，但这是一个学习练习，这样我以后可以做更多的网站。我正在尝试使用rvest，并且我已经有了基本的功能。("~/downloads/file.pdf") 我想在所有的年度报告中这样做。If it succeeds, I can put in a for loop.test %>% html_nodes("a&qu

浏览 11提问于2019-04-27得票数 0

回答已采纳

2回答

使用R在搜索结果的第一页之外刮取URL

、、、

请注意，我知道有许多网络抓取的问题和答案已经张贴，但我没有能够解决我的问题后，他们阅读。library(rvest) webpage = read_html("http:/&#x

浏览 7提问于2022-02-11得票数 0

1回答

运行几个URL，并从每个URL导入数据

这只是我自己的一个学习练习。我以为我基本上知道怎么做，但我已经被一个问题困了几个小时了，现在我真的没有取得任何进展。我相信我下面的代码是很接近的，但由于某种原因，它不会递增，不会抓取任何东西。library(rvest)WS <- read_

浏览 0提问于2017-12-16得票数 0

1回答

错误:无效的下标类型'list‘(Webscraping)

、、

我正在尝试从以下url中抓取数据-：我想单击每个大学的名称并获取每个大学的特定数据。首先，我收集了一个矢量形式的所有大学网址：library(xml2)library(stringr) #Create an html document from the url #Ext

浏览 0提问于2019-02-04得票数 1

1回答

rvest从网页抓取链接

、

我正在使用rvest从杂志“骗局”中抓取一些链接。我用过这段代码 library(rvest) html_nodes(".daily-article-title") %>% html_attr('href') 但是，这

浏览 13提问于2021-04-29得票数 0

回答已采纳

1回答

R循环不想要的覆盖

、、、、

我希望循环的每一个结果在一个不同的文本(命名)。现在，循环覆盖；urlsmain.page` to the next step html_nodes(".alt:nth-child(2) strong a") %>% # get the CS

浏览 2提问于2017-02-24得票数 1

回答已采纳

1回答

利用rvest定位照片链接和从网站上抓取

、、

我试图使用rvest来抓取照片链接，并将这样的帖子中的所有图片下载到单独的文件夹中。然而，当我试图使用和html_attr查找链接时，我被困在寻找的链接--文章中的图像(包括左边的)，因为只有活动的(在图像上单击的非缩略图)才会显示出来。我的代码如下：l

浏览 12提问于2022-09-07得票数 1

回答已采纳

2回答

html_attr "href“在rvest中返回NA

、、、、

我的目标是使用rvest提取与网站中特定css元素关联的urls。在研究了其他几个类似的问题之后，我想我需要使用带有html_attr参数的'href'函数。用我现在的脚本，它只返回NA值，尽管我希望它返回urls。输入以构建变量 my_url <- "http://www.s

浏览 7提问于2017-07-06得票数 2

1回答

我想使用r中的rvest遍历包含url的数据。

、、

首先，我从一个网站上抓取了一定数量的urls，并将它们收集到一个数据文件中。但是，我想循环我收集到的urls到dataframe中。这是我的密码：library(XLConnect) ##########GET URLS######################################################################

浏览 2提问于2016-10-24得票数 0

回答已采纳

1回答

我正在尝试从这个网站- 收集所有的个人网址(律师的网址)。我找不到一种方法来提取URLs当我使用CSS选择器时，它不工作。你能推荐其他在网页中找到特定元素的方法吗？另外，为了收集所有需要的数据，我点击按钮"Load More“，我使用的是RSelenium。我认为我在通过docker运行Rselenium时没有做正确的事情，因为它出现了错误- checkError(res)中的错误: httr调用中

浏览 1提问于2018-11-11得票数 1

1回答

从r中的多个urls中进行from抓取

、

我正在尝试从多个urls中抓取表。我使用以下代码从单个url中抓取表：library(rvest) html_element('table.table_subtle') %>

浏览 4提问于2022-08-05得票数 0

回答已采纳

2回答

下载网站上所有pdf的r代码: Web scraping

、、、、

我想用R编写代码，它可以下载这个网址上给出的所有pdf：https://www.rbi.org.in/scripts/AnnualPublications.aspx?head=Handbook%20of%20Statistics%20on%20Indian%20Economy，然后下载文件夹中的所有pdf。我在https://towardsdatascience.com的帮助下尝试了以下代码，但代码错误如下 library(tidyverse) library(<

浏览 27提问于2021-10-27得票数 1

回答已采纳

1回答

Webscraping:数据帧未填充

、

因此，我希望从上搜集数据，特别是英超球员的姓名和URL。我是这样做的:首先抓取联盟中所有球队的URL，然后查看这些球队中的单个球员。我遇到的问题是数据没有保存到框架中。library(rvest) URL <- "http://www.transfermarkt.com/premier-league/startseite/wettbewerb/GB1&quo

浏览 12提问于2017-06-30得票数 0

1回答

使用rvest抓取多个URL

、、、

在rvest中使用read_html时如何抓取多个urls？目标是从相应的urls中获得一个由文本主体组成的单个文档，以在其上运行各种分析。我尝试连接urls： page <-read_h

浏览 8提问于2020-02-25得票数 1

回答已采纳

1回答

R从不同的URL抓取Web

、、

我在网页上抓取一个页面一旦我试图抓取应该包含在数据框架中的单个项目描述，我的

浏览 1提问于2018-01-16得票数 0

1回答

为什么我的函数要创建副本？

、、

我编写了一个函数，它遍历URL并从每个页面中抓取我需要的数据。library(xml2)下面创建了相关URL的向量： }all_pages <- function(x) { id_

浏览 0提问于2018-05-10得票数 1

回答已采纳

1回答

如何在R中解析指定类的网站地址？

、、、、

我想解析以下网站上所有商店的地址:通过区域循环的https://www.carrefour.fr/magasin/region/。请注意，我可以添加更多的区域，我只是想让它与一个现在的工作。color-standard-2']") addresses_vector <- c(addresses_vector, html_doc %>% rvest::html_te

浏览 40提问于2021-07-16得票数 3

回答已采纳

1回答

sys.sleep在红袖中的应用

、

我试着用rvest从网站上抓取一些数据。我有数千个URL，我需要从每个URL中提取一段数据。为了不被我访问的主站点阻塞，我需要在每次访问200个URL之后休息大约2分钟(通过尝试和错误了解到这一点)。我想知道如何使用sys.sleep来做到这一点。data_I_need <- url_tibble %

浏览 3提问于2022-07-19得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

这个URL循环中的错误是什么？

html()未正确读取列表中的urls

使用R在搜索结果的第一页之外刮取URL

运行几个URL，并从每个URL导入数据

错误:无效的下标类型'list‘(Webscraping)

rvest从网页抓取链接

R循环不想要的覆盖

利用rvest定位照片链接和从网站上抓取

html_attr "href“在rvest中返回NA

我想使用r中的rvest遍历包含url的数据。

在网页中查找元素- Rselenium/rvest

从r中的多个urls中进行from抓取

下载网站上所有pdf的r代码: Web scraping

Webscraping:数据帧未填充

使用rvest抓取多个URL

R从不同的URL抓取Web

为什么我的函数要创建副本？

如何在R中解析指定类的网站地址？

sys.sleep在红袖中的应用

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐