我正在尝试抓取以下网站的数据框架
https://infogram.com/detallecasos-1h7z2l9yqgdy2ow
使用R.中的rvest包
但我得到了
{xml_nodeset (0)}
我试着用多个堆栈溢出的答案来解决这个问题,但没能解决。感谢能帮助我的人。
library(rvest)
read_html("https://infogram.com/detallecasos-1h7z2l9yqgdy2ow") %>%
html_nodes('table') %>%
html_table(fill = TRUE)
预期输出
发布于 2020-03-22 23:39:34
下面是返回表的代码
library(rvest)
library(stringr)
library(rjson)
library(data.table)
pg <- read_html("https://infogram.com/detallecasos-1h7z2l9yqgdy2ow")
Mat <- pg %>% html_nodes("body") %>%
html_nodes("script:contains('window.infographicData')") %>%
html_text() %>% str_extract(string = ., pattern = "\\[\\[.*\\]\\]") %>%
substr(x = ., start = 2, stop = nchar(.)-1) %>% fromJSON() %>%
do.call(rbind, .)
colnames(Mat) = Mat[1, ]
DT <- as.data.table(Mat[-1,-1])
DT
Fecha de diagnóstico Ciudad de ubicación Atención Edad Sexo Tipo* País de procedencia
1: 06/03/2020 Bogotá casa 10 a 19 F Importado Italia
2: 09/03/2020 Buga hospital 30 a 39 M Importado España
3: 09/03/2020 Medellín casa 50 a 59 F Importado España
4: 11/03/2020 Medellín casa 50 a 59 M Relacionado Colombia
5: 11/03/2020 Medellín casa 20 a 29 M Relacionado Colombia
---
227: 22/03/2020 Cali casa 20 a 29 M Importado Estados Unidos
228: 22/03/2020 Cali casa 20 a 29 M Importado España
229: 22/03/2020 Yopal casa 30 a 39 F Relacionado Colombia
230: 22/03/2020 Armenia casa 30 a 39 F Relacionado Colombia
231: 22/03/2020 Cali casa 40 a 49 F Relacionado Colombia
https://stackoverflow.com/questions/60803468
复制相似问题