我正在尝试从一个网站获取web数据,我只需要从tbody类中获取内部html数据,并将其转换为json,以便进行更好的控制,并在稍后将数据保存到文件中。我只通过使用selenium中的find_element(By.XPATH)来读取每个元素。有没有办法读取整个innter html tbody内容,然后将其解析为json?请求不起作用,因为它在iframe中。
我正在使用Selenium登录到网页,并获得网页进行抓取,我能够获得该页面。我已经在html中搜索了我想要抓取的表。脚本是这样的:souppage=BeautifulSoup(rawpage,'html.parserparsing the webpage
tbody=souppage.find('table', attr
我想解析表“表1:消费价格指数,1924年的历史指数(2015=100)”,从这里:我使用Selenium打开要解析的表(请参阅下面的代码)。但是使用pd.read_html的行会抛出错误消息。ImportError: html5lib not found, please install it
即使我已经安装了html5lib (也使用pip l