我是抓取使用Selenium生成表格数据并发送到BeautifulSoup。下面的脚本将拉取所有文本数据(这是我想要的)。不幸的是,它似乎只是将所有文本连接在一起的一个元素列表。如何在div类的"table-container“中设置漂亮的文本过滤器,并将每个文本项作为一个项发送到列表中?driver.find_element_by_name("login_button").click()
t
我的项目想法是刮下表,并将信息输出到excel文件中。我得到的输出相当成功!然而,我不确定我的代码是非常"pythonic“。我强迫自己用一些正则表达式来获取数据,我觉得肯定有一种更简单、更快的方法来抓取表数据,并删除放在整个表中的一些烦人的u‘’Name格式和图像链接。具体来说,在表格的第3栏中,我们看到了国家标志的图像,以及我关心的信息(国家名称).Because,我不能只做cells3.find(text=True)。prevent 403 error on Wikipedia
req = u