利用Selenium抓取词汇表并解析成DataFrame

、、、、

有一个小程序，它进入一个词汇表，打印该页上的所有单词，然后单击按钮转到下一页，并再次打印该页上的所有词汇表。我使用一个循环来重复这个过程，并循环遍历分布在多个页面上的所有单词。#Create csvwriter = csv.writer(outfile) #Define the dataframedf = pd.DataFrame(columns=[&#

浏览 11提问于2020-12-04得票数 5

1回答

用漂亮汤将硒html表格放入熊猫数据

、、

我已经成功地使用selenium来抓取一个html表，它需要在抓取之前点击按钮。不过，我很难把这个解析成熊猫的数据。与URL一样，dataframe应该有5列和大约30行。from selenium import webdriver browser =

浏览 1提问于2020-04-03得票数 2

回答已采纳

1回答

如何通过Selenium获取股票代码？

、、

我正在尝试从这个page中抓取股票代码。这是我的代码： from selenium import webdriverprint(dfs) 0 加入至心水組合：請先登入或註冊成為會員, Empty DataF

浏览 13提问于2019-04-15得票数 0

回答已采纳

2回答

抓取html数据并解析成列表

、、、、

这是我不能使用的解析器。

浏览 1提问于2014-04-14得票数 0

1回答

抓取句柄302重定向

、、、、

我正在尝试用一个粗糙的CrawlSpider抓取一个网站，问题是这个网站一直在随机地重定向我，这意味着一个url有时可能会加载，有时会被重定向到某个页面。

浏览 2提问于2017-11-06得票数 0

2回答

使用Python自动化创建例程的最佳方法

、

它应该做的是浏览几个网站，点击一些按钮，抓取所需的信息，存储收集的信息，并填写一些表格。使用Python可以做到这一点吗？如果是，那么最紧凑的方法是什么？

浏览 1提问于2013-05-07得票数 0

1回答

如果我们可以使用Selenium，为什么还需要像BeautifulSoup这样的解析器呢？

、、、、

我目前正在使用Selenium从一些网站抓取数据。与urllib不同，我似乎并不需要像BeautifulSoup这样的解析器来解析HTML。我可以简单地找到一个带有Selenium的元素，并使用Webelement.text来获取我需要的数据。正如我所看到的，有些人在web爬行中同时使用Selenium和BeautifulSoup。

浏览 3提问于2017-04-02得票数 8

回答已采纳

1回答

如何使用selenium/python使用“ngcontent”格式刮表？

、、

基本表很容易使用Selenium进行抓取。我在用"_ngcontent“符号(”“)刮表时遇到了麻烦，我试图把它刮成一个数据格式。from selenium import webdriverimport pandasas pd from <

浏览 1提问于2022-08-04得票数 0

回答已采纳

1回答

动态内容的Web抓取

、、、、

我试图从几个网站(mega.nz，openlaod.co)抓取信息，内容是动态加载的，所以我实际使用的代码不起作用 <?有没有什么javascript/jquery框架(或php)可以用来即时抓取内容？？

浏览 17提问于2018-08-07得票数 0

1回答

基于动态内容和隐藏数据表的Selenium* Web抓取*

、、、、

我正在使用Selenium和Beautiful Soup在Python中对动态内容进行web抓取。问题是，即使使用以下代码，也无法将定价数据表解析为Python：sel_soup=BeautifulSoup(html, 'html.parser') 然而，我后来发现，如果我在使用上面的代码之前单击WebPage上的“查看所有价格”按钮，我可以将该数据表解析

浏览 15提问于2018-02-14得票数 2

3回答

用于web抓取的Selenium与BeautifulSoup

、、、

我正在使用Python从一个网站上抓取内容。首先，我在Python上使用了BeautifulSoup和Mechanize，但我看到网站上有一个通过JavaScript创建内容的按钮，所以我决定使用Selenium。既然我可以通过像driver.find_element_by_xpath这样的方法使用Selenium查找元素并获取它们的内容，那么当我可以使用Selenium做任何事情时，还有什么理由使用BeautifulSoup在本例中，我需要使用Selenium来单击JavaScript

浏览 1提问于2013-07-03得票数 53

回答已采纳

2回答

google play的30多个搜索结果

、

谷歌已经做出了新的布局和设计的游戏商店。为了追踪应用程序的存储位置，谷歌是否有办法在桌面浏览器中获得超过30种搜索结果，比如通过浏览器控制台之类的方式？

浏览 5提问于2022-07-07得票数 -3

1回答

如何使用InstaPy直接向用户发送消息？

、、

我使用python Selenium来创建web抓取机器人已经有一段时间了。最近我发现了InstaPy，并利用它来增加一些Instagram页面的追随者。

浏览 24提问于2020-09-24得票数 0

1回答

webscraping返回不完整的信息

、、

现在学习网络抓取，并决定放弃电报的网络版本，所以我选择了一个聊天(与你自己最喜欢的)，并发送了很少的声音。= soup.find_all('div', class_=re.compile('audio-time'))[0] 我得到的只是一片空荡荡的[] 也许我应该使用不同的解析器

浏览 3提问于2022-11-27得票数 0

1回答

在selenium中如何更快地从动态网站读取数据

、、、

没有API，我正在阅读selenium中的所有内容。我每次都有无限循环和寻找元素。有没有其他的库，或者如何用Selenium来加速？我正在抓取https://www.betcris.pl/zaklady-live#/Soccer的一个网站

浏览 13提问于2021-10-20得票数 0

4回答

用PHP / Python解析文本？多么?用什么？

、、、

我正在考虑添加一种方法来解析文本(报纸文章等)，并输出使用的单词列表，然后可能交叉连接到词汇表部分。现在，我想知道理想情况下php或者python中是否有任何程序/脚本可以用来将文本解析成所使用的单词列表(并且可能能够排除最常用的单词列表)。

浏览 0提问于2011-04-01得票数 1

回答已采纳

1回答

如何让django项目点击url的特定标签

、

我正在开发一个使用python和Django的网页抓取代码。我已经提供了所需的url，并且已经获取了数据。但是在url上有一个标签，上面写着“显示更多结果”。我已经使用Beautiful Soup库来进行web抓取/

浏览 16提问于2021-04-15得票数 0

1回答

对于我的任务，面向对象的方法是正确的解决方案吗？如果是这样的话，如何实现它的粗略想法？

、

我正在用使用Selenium的python编写一个网络爬行器。有不同的客户端可以访问的数据表，我希望允许我的程序的未来用户拉一个(或可能多个)表来查看数据，或使用它来验证网站上的东西是否正确填充。from selenium import webdriverfrom selenium.webdriver.common.byimport By from selenium.webdriver.commo

浏览 0提问于2020-01-23得票数 0

3回答

无法使用BeautifulSoup抓取数据

、、、

我正在使用Selenium登录到网页，并获得网页进行抓取，我能够获得该页面。我已经在html中搜索了我想要抓取的表。webpage我可以在souppage变量中获得解析后的网页但不能抓取并存储在tbody变量中。

浏览 0提问于2018-02-21得票数 1

2回答

在web服务器上使用java内容的抓取

、、

我想从一个显然使用javascript生成表的站点(这个站点是oddsportal.com)中抓取内容。我看到Scrapy无法加载动态内容，我阅读selenium可以处理它，但我计划使用web服务器。有什么方法可以解析这个站点或获取动态请求并使用scrapy解析它吗？

浏览 3提问于2016-01-28得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

用漂亮汤将硒html表格放入熊猫数据

如何通过Selenium获取股票代码？

抓取html数据并解析成列表

抓取句柄302重定向

使用Python自动化创建例程的最佳方法

如果我们可以使用Selenium，为什么还需要像BeautifulSoup这样的解析器呢？

如何使用selenium/python使用“ngcontent”格式刮表？

动态内容的Web抓取

基于动态内容和隐藏数据表的Selenium* Web抓取*

用于web抓取的Selenium与BeautifulSoup

google play的30多个搜索结果

如何使用InstaPy直接向用户发送消息？

webscraping返回不完整的信息

在selenium中如何更快地从动态网站读取数据

用PHP / Python解析文本？多么?用什么？

如何让django项目点击url的特定标签

对于我的任务，面向对象的方法是正确的解决方案吗？如果是这样的话，如何实现它的粗略想法？

无法使用BeautifulSoup抓取数据

在web服务器上使用java内容的抓取

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐