腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1102)
视频
沙龙
1
回答
利用
Selenium
抓取
词汇表
并
解析
成
DataFrame
、
、
、
、
有一个小程序,它进入一个
词汇表
,打印该页上的所有单词,然后单击按钮转到下一页,并再次打印该页上的所有
词汇表
。 我使用一个循环来重复这个过程,
并
循环遍历分布在多个页面上的所有单词。#Create csvwriter = csv.writer(outfile) #Define the
dataframe
df = pd.
DataFrame
(columns=[
浏览 11
提问于2020-12-04
得票数 5
1
回答
用漂亮汤将硒html表格放入熊猫数据
、
、
我已经成功地使用
selenium
来
抓取
一个html表,它需要在
抓取
之前点击按钮。不过,我很难把这个
解析
成
熊猫的数据。与URL一样,
dataframe
应该有5列和大约30行。from
selenium
import webdriver browser =
浏览 1
提问于2020-04-03
得票数 2
回答已采纳
1
回答
如何通过
Selenium
获取股票代码?
、
、
我正在尝试从这个page中
抓取
股票代码。这是我的代码: from
selenium
import webdriverprint(dfs) 0 加入至心水組合:請先登入或註冊
成
為會員, Empty
DataF
浏览 13
提问于2019-04-15
得票数 0
回答已采纳
2
回答
抓取
html数据
并
解析
成
列表
、
、
、
、
这是我不能使用的
解析
器。
浏览 1
提问于2014-04-14
得票数 0
1
回答
抓取
句柄302重定向
、
、
、
、
我正在尝试用一个粗糙的CrawlSpider
抓取
一个网站,问题是这个网站一直在随机地重定向我,这意味着一个url有时可能会加载,有时会被重定向到某个页面。
浏览 2
提问于2017-11-06
得票数 0
2
回答
使用Python自动化创建例程的最佳方法
、
它应该做的是浏览几个网站,点击一些按钮,
抓取
所需的信息,存储收集的信息,
并
填写一些表格。使用Python可以做到这一点吗?如果是,那么最紧凑的方法是什么?
浏览 1
提问于2013-05-07
得票数 0
1
回答
如果我们可以使用
Selenium
,为什么还需要像BeautifulSoup这样的
解析
器呢?
、
、
、
、
我目前正在使用
Selenium
从一些网站
抓取
数据。与urllib不同,我似乎并不需要像BeautifulSoup这样的
解析
器来
解析
HTML。我可以简单地找到一个带有
Selenium
的元素,
并
使用Webelement.text来获取我需要的数据。正如我所看到的,有些人在web爬行中同时使用
Selenium
和BeautifulSoup。
浏览 3
提问于2017-04-02
得票数 8
回答已采纳
1
回答
如何使用
selenium
/python使用“ngcontent”格式刮表?
、
、
基本表很容易使用
Selenium
进行
抓取
。我在用"_ngcontent“符号(”“)刮表时遇到了麻烦,我试图把它刮
成
一个数据格式。from
selenium
import webdriverimport pandasas pd from <
浏览 1
提问于2022-08-04
得票数 0
回答已采纳
1
回答
动态内容的Web
抓取
、
、
、
、
我试图从几个网站(mega.nz,openlaod.co)
抓取
信息,内容是动态加载的,所以我实际使用的代码不起作用 <?有没有什么javascript/jquery框架(或php)可以用来即时
抓取
内容??
浏览 17
提问于2018-08-07
得票数 0
1
回答
基于动态内容和隐藏数据表的
Selenium
Web
抓取
、
、
、
、
我正在使用
Selenium
和Beautiful Soup在Python中对动态内容进行web
抓取
。问题是,即使使用以下代码,也无法将定价数据表
解析
为Python:sel_soup=BeautifulSoup(html, 'html.parser') 然而,我后来发现,如果我在使用上面的代码之前单击WebPage上的“查看所有价格”按钮,我可以将该数据表
解析
浏览 15
提问于2018-02-14
得票数 2
3
回答
用于web
抓取
的
Selenium
与BeautifulSoup
、
、
、
我正在使用Python从一个网站上
抓取
内容。首先,我在Python上使用了BeautifulSoup和Mechanize,但我看到网站上有一个通过JavaScript创建内容的按钮,所以我决定使用
Selenium
。既然我可以通过像driver.find_element_by_xpath这样的方法使用
Selenium
查找元素
并
获取它们的内容,那么当我可以使用
Selenium
做任何事情时,还有什么理由使用BeautifulSoup在本例中,我需要使用
Selenium
来单击JavaScript
浏览 1
提问于2013-07-03
得票数 53
回答已采纳
2
回答
google play的30多个搜索结果
、
谷歌已经做出了新的布局和设计的游戏商店。为了追踪应用程序的存储位置,谷歌是否有办法在桌面浏览器中获得超过30种搜索结果,比如通过浏览器控制台之类的方式?
浏览 5
提问于2022-07-07
得票数 -3
1
回答
如何使用InstaPy直接向用户发送消息?
、
、
我使用python
Selenium
来创建web
抓取
机器人已经有一段时间了。 最近我发现了InstaPy,
并
利用
它来增加一些Instagram页面的追随者。
浏览 24
提问于2020-09-24
得票数 0
1
回答
webscraping返回不完整的信息
、
、
现在学习网络
抓取
,
并
决定放弃电报的网络版本,所以我选择了一个聊天(与你自己最喜欢的),并发送了很少的声音。= soup.find_all('div', class_=re.compile('audio-time'))[0] 我得到的只是一片空荡荡的[] 也许我应该使用不同的
解析
器
浏览 3
提问于2022-11-27
得票数 0
1
回答
在
selenium
中如何更快地从动态网站读取数据
、
、
、
没有API,我正在阅读
selenium
中的所有内容。我每次都有无限循环和寻找元素。有没有其他的库,或者如何用
Selenium
来加速? 我正在
抓取
https://www.betcris.pl/zaklady-live#/Soccer的一个网站
浏览 13
提问于2021-10-20
得票数 0
4
回答
用PHP / Python
解析
文本?多么?用什么?
、
、
、
我正在考虑添加一种方法来
解析
文本(报纸文章等),
并
输出使用的单词列表,然后可能交叉连接到
词汇表
部分。现在,我想知道理想情况下php或者python中是否有任何程序/脚本可以用来将文本
解析
成
所使用的单词列表(并且可能能够排除最常用的单词列表)。
浏览 0
提问于2011-04-01
得票数 1
回答已采纳
1
回答
如何让django项目点击url的特定标签
、
我正在开发一个使用python和Django的网页
抓取
代码。我已经提供了所需的url,并且已经获取了数据。但是在url上有一个标签,上面写着“显示更多结果”。我已经使用Beautiful Soup库来进行web
抓取
/
浏览 16
提问于2021-04-15
得票数 0
1
回答
对于我的任务,面向对象的方法是正确的解决方案吗?如果是这样的话,如何实现它的粗略想法?
、
我正在用使用
Selenium
的python编写一个网络爬行器。有不同的客户端可以访问的数据表,我希望允许我的程序的未来用户拉一个(或可能多个)表来查看数据,或使用它来验证网站上的东西是否正确填充。from
selenium
import webdriverfrom
selenium
.webdriver.common.byimport By from
selenium
.webdriver.commo
浏览 0
提问于2020-01-23
得票数 0
3
回答
无法使用BeautifulSoup
抓取
数据
、
、
、
我正在使用
Selenium
登录到网页,
并
获得网页进行
抓取
,我能够获得该页面。我已经在html中搜索了我想要
抓取
的表。webpage我可以在souppage变量中获得
解析
后的网页但不能
抓取
并存储在tbody变量中。
浏览 0
提问于2018-02-21
得票数 1
2
回答
在web服务器上使用java内容的
抓取
、
、
我想从一个显然使用javascript生成表的站点(这个站点是oddsportal.com)中
抓取
内容。我看到Scrapy无法加载动态内容,我阅读
selenium
可以处理它,但我计划使用web服务器。 有什么方法可以
解析
这个站点或获取动态请求
并
使用scrapy
解析
它吗?
浏览 3
提问于2016-01-28
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python 爬取煎蛋妹子图
python 爬虫爬取煎蛋网妹子图
Python:Selenium模拟浏览器抓取淘宝商品美食信息
使用Python进行网页抓取的介绍
爬虫入门——详解Python是如何进行网页抓取!
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券