腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(3049)
视频
沙龙
2
回答
Scrapy
shell
无法
抓取
网页
、
、
我正在尝试使用
Scrapy
shell
来尝试找出zone-h.org的选择器。我运行
scrapy
shell
'webpage'之后,我试图查看内容,以确保它是下载的。
浏览 23
提问于2018-12-31
得票数 1
回答已采纳
1
回答
找不到命令'
scrapy
‘
、
、
、
、
我正在尝试安装,这样我就可以写一个python程序来
抓取
网页
,但我甚至还不能这样做,因为我需要
抓取
设置,所以我一直试图在我的
shell
中输入以下命令:"
scrapy
startproject
scrapy
_javascript“,但得到以下错误:"command '
scrapy
‘not found”…我不知道哪里出了问题。我也在我下载的
scrapy
文件夹中。 📷
浏览 23
提问于2019-05-09
得票数 1
回答已采纳
1
回答
如何使用
Scrapy
自动获取请求头?
、
然后可以将这些标头添加到
Scrapy
请求中。 但是,有没有一种方法可以使用
Scrapy
请求自动获取这些请求头,而不是手动获取?
浏览 50
提问于2021-05-21
得票数 0
回答已采纳
3
回答
scrapy
shell
无法
打开长链接
、
我要
抓取
的网址是:>>> response.css("title")现在有趣的是,有时它会正确地加载相同的命令集
浏览 0
提问于2016-09-27
得票数 0
1
回答
对于一些具有刮伤外壳的元素,XPath不返回结果。
、
、
我使用刮除外壳来提取以下
网页
的数据: fetch('https://www.apo-in.de/product/acc-akut-600-brausetabletten.24170.html') >>> response.xpath"accordionContent5e95408f73b10"]/di
浏览 4
提问于2020-04-14
得票数 0
回答已采纳
1
回答
关于XPath选择器的问题(用于
Scrapy
)
、
、
、
目的:从div类list_area daily_all中
抓取
文本数据。使用
scrapy
shell
,我首先“
抓取
”了我想要
抓取
数据的网站:https://comic.naver.com/webtoon/weekday.nhn 使用'
scrapy
shell
‘脚本:
scrapy
shell
'https://comic.naver.com/webto
浏览 18
提问于2019-06-10
得票数 2
1
回答
抓取
器正在获取相关链接。
、
我已经创建了一个使用
scrapy
.The爬虫爬虫的网站和
抓取
链接。**所使用的技术:**Python,
Scrapy
Error
抓取
相对urls,因为刮刀器
无法
抓取
网页
。我要爬虫只取无源网址。import
scrapy
class MySpider(
scrapy
.Spider): # this is
浏览 2
提问于2021-06-29
得票数 1
2
回答
遇到问题的脚本(选择链接)
、
、
、
我正在使用
Scrapy
,在使用脚本时遇到了问题。它可以很好地与
shell
配合使用:<a data-urltype="/view" data-mce-href="http:/
浏览 10
提问于2019-10-23
得票数 0
回答已采纳
2
回答
菜鸟:如何克服Javascript "onclick“按钮来
抓取
网页
?
、
、
这是我想要
抓取
的链接:有一个按钮,我必须按下才能阅读
网页
上的基金信息。如果不是,视图就会被阻塞,使用
scrapy
shell
总是会导致空[]。none";ShowDropDown(); 如何克服这个onclick="AgreeClick()“
浏览 0
提问于2013-05-07
得票数 9
回答已采纳
1
回答
Scrapy
screenshot
网页
从png到webp,不保存渲染的图像
、
抓取
Scrapy
屏幕截图
网页
,并在飞行中转换image.png到image.webp。图像占用大量内存,
scrapy
返回.png文件。我
抓取
了很多
网页
,所以我需要将其转换为image.webp,以减少磁盘消耗。
浏览 28
提问于2021-03-03
得票数 0
1
回答
动态内容
抓取
、
、
我们可以使用
Scrapy
从由Javascript加载的
网页
中获取内容吗?我正在尝试从页面中
抓取
使用示例,但是由于它们是使用Javascript作为JSON对象加载的,所以我
无法
使用
Scrapy
获取它们。 你能提出什么是处理这些问题的最佳方法吗?
浏览 5
提问于2016-11-22
得票数 0
回答已采纳
1
回答
无法
使用
Scrapy
从下拉列表中进行
抓取
、
、
、
我正在尝试从网站上嵌入的JS下拉列表中
抓取
市场列表:https://e27.co/startups 使用
scrapy
shell
,我试图从“markets”下拉菜单中
抓取
市场列表,但
无法
这样做。在运行了
scrapy
shell
'https://e27.co/startups'之后,我尝试了同时使用response.css()和response.xpath()。我可以知道如何从下拉列表中<e
浏览 9
提问于2019-06-13
得票数 0
回答已采纳
2
回答
Xpath选择器在
Scrapy
中不起作用
、
., "Full Name")]/span/text()我已经在Google Chrome的控制台上对它进行了测试(可以工作),就像Xpath的许多其他变体一样,但我
无法
让它与
Scrapy
编辑:为了更清楚起见,下面是代码的其余部分:from votesmart.items import LegislatorsItems
浏览 0
提问于2016-09-12
得票数 2
1
回答
使用
scrapy
splash对
抓取
速度有显著影响吗?
、
、
、
、
到目前为止,我一直在使用
scrapy
和编写自定义类来处理使用ajax的网站。但是,如果我使用
scrapy
-splash,据我所知,它会在javascript之后
抓取
呈现的html,爬虫的速度会受到严重影响吗?使用
scrapy
抓取
一个普通的html页面所需的时间与使用
scrapy
-splash
抓取
javascript渲染的html所需的时间进行了怎样的比较?最后,
scrapy
splash和Selenium的比较如何?
浏览 3
提问于2018-04-18
得票数 12
回答已采纳
1
回答
在ubuntu精确服务器重新启动后
无法
连接mongodb
、
、
、
我正在Ubuntu服务器上开发一个25 am硬盘空间的web
抓取
项目。我正在使用python
scrapy
和mongodb。 因此,我删除了存储在/var/lib/mongodb中的所有数据,并从
shell
运行"
浏览 1
提问于2013-07-25
得票数 1
1
回答
尝试使用Python的
Scrapy
包,但它总是在不应该返回的地方返回空值
、
、
、
、
--------------------------------------------------------------------- import os pg_num = pg_num.xpath("normalize-space(//div[@class='showing'pg =
scrapy
.Selector(text = html) pg
浏览 17
提问于2020-03-27
得票数 0
9
回答
BeautifulSoup和
Scrapy
crawler有什么区别?
、
、
、
我对BeautifulSoup比较熟悉,但对
Scrapy
crawler不太熟悉。
浏览 323
提问于2013-10-30
得票数 146
回答已采纳
1
回答
scrapy
shell
在添加第二个爬行器时不显示>>>
、
我使用以下命令创建了一个新的
scrapy
项目:在爬虫文件夹中,我正在创建我的
scrapy
类,它包含了
抓取
数据的所有逻辑。我正在使用
Scrapy
Shell
进行测试。 当我创建第一个爬虫时,
scrapy
shell
运行得很好。但在创建第二个爬虫时,
scrapy
shell
不起作用。使用以下命令调用
scrapy
s
浏览 2
提问于2020-04-08
得票数 1
1
回答
使用spalsh的
scrapy
javascript不会呈现页面
、
、
、
我想爬行,我跟随爬行,但是它没有呈现
网页
。我用这个: 诚挚的问候
浏览 0
提问于2020-12-12
得票数 0
回答已采纳
1
回答
在刮刮中处理XMLHttpRequest
、
、
我在
抓取
这类
网页
的表格: 当我尝试:
scrapy
shell
http://www.trulia.com/q_schools_in_district.php?
浏览 1
提问于2016-01-05
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
谈谈scrapy抓取豆瓣影评
网页视频抓取插件-免费网页视频抓取插件
scrapy抓取 高考派大学数据
Scrapy递归抓取简书用户信息
scrapy爬虫实战-国外soybase网站跨页面抓取
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券