腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
Scrapy
响应将反斜杠设置为元素属性。
、
、
、
、
我在
Scrapy
Shell
中
运行以下代码,
使用
POST请求刮取
数据
:fetch(request) 我知道在响应中有类"property-thumb"
的
元素,我通过
使用
Ch
浏览 1
提问于2016-09-14
得票数 3
回答已采纳
2
回答
Scrapy
:
如何
从<span>中提取属性值
查看Twitter: www.twitter.com/twitter当我在Chrome上检查这个跨度时,我
使用
: (//ul[@class='ProfileNav-list
浏览 0
提问于2018-10-18
得票数 1
回答已采纳
1
回答
将
数据
输出到CSV时出现剪贴式格式问题。确保项目
数据
打印在单独
的
行上
、
、
、
我
使用
Scrapy
从网站
的
第一页
抓取
信息,并将
数据
导出为.csv文件,如下所示:我想要获得form
的
输出: 'Link': [u'url'],{........... ...
浏览 1
提问于2015-10-19
得票数 0
1
回答
如何
正确
使用
Xpath
来
抓取
scrapy
中
的
AJAX
数据
?
、
、
、
、
我正在
抓取
this website,我需要
的
大部分
数据
都是用
Ajax
呈现
的
。 我一开始试着用Ruby (因为Ruby是我最了解
的
语言)
来
解决这个问题,但是没有成功。然后我被建议用Python和
Scrapy
来
做这件事,我试过了,但我不明白为什么我无法获得
数据
。import
scrapy
name =
浏览 17
提问于2019-09-16
得票数 0
回答已采纳
1
回答
使用
scrapy
从无限滚动页面
中
抓取
数据
?
、
、
、
向下滚动时
的
响应url为: {"page_var":"<div id=\"page_variables................我
的
爬虫代码是: name = 'dummymart' allowed_domains('/
浏览 0
提问于2018-08-16
得票数 0
1
回答
如何
从多个页面
中
抓取
项目?
、
我正在尝试
抓取
#页
的
数据
。我已经做了一个可以从一个页面
抓取
数据
的
抓取
器。但它在刮掉第一页后突然完成了工作# -*- coding: utf-8 -*-import csvfrom
scrapy
.selector import Selector from
scrapy
imp
浏览 11
提问于2019-11-07
得票数 1
2
回答
刮擦表列和行不起作用
、
、
我想
抓取
这个页面的表,但是报废
的
数据
只在一列
中
,在某些情况下
数据
不会出现。另外,我
使用
shell
来
查看
Xpath
是否
正确
(我
使用
Xpath
助手
来
识别这些
xpath
)class ToScrapeSpiderXPath(
scrapy
.Spider):name = 'scrape-
xpa
浏览 1
提问于2017-10-26
得票数 1
回答已采纳
1
回答
关于
XPath
选择器
的
问题(用于
Scrapy
)
、
、
、
目的:从div类list_area daily_all
中
抓取
文本
数据
。
使用
scrapy
shell,我首先“
抓取
”了我想要
抓取
数据
的
网站:https://comic.naver.com/webtoon/weekday.nhn
使用
'
scrapy
shell‘脚本:
scrapy
shell 'https://
浏览 18
提问于2019-06-10
得票数 2
1
回答
使
scrapy
递归地移动到下一页
、
我正在尝试
使用
scrapy
抓取
。我可以成功地
抓取
页面上
的
数据
,但我也希望能够从其他页面
抓取
数据
。(说下一步
的
)。以下是我
的
代码
的
相关部分: item = TimemagItem() item['title']= response.
xpath
('//div[@cla
浏览 1
提问于2014-11-01
得票数 3
2
回答
如何
使用
Python从高图表
中
抓取
数据
、
、
、
、
我正试图从
的
图表
中
抓取
数据
。我试着
使用
框
中
数据
的
各自
xpath
访问
数据
,但它似乎不起作用。我试过
使用
Scrapy
:market_valu
浏览 10
提问于2022-09-05
得票数 0
2
回答
抓取
需要
使用
cookie
的
网站
、
、
、
、
我正在制作
抓取
网站
的
scrapy
,但这个网站
使用
的
是cookies,我不知道
如何
使用
cookies
来
制作
抓取
网站
数据
的
指令 name = "dmozitems = [] item = Website() item['n
浏览 2
提问于2014-04-24
得票数 0
2
回答
为什么我不能在
Scrapy
中
解析响应?
我是新
的
抓取
和
使用
它从拉扎达网站刮
数据
。我得到了200条HTTP消息,这意味着响应将成功返回。但是我不能解析响应,尽管
xpath
查询是
正确
的
。有谁可以帮我?谢谢。这是代码:name = 'lazada' allowed_domains = ['lazada.com.myq=books/'
浏览 19
提问于2020-10-28
得票数 0
1
回答
抓取
文章链接,然后
抓取
链接以获取文章作者
、
、
所以我
使用
scrapy
-->
抓取
了这个链接 name = "japan" allowe
浏览 4
提问于2020-09-08
得票数 1
2
回答
外壳和蜘蛛
中
的
Scrapy
处理
ajax
连续响应
数据
、
、
、
、
我正在尝试在
ajax
请求之后
抓取
加载
的
数据
。fetch(url) ...b
浏览 1
提问于2015-10-24
得票数 1
1
回答
如何
从
使用
AJAX
和JavaScript
的
网站
中
刮取
数据
?
如果网站
使用
AJAX
和JavaScript加载内容,则可能很难从站点中
抓取
数据
。
数据
可以动态生成并存储在JavaScript变量
中
,使web刮刀无法访问
数据
。
浏览 7
提问于2022-05-11
得票数 0
1
回答
使用
Scrapy
(python)
抓取
表
数据
、
、
我正在做一个项目,它涉及到
使用
Scrapy
从网站上
抓取
数据
。之前我们
使用
Selenium,但现在我们必须
使用
Scrapy
。我没有任何关于
Scrapy
的
知识,但现在正在学习它。其中一个挑战是从网站上删除
数据
,这些
数据
是在表格
中
结构化
的
,虽然有下载这些
数据
的
链接,但在我
的
情况下是行不通
的
。下面是表
浏览 2
提问于2018-10-30
得票数 0
1
回答
无法
使用
Scrapy
从网页加载和刮取
数据
、
、
我试图
使用
Python
中
的
Scrapy
框架从中
抓取
数据
,但是当我在并尝试学习
如何
提取
数据
,
使用
或我总能得到空名单。然后,当我在
的
shell
中
获取和查看响应时,我会得到
浏览 1
提问于2018-07-29
得票数 0
回答已采纳
2
回答
python
Scrapy
中
的
Xpath
选择器
、
、
、
现在我正在学习
如何
结合
使用
Xpath
和python
Scrapy
来
抓取
网站。现在,我被困在以下几个方面:因此,最终我需要一个csv文件,其中包含所有这些面包文章
的
名称。如果我检查元素,我可以看到这些名称是在哪里定义
的
:我需要找到
正确
的
XPath
来
提取"AH Tijgerbrood b
浏览 1
提问于2015-08-06
得票数 0
2
回答
使用
刮取
数据
后将
数据
导出到csv
、
、
使这个刮刀能够
正确
地
抓取
数据
,但问题是
如何
将它导出到csv。默认
的
- o filname.csv不按
正确
的
顺序粘贴
数据
。需要一些指导
来
做it.The项目‘名称’应该在第一列和项目‘链接’在第二栏。# -*- coding: utf-8 -*-from
scrapy
.linkextractors import LinkExtractor from
scrapy</
浏览 1
提问于2019-10-23
得票数 0
1
回答
如何
在
scrapy
中提取相对于单行
的
多行
数据
、
我正在尝试
抓取
此链接
中
给出
的
网页- 单个url
的
其余
数据
将是单一
的
,但菜单
中
的
项目将始终具有不同
的
数量。下面是我到
浏览 23
提问于2017-03-09
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
云直播
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券