如何正确使用Xpath来抓取scrapy中的AJAX数据？

文章/答案/技术大牛

发布

1回答

Scrapy响应将反斜杠设置为元素属性。

、、、、

我在Scrapy Shell中运行以下代码，使用POST请求刮取数据：fetch(request) 我知道在响应中有类"property-thumb"的元素，我通过使用Ch

浏览 1提问于2016-09-14得票数 3

回答已采纳

2回答

Scrapy:如何从<span>中提取属性值

查看Twitter: www.twitter.com/twitter当我在Chrome上检查这个跨度时，我使用： (//ul[@class='ProfileNav-list&#

浏览 0提问于2018-10-18得票数 1

回答已采纳

1回答

将数据输出到CSV时出现剪贴式格式问题。确保项目数据打印在单独的行上

、、、

我使用Scrapy从网站的第一页抓取信息，并将数据导出为.csv文件，如下所示：我想要获得form的输出： 'Link': [u'url'],{........... ...

浏览 1提问于2015-10-19得票数 0

1回答

、、、、

我正在抓取this website，我需要的大部分数据都是用Ajax呈现的。我一开始试着用Ruby (因为Ruby是我最了解的语言)来解决这个问题，但是没有成功。然后我被建议用Python和Scrapy来做这件事，我试过了，但我不明白为什么我无法获得数据。import scrapy name = &#x

浏览 17提问于2019-09-16得票数 0

回答已采纳

1回答

使用scrapy从无限滚动页面中抓取数据？

、、、

向下滚动时的响应url为： {"page_var":"<div id=\"page_variables................我的爬虫代码是： name = 'dummymart' allowed_domains('/&#x

浏览 0提问于2018-08-16得票数 0

1回答

如何从多个页面中抓取项目？

、

我正在尝试抓取#页的数据。我已经做了一个可以从一个页面抓取数据的抓取器。但它在刮掉第一页后突然完成了工作# -*- coding: utf-8 -*-import csvfrom scrapy.selector import Selector from scrapy imp

浏览 11提问于2019-11-07得票数 1

2回答

刮擦表列和行不起作用

、、

我想抓取这个页面的表，但是报废的数据只在一列中，在某些情况下数据不会出现。另外，我使用shell来查看Xpath是否正确(我使用Xpath助手来识别这些xpath)class ToScrapeSpiderXPath(scrapy.Spider):name = 'scrape-xpa

浏览 1提问于2017-10-26得票数 1

回答已采纳

1回答

关于XPath选择器的问题(用于Scrapy)

、、、

目的:从div类list_area daily_all中抓取文本数据。使用scrapy shell，我首先“抓取”了我想要抓取数据的网站：https://comic.naver.com/webtoon/weekday.nhn 使用'scrapy shell‘脚本：scrapyshell 'https://

浏览 18提问于2019-06-10得票数 2

1回答

使scrapy递归地移动到下一页

、

我正在尝试使用scrapy抓取。我可以成功地抓取页面上的数据，但我也希望能够从其他页面抓取数据。(说下一步的)。以下是我的代码的相关部分： item = TimemagItem() item['title']= response.xpath('//div[@cla

浏览 1提问于2014-11-01得票数 3

2回答

如何使用Python从高图表中抓取数据

、、、、

我正试图从的图表中抓取数据。我试着使用框中数据的各自xpath访问数据，但它似乎不起作用。我试过使用Scrapy：market_valu

浏览 10提问于2022-09-05得票数 0

2回答

抓取需要使用cookie的网站

、、、、

我正在制作抓取网站的scrapy，但这个网站使用的是cookies，我不知道如何使用cookies来制作抓取网站数据的指令 name = "dmozitems = [] item = Website() item['n

浏览 2提问于2014-04-24得票数 0

2回答

为什么我不能在Scrapy中解析响应？

我是新的抓取和使用它从拉扎达网站刮数据。我得到了200条HTTP消息，这意味着响应将成功返回。但是我不能解析响应，尽管xpath查询是正确的。有谁可以帮我？谢谢。这是代码：name = 'lazada' allowed_domains = ['lazada.com.myq=books/'

浏览 19提问于2020-10-28得票数 0

1回答

抓取文章链接，然后抓取链接以获取文章作者

、、

所以我使用scrapy--> 抓取了这个链接 name = "japan" allowe

浏览 4提问于2020-09-08得票数 1

2回答

外壳和蜘蛛中的Scrapy处理ajax连续响应数据

、、、、

我正在尝试在ajax请求之后抓取加载的数据。fetch(url) ...b

浏览 1提问于2015-10-24得票数 1

1回答

如何从使用AJAX和JavaScript的网站中刮取数据？

如果网站使用AJAX和JavaScript加载内容，则可能很难从站点中抓取数据。数据可以动态生成并存储在JavaScript变量中，使web刮刀无法访问数据。

浏览 7提问于2022-05-11得票数 0

1回答

使用Scrapy* (python)抓取表数据*

、、

我正在做一个项目，它涉及到使用Scrapy从网站上抓取数据。之前我们使用Selenium，但现在我们必须使用Scrapy。我没有任何关于Scrapy的知识，但现在正在学习它。其中一个挑战是从网站上删除数据，这些数据是在表格中结构化的，虽然有下载这些数据的链接，但在我的情况下是行不通的。下面是表

浏览 2提问于2018-10-30得票数 0

1回答

无法使用Scrapy从网页加载和刮取数据

、、

我试图使用Python中的Scrapy框架从中抓取数据，但是当我在并尝试学习如何提取数据，使用或我总能得到空名单。然后，当我在的shell中获取和查看响应时，我会得到

浏览 1提问于2018-07-29得票数 0

回答已采纳

2回答

python Scrapy中的Xpath选择器

、、、

现在我正在学习如何结合使用Xpath和python Scrapy来抓取网站。现在，我被困在以下几个方面：因此，最终我需要一个csv文件，其中包含所有这些面包文章的名称。如果我检查元素，我可以看到这些名称是在哪里定义的：我需要找到正确的XPath来提取"AH Tijgerbrood b

浏览 1提问于2015-08-06得票数 0

2回答

使用刮取数据后将数据导出到csv

、、

使这个刮刀能够正确地抓取数据，但问题是如何将它导出到csv。默认的- o filname.csv不按正确的顺序粘贴数据。需要一些指导来做it.The项目‘名称’应该在第一列和项目‘链接’在第二栏。# -*- coding: utf-8 -*-from scrapy.linkextractors import LinkExtractor from scrapy</

浏览 1提问于2019-10-23得票数 0

1回答

如何在scrapy中提取相对于单行的多行数据

、

我正在尝试抓取此链接中给出的网页- 单个url的其余数据将是单一的，但菜单中的项目将始终具有不同的数量。下面是我到

浏览 23提问于2017-03-09得票数 0

回答已采纳

点击加载更多

Scrapy响应将反斜杠设置为元素属性。

Scrapy:如何从<span>中提取属性值

将数据输出到CSV时出现剪贴式格式问题。确保项目数据打印在单独的行上