使用Scrapy选择表的行

、、

我知道这是一个很大的要求，但我想知道是否有人可以帮助我选择一个项目使用scrapy？古斯

浏览 11提问于2020-03-15得票数 0

回答已采纳

1回答

发出创建正确的CSS选择器

、、、

我正在努力废除，特别是，我试图访问每一行中都有信息的表行，如下图中高亮显示的绿色。我不需要表标题，只需要行。response.css('.datadisplaytable .datadisplaytable') 我使用.datadisplaytable两次，因为我试图选

浏览 7提问于2017-07-27得票数 0

回答已采纳

1回答

为什么我不能使用scrapy选择亚马逊页面中的某些元素？

、、、、

但是，我无法从scrapy响应中选择包含ASIN的表。如何选择表以便解析表中的数据？import scrapy name= 'amazon.com'

浏览 2提问于2018-09-26得票数 1

1回答

使用Scrapy遍历表行

、

是否有可能扫描表格中的一行并仅改变列，以获得一系列数字。我目前使用了很多变量。html/body/div/table/tr[6]/td[counter in range 2 - 9]/p/span/text()').extract()class MainSpider(scrapy.Spider

浏览 1提问于2019-11-04得票数 2

1回答

Scrapy + PostgreSQL -自定义ETL的自动项目和管道(截断>插入>插入>删除)

、、、

我目前的程序包括：- Current Pipeline:理想情况下，我希望使用</em

浏览 6提问于2020-01-06得票数 1

回答已采纳

1回答

Scrapy :使用'role‘选择表格行

、

 我正在尝试选择一个表行，它看起来像(也是屏幕截图)：Out[2]: []Out[

浏览 12提问于2017-07-08得票数 0

1回答

scrapy上的多个蜘蛛

、、

我用姜戈，芹菜，scrapy。import CrawlerProcessfrom scrapy_parser.scrapy_parser.spiders.map_linksimport MapLinksSpiderfrom thread

浏览 0提问于2018-06-21得票数 0

2回答

抓取多个表，并将每个表头存储为csv中的行

、、

我正在尝试抓取多个表，这些表的表名都存储在h3标记下。有一些数据列我可以抓取，没有问题，当我提供下一个url时，我可以将这些数据附加到csv文件中。我不能解决的问题是获取表头并将其相对于表的每一行进行存储。这样做的原因是，当下一个表被输入时，我需要知道它属于哪个表。是否可以使用len循环来建立表的长度，然后将表头写到每一行？可以

浏览 0提问于2017-11-16得票数 0

2回答

试图解析一个刮伤的python for循环

结构如下 response.css("div.trk-cell.title a").xpath("@href").extract()resource.xpath("//div[@class='trk-cell title']/a/@href").get()response.css("div.trk-cell.artistsimport scr

浏览 6提问于2021-12-29得票数 0

回答已采纳

1回答

为什么Scrapy没有返回完整的HTML代码？

、

我正在尝试将我的selenium web刮刀转换为scrapy，因为selenium并不是主要用于web抓取。from scrapy.crawler import CrawlerProcessmin_price = "65000" c

浏览 30提问于2020-06-04得票数 0

回答已采纳

2回答

刮擦地传递参数和写入MySQL

、、

thelist表是一个实体列表--业务、博客、场所等--我已经为这些实体刮过目录站点(使用机械化、BeautifulSoup和regex)。数据表中的行id是"thelist_id“，它是返回到thelist表的外键。现在，我想使用蜘蛛到每个实体的自己的网站和刮电子邮件。我计划使用python脚本从"thelist“中选择一个实体，并使用os

浏览 5提问于2015-10-19得票数 1

回答已采纳

1回答

尝试使用Scrapy获取表行

、

 我有一些看起来像截图的html。我想弄到桌子的行。cellspacing="0"'>Out[6]: []Out[7]: [] 为什么我不能选择

浏览 3提问于2016-10-19得票数 3

回答已采纳

3回答

从scrapy.selector导入选择器错误

、、、、

我无法执行以下操作：错误是：这就好像我的机器上没有安装LXML，但它确实安装了。另外，我认为这是scrapy内置的默认模块。也许不是？

浏览 0提问于2013-10-17得票数 5

回答已采纳

1回答

从网站上抓取桌子时遇到的问题？

、、、、

虽然我匹配xpath并发现了表的字段，但我无法从站点中提取任何内容，这就是我的蜘蛛的样子：import scrapy name = "table1" 'wesite.comsite.xpath('td[2]

浏览 1提问于2016-10-27得票数 1

回答已采纳

3回答

Scrapy cmdline.execute停止脚本

、

当我打电话的时候print "Hello World" 它在cmdline.execute之后停止脚本，并且不运行脚本的其余部分并打印"Hello World“。

浏览 0提问于2014-07-22得票数 3

1回答

Scrapy <TD>解析对齐的麻烦

、、、

我尝试只解析html表中item和Skill Cap列的数据：http://ffxi.allakhazam.com/dyn/guilds/Alchemy.html 在解析时，我遇到了对齐问题，因为我的脚本是从其他列解析的import scrapy name = "recipe_table" start_urls = ['http:&#

浏览 22提问于2019-05-10得票数 0

回答已采纳

2回答

scrapy RuntimeError:要使用XPath或CSS选择器，需要用选择器实例化ItemLoader

、、、

我有一个ProductItemlLoader，它只是一个简单的ItemlLoader，它加载到一个带有offer_type字段的简单ProductItem中我运行以下代码： il = ProductItemLoader

浏览 59提问于2020-09-19得票数 0

1回答

刮擦的剧作家不会通过刮擦发送下一个请求。

、

我有下面的例子import scrapy_playwrightfromscrapy_playwright.handler import Page, PageMethod name =from second parse next") def parse_

浏览 16提问于2022-11-03得票数 -1

1回答

刮刮维基百科:产量并不能显示所有行

我正试图从以下页面获得GDP估计数(根据IMF)：def parse(self, response): for country in title//td[3]/text()").get()} 另一方面，我可以使用getall()方法来获取所有数据，但是当我将所有数据点导出到CSV/XLSX时

浏览 1提问于2022-09-28得票数 0

回答已采纳

8回答

如何使用PyCharm调试Scrapy项目

、、、、

我正在使用Python 2.7开发Scrapy 0.20。我发现PyCharm有一个很好的Python调试器。我想用它来测试我的抓取蜘蛛。有谁知道怎么做吗？我尝试过的东西File->Setting->Project structure->Add content root.

浏览 119提问于2014-02-15得票数 107

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

发出创建正确的CSS选择器

为什么我不能使用scrapy选择亚马逊页面中的某些元素？

使用Scrapy遍历表行

Scrapy + PostgreSQL -自定义ETL的自动项目和管道(截断>插入>插入>删除)

Scrapy :使用'role‘选择表格行

scrapy上的多个蜘蛛

抓取多个表，并将每个表头存储为csv中的行

试图解析一个刮伤的python for循环

为什么Scrapy没有返回完整的HTML代码？

刮擦地传递参数和写入MySQL

尝试使用Scrapy获取表行

从scrapy.selector导入选择器错误

从网站上抓取桌子时遇到的问题？

Scrapy cmdline.execute停止脚本

Scrapy <TD>解析对齐的麻烦

scrapy RuntimeError:要使用XPath或CSS选择器，需要用选择器实例化ItemLoader

刮擦的剧作家不会通过刮擦发送下一个请求。

刮刮维基百科:产量并不能显示所有行

如何使用PyCharm调试Scrapy项目

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐