如何在循环中使用Scrapy FormRequest

在循环中使用Scrapy的FormRequest可以通过以下步骤实现：

导入必要的模块：

import scrapy
from scrapy.http import FormRequest

创建一个Scrapy Spider类，并定义一个start_requests方法：

class MySpider(scrapy.Spider):
    name = 'my_spider'
    
    def start_requests(self):
        # 在这里定义循环的逻辑
        urls = ['http://www.example.com/page1', 'http://www.example.com/page2']
        for url in urls:
            yield scrapy.Request(url=url, callback=self.parse_page)

在start_requests方法中，使用yield关键字返回一个FormRequest对象，其中包含表单数据和回调函数：

class MySpider(scrapy.Spider):
    name = 'my_spider'
    
    def start_requests(self):
        # 在这里定义循环的逻辑
        urls = ['http://www.example.com/page1', 'http://www.example.com/page2']
        for url in urls:
            formdata = {
                'username': 'my_username',
                'password': 'my_password'
            }
            yield FormRequest(url=url, formdata=formdata, callback=self.parse_page)

定义回调函数parse_page来处理响应数据：

class MySpider(scrapy.Spider):
    name = 'my_spider'
    
    def start_requests(self):
        # 在这里定义循环的逻辑
        urls = ['http://www.example.com/page1', 'http://www.example.com/page2']
        for url in urls:
            formdata = {
                'username': 'my_username',
                'password': 'my_password'
            }
            yield FormRequest(url=url, formdata=formdata, callback=self.parse_page)
    
    def parse_page(self, response):
        # 在这里处理响应数据
        # 可以使用response.xpath或response.css来提取数据
        pass

通过以上步骤，你可以在循环中使用Scrapy的FormRequest来发送POST请求，并在回调函数中处理响应数据。请注意，这只是一个基本的示例，实际应用中可能需要根据具体情况进行适当的修改和调整。

腾讯云相关产品和产品介绍链接地址：

从当前脚本中添加擦伤中间件

、、

我已经在一个python脚本中安装了我的抓取爬虫：import csvfrom scrapy.http import FormRequest test = scrapy.Field()

浏览 1提问于2016-03-04得票数 2

回答已采纳

1回答

在scrapy shell中呈现JS内容的FormRequest

、

我正在尝试从这个page中抓取以下表单数据的内容：我需要将County:设置为George's，并将DateOfFilingFrom设置为01-01-2000，因此我执行以下操作： % scrapyshell In [1]: from scrapy.http import FormRequestIn [4]: 但是它不工作(响应是无)另外，下一个页面看起来像下面的动态加载，我需要知道如何能够访问下面显示的每个链接与以下检查(据我所知，这可能是使用Splash完成的，但是，我不确定如<e

浏览 24提问于2020-08-24得票数 1

回答已采纳

2回答

重复的请求发布到scrapy FormRequest

、、

我正在尝试学习如何在网站上抓取FormRequest的工作方式，我有以下抓取代码：import json payload = {'api_code': 'C123456'} yield scrapy

浏览 1提问于2019-08-12得票数 3

1回答

我们到底应该通过什么回应，而要求在邮件在刮刮？

、、

scrapy shell中的代码，我可以登录堆栈溢出。因此，我试图在子进程中使用上面的命令登录。","fetch", req], shell=True) TypeError:类型为“FormRequest”的参数不可迭代因此，如何使用子进程登录到堆栈溢出来运行scrapy she

浏览 5提问于2020-10-13得票数 0

2回答

如何从已知的html id编写输入数据处理器？

、、

我想刮一下这个网页：请给出一个示例代码

浏览 2提问于2013-07-30得票数 1

回答已采纳

1回答

如何在循环中使用Scrapy FormRequest

、、、、

我正在尝试创建一个爬行器，它可以将列表中的单词逐个放入cite的搜索输入中，然后从结果页面中解析文本。 name = &#

浏览 31提问于2021-02-15得票数 0

1回答

用POST方法提出要求

、、

我正在尝试使用Scrapy从"“中抓取产品列表。import scrapy name = "intel_eg_eastasiaeg_com_py" start_

浏览 3提问于2016-08-18得票数 3

回答已采纳

1回答

如何处理元素状态更改后的ajax响应？

、、、

就是这里 return [FormRequest.from_response

浏览 4提问于2014-02-11得票数 0

1回答

当登录到具有隐藏令牌身份验证的论坛时，Scrapy >爬行循环

、

我正在学习如何使用Scrapy检索论坛页面并将其储存到我的服务器上。论坛使用基于隐藏令牌的身份验证。import scrapyfrom scrapy.http import FormRequest token = re

浏览 2提问于2020-06-23得票数 0

回答已采纳

2回答

Python :来自表单请求的400响应

、、、

我一直在努力刮网站 'ispreseason': '', }

浏览 0提问于2018-09-02得票数 5

2回答

将链接请求合并为一个

、、

问题是，使用刮伤链，它想要检查篮子的次数，就像我在篮子里有项目一样。 params = getShopList() yield scrapy.FormRequestmethod='POST', formdata=param) y

浏览 2提问于2018-06-11得票数 0

回答已采纳

1回答

csrf-token和登录Scrapy的问题

、、、

为此，我使用Scrapy库创建了一个简单的Python程序，但我不能完全确定它是否被正确开发，因为我不知道如何调试它(或者这是否可能)，现在我没有得到任何结果。目前，我的代码如下所示：from scrapy import FormRequest from scrapy.spiders import CrawlSpider, Rule产生了怀疑，我已经在自己的from_response中看到了使用csrf-token的解决方案，但我也尝试过，

浏览 2提问于2020-10-06得票数 1

1回答

刮伤登录身份验证不起作用

、、、

嗨，我在和scrapy一起登录一些随机的网站。我学习了关于刮痕的教程，但它似乎没有效果。当我尝试时，我注意到"isAuthenticated"：False。import scrapy from scrapy import Spider name = 'ivanaSpider' def start_requests(s

浏览 4提问于2016-07-01得票数 1

1回答

如何处理多个下拉式表单，这些表单用粗糙的FormRequest显示为灰色

、、、、

这是我到目前为止所做的，让我知道我做错了什么：from scrapy.selector import HtmlXPathSelectorfrom scrapy.contrib.loader import XPathItemLoaderfrom scrapy.http importFormRequest class gasBuddy(BaseSpi

浏览 0提问于2012-01-24得票数 0

回答已采纳

1回答

刮伤- AjaxMethod不可用

、、、、

我试图练习学习抓取网站爬行和使用一个分类的汽车网站为主题，以检查对策。我知道Developer方法的存在，因为工具显示正在传递的标头和正确的响应。但是当在Scrapy中完成时，我得到“这个方法要么没有用AjaxMethod标记，要么不可用。”下面是使用的shell命令：request=FormRequest(url='https:&

浏览 2提问于2017-04-18得票数 1

回答已采纳

1回答

Scrapy FormRequest.from_response()方法

、

Im正在尝试使用Scrapy解析页面，为了显示隐藏的文本和价格，我在字段中输入了任意的邮政编码或随机数字：对于回应url的价格，我尝试了y

浏览 0提问于2016-11-30得票数 3

1回答

使用来自同一URL的多个POST数据进行抓取

、、、、

然后我想从另一个网站抓取数据，使用CSV文件中的电话号码作为发布数据。我希望它循环通过相同的起始URL，但只是抓取每个电话号码产生的数据，直到CSV文件中没有更多的号码。这是我到目前为止所得到的：from scrapy.http import Requestfrom scrapy.sele

浏览 1提问于2013-07-17得票数 3

回答已采纳

2回答

刮擦和卡普查

、、

对于表单提交，我使用scrapy.FormRequest.from_reponse之后，我尝试使用ImagePipeline.但是我的问题是，返回项(下载图像)只在函数完成执行之后发生，即使我使用yeild。item['im

浏览 0提问于2015-01-14得票数 4

1回答

用jquery搜索抓取

、、

我试图使用产品编号从站点中提取一些信息。列出其中一些“5175788AA”、“82214506AB”、“UN051D1AA”。我试着在scrapy.FormRequest中爬行： yield scrapy.FormRequest.from_response如何使用scrapy.FormRequest运行搜索？或者如何模拟正在进行搜索的request？提

浏览 3提问于2022-10-05得票数 -1

1回答

响应对象是如何通过刮取刮板中的请求回调传递的？

、、

这是使用用户凭据处理身份验证和后续请求的方式。我不理解的是响应对象是如何在身份验证之后对下一个请求调用进行响应的。在下面的代码中，解析方法返回使用FormRequest方法进行身份验证时创建的结果对象。因为FormRequest有一个对after_login方法的回调，所以调用after_login方法时，来自FormRequest的响应作为第一个参数。我不明白的是，作为参数传递给after_login方法的响应是如何在产生结果之后发送给请求的。这是

浏览 3提问于2014-01-05得票数 1

回答已采纳

点击加载更多