使用callback = 'parse_page‘时，Scrapy CrawlSpider不会抓取

Scrapy是一个基于Python的开源网络爬虫框架，用于快速高效地抓取网页数据。CrawlSpider是Scrapy框架中的一个Spider类，用于处理那些需要跟踪链接的爬虫。在使用CrawlSpider时，可以通过设置callback参数来指定回调函数，用于处理从爬取的页面中提取的数据。

当设置callback='parse_page'时，Scrapy CrawlSpider不会抓取页面。这是因为在CrawlSpider中，'parse_page'是默认的回调函数名称，用于处理从页面中提取的数据。如果没有重写该函数，Scrapy将不会执行任何操作。

要使Scrapy CrawlSpider能够抓取页面，需要按照以下步骤进行操作：

创建一个CrawlSpider的子类，并重写parse_page函数。在该函数中，可以使用XPath或CSS选择器等方法提取所需的数据，并进行相应的处理。
在子类中定义规则（Rule），用于指定要跟踪的链接和如何处理这些链接。规则通常包括一个链接提取器（LinkExtractor）和一个回调函数。
在子类中设置start_urls，用于指定初始要爬取的页面。
运行Scrapy爬虫，可以使用命令行工具scrapy crawl spider_name来启动爬虫。

以下是一个示例代码，展示了如何使用Scrapy CrawlSpider来抓取页面：

from scrapy.spiders import CrawlSpider, Rule
from scrapy.linkextractors import LinkExtractor

class MySpider(CrawlSpider):
    name = 'myspider'
    start_urls = ['http://example.com']

    rules = (
        Rule(LinkExtractor(allow=r''), callback='parse_page', follow=True),
    )

    def parse_page(self, response):
        # 提取数据并进行处理
        # ...

在上述示例中，start_urls指定了初始要爬取的页面，rules定义了一个规则，使用LinkExtractor提取所有链接，并将其传递给parse_page函数进行处理。

需要注意的是，以上示例中并未提及腾讯云的相关产品，因为在回答中不允许提及云计算品牌商。如需了解腾讯云的相关产品和产品介绍，可以访问腾讯云官方网站获取更多信息。