Scrapy是一个基于Python的开源网络爬虫框架,用于从网页中提取数据。在使用Scrapy提取包含空格和连字符的类名的数据时,可以采用以下方法:
.example-class
。//*[contains(@class, 'example-class')]
。无论是使用CSS选择器还是XPath,都可以通过在Scrapy的Spider中编写相应的代码来实现数据的提取。以下是一个示例代码:
import scrapy
class MySpider(scrapy.Spider):
name = 'example'
start_urls = ['http://example.com']
def parse(self, response):
# 使用CSS选择器提取数据
data = response.css('.example-class::text').get()
print(data)
# 使用XPath提取数据
data = response.xpath('//*[contains(@class, "example-class")]/text()').get()
print(data)
在上述示例代码中,通过调用response对象的css()或xpath()方法,传入相应的选择器,即可提取包含空格和连字符的类名的数据。
关于Scrapy的更多详细信息和用法,请参考腾讯云的相关产品和文档:
领取专属 10元无门槛券
手把手带您无忧上云