腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(156)
视频
沙龙
1
回答
Scrapy
:“”
NoneType
“”
对象
没有
属性
“”
AttributeError
“”-
Scrapy
不会
爬
网
所有
元素
、
、
我的蜘蛛
不会
爬行
所有
的
元素
。 正如我现在所看到的,其中一个错误是
属性
错误,我不知道如何修复它。这是一个非英语网站,我希望它的数字变成
没有
"%“和",”的英文数字。但现在,问题是条带:'
NoneType
‘
对象
没有
’
AttributeError
‘
属性
这是我得到的日志: 2020-09-01 16:23:53 [
scrapy
.utils.log] INFO:
Scr
浏览 54
提问于2020-09-01
得票数 0
回答已采纳
2
回答
如何使用请求库从基本url爬行到
scrapy
中的另一个url。
、
import
scrapy
from
scrapy
.contrib.spiders import CrawlSpiderfrom
scrapy
.http import Request class NextlinkSpider(
scrapy
.Spideryield Request(url='https:/
浏览 0
提问于2017-11-21
得票数 4
1
回答
Scrapy
AttributeError
:'
NoneType
‘
对象
没有
属性
'css’
、
、
我正在尝试使用
Scrapy
:链接从这个页面中抓取细节response.css('#intitule > div.nom_fugitif::text').extract_first() 它说div
没有
C
浏览 1
提问于2017-11-01
得票数 0
3
回答
“
属性
错误:
NoneType
对象
没有
属性
'module_name'”
、
、
、
我试图使用
scrapy
将我的爬虫项目部署到一个scrapyd实例中,但是调用这个推荐返回以下错误: from setuptools import setup, find_packages'mycrawler
浏览 2
提问于2013-01-31
得票数 2
5
回答
如何在
scrapy
spider中传递用户定义的参数
、
、
我试图将用户定义的参数传递给
scrapy
的爬行器。有谁能建议一下如何做到这一点吗? 我在某处读到过一个参数-a,但不知道如何使用它。
浏览 7
提问于2013-03-25
得票数 121
回答已采纳
1
回答
刮伤壳无响应返回
、
、
、
所以,我试过:但是,我
没有
网站的回应。Shell help (print this help)如果我用:一个
AttributeError
---------------------------------------------------------------------------
浏览 3
提问于2017-05-15
得票数 5
回答已采纳
1
回答
刮破的蜘蛛不能陷入不和谐
、
我试图制造一个不和谐的刮刀来获取服务器的
所有
成员,但是我被卡在登录上了,但是我在页面的源代码中任何地方都找不到csrf令牌--也许这就是我得到这个错误的原因,因为有几个消息来源说它是必需的,但我不确定,这是我的蜘蛛造成问题的原因 name = "Recruteururls = [ 'https://discord.com
浏览 0
提问于2021-11-08
得票数 0
1
回答
AttributeError
:“bytes”
对象
没有
属性
“get”
、
、
我正在尝试从https://www.gizbot.com/mobile-brands-in-india/中提取
所有
的品牌名称。以下是mobiles_spiders.py文件的代码 class MobilesSpider(
scrapy
.Spider):
浏览 15
提问于2020-07-11
得票数 0
回答已采纳
5
回答
使用Visual Studio进行抓取调试
、
、
我是
Scrapy
和Python的新手,我很喜欢它。 可以使用Visual Studio调试
scrapy
项目吗?如果可能,如何实现?
浏览 0
提问于2014-07-21
得票数 4
1
回答
递归刮取过程中的
属性
错误
、
、
现在我不想给它
所有
的类别,而是包含链接到
所有
类别的页面。我想我可以简单地添加另一个解析函数来实现这一点。 这告诉我,
没有
正常工作。我是面向
对象
的新手,但我认为scarpy是在调用解析,后者调用prase_level2,然后调用parse_details,这
浏览 6
提问于2017-11-19
得票数 0
回答已采纳
2
回答
在脚本中运行
scrapy
X小时?
、
有
没有
办法将
scrapy
作为bash脚本的一部分运行,并且只运行一定的时间?也许可以在X小时后模拟Ctrl-C + Ctrl-C?
浏览 0
提问于2016-11-25
得票数 1
5
回答
在脚本文件函数中获取
Scrapy
crawler输出/结果
、
、
、
、
我使用脚本文件在
scrapy
项目中运行爬行器,并且爬行器记录爬虫的输出/结果。但是我想在脚本文件中使用爬行器输出/结果,在某些函数中,.I不想将输出/结果保存在任何文件或DB中。下面是从获取的脚本代码from
scrapy
.crawler import CrawlerRunnerfrom
scrapy
.utils.projec
浏览 3
提问于2016-10-25
得票数 12
9
回答
BeautifulSoup和
Scrapy
crawler有什么区别?
、
、
、
我对BeautifulSoup比较熟悉,但对
Scrapy
crawler不太熟悉。
浏览 323
提问于2013-10-30
得票数 146
回答已采纳
1
回答
查找链接的XPath表达式提供"TypeError: Request必须是str或unicode,got“
、
、
__name__)我试图寻找类似的问题,但
没有
得到答案,为什么刮刮给我这个错误。这是我的蜘蛛from lawn.items import LawnItemimport re item['state'] = state
浏览 1
提问于2019-11-27
得票数 0
回答已采纳
1
回答
刮除:从2个级别中刮出多个项目
、
目前,我的代码如下所示:from tutorial.items import IMDB_dict # We need this so that Python knows aboutthe item object name = "mppaddresses" # The name of this spider= response.urljoin(url) print("FOOOOOOOOOnd URL:
浏览 0
提问于2018-09-05
得票数 0
回答已采纳
3
回答
如何使用xpath找到需要的单词?
、
我用抓取来爬行一个网站,但我不知道如何解析和找到单词。以下是网站,我想找到“你好,我在这里”。//div[@class='sort_left']/p/strong/a/href/text()<div class="sort hottest_dishes1"> <li class="current"><a href="/list_rest.php?a=75&s
浏览 3
提问于2014-12-19
得票数 0
1
回答
我如何从pipelines.py中获得一个刮伤参数的值?
、
您可以看到我前面关于这个主题的文章:现在我不关心怎么做的方法。from
浏览 1
提问于2019-08-16
得票数 0
5
回答
从python列表中的多个字符串项中删除空格
、
、
、
、
我使用以下代码进行了尝试:#
AttributeError
: '
NoneType
' object has noattribute 'strip' #
AttributeError
浏览 18
提问于2022-03-30
得票数 -1
回答已采纳
2
回答
如何使用extract_links()从由“gb2312”编码的网页中获取url
、
、
编解码器无法解码39号位置的字节0xcc :无效的连续字节 打印response.body.decode('gb2312')它可以打印
所有
htmlle.extract_links(response.body.decode('gb2312')), File
浏览 0
提问于2018-08-16
得票数 1
回答已采纳
6
回答
以空集为初始值的reduce
我有一个列表列表,我想从
所有
子列表中存在的
元素
中构造一个集合。示例:a = [[1,2],[2,3]]应提供set([1,2,3])有人能告诉我如何使用reduce函数来做这件事吗?
浏览 0
提问于2011-11-30
得票数 8
回答已采纳
点击加载更多
相关
资讯
Scrapy向导
Python数据科学实战系列之Web信息爬取
爬虫框架Scrapy的第一个爬虫示例入门教程
Spider源码解析-Scrapy框架实战
教你分分钟学会用python爬虫框架Scrapy爬取心目中的女神
热门
标签
更多标签
云服务器
ICP备案
实时音视频
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券