我正在编写python来使用Twitter-py抓取Twitter空间。我将爬虫设置为在每个对api.twitter.com的请求之间休眠一段时间(2秒)。然而,在运行了一些时间(大约1)之后,当Twitter的速率限制还没有超过时,我得到了这个错误。
[Errno 10054] An existing connection was forcibly closed by the remote host.
导致此问题的可能原因是什么?如何解决此问题?
我搜索了一遍,发现Twitter服务器本身可能会因为许多请求而强制关闭连接。
非常提前感谢您。
我正在学习爬虫,在一些基本的爬虫之后,我尝试从github下载谷歌学者爬虫大师,看看它是如何运行的,在几个我可以修复的错误之后,我遇到了一个ModuleNotFoundError: No module named 'proxy'错误(middleware.py文件,from proxy import PROXIES行是问题)。
这段代码有一些问题,其中包含python 3.x版本中不再支持/建议的解决方案,包括后来被重命名/移动的模块,但我无法确定这是否也是这种情况,希望能得到帮助。