首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >当网页包含在列表中时,‘'request’模块不能正确list网页

当网页包含在列表中时,‘'request’模块不能正确list网页
EN

Stack Overflow用户
提问于 2017-06-20 02:09:55
回答 1查看 12关注 0票数 0

我正在使用request模块查看单词列表中的项目是否是https://www.britannica.com上的文章。我当前的代码是:

代码语言:javascript
复制
import requests

words = ['no', 'yes', 'thermodynamics', 'london', 'Max-Factor', 'be']

for word in words:
    request = requests.head('https://www.britannica.com/topic/' + word.lower())
    if request.status_code == 200:
        print(">EXISTS")
        print('https://www.britannica.com/topic/' + word.lower())
        print("<")
    else:
        print(">DOESNT EXIST")
        print('https://www.britannica.com/topic/' + word.lower())
        print("<")

“‘Be”是唯一打印“EXIST”的字符串,但是“热力学”、“london”和“Max-Factor”也存在,并且程序打印“不存在”。如果我单独对热力学进行操作,它会正确地打印“EXISTS”。造成这种差异的原因和可能的解决方法是什么?可能是不同网页的加载时间('Be‘最小)?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-06-20 02:21:04

显然,britanica.com使用重定向,可能是为了负载平衡,所以你通常会得到301而不是200的状态。如果您使用以下命令,requests模块可以执行重定向:

代码语言:javascript
复制
request = requests.head('https://www.britannica.com/topic/' + word.lower(),
                        allow_redirects=True)
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/44637223

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档