问当网页包含在列表中时，‘'request’模块不能正确list网页
EN

Stack Overflow用户

提问于 2017-06-20 02:09:55

回答 1查看 12关注 0票数 0

我正在使用request模块查看单词列表中的项目是否是https://www.britannica.com上的文章。我当前的代码是：

import requests

words = ['no', 'yes', 'thermodynamics', 'london', 'Max-Factor', 'be']

for word in words:
    request = requests.head('https://www.britannica.com/topic/' + word.lower())
    if request.status_code == 200:
        print(">EXISTS")
        print('https://www.britannica.com/topic/' + word.lower())
        print("<")
    else:
        print(">DOESNT EXIST")
        print('https://www.britannica.com/topic/' + word.lower())
        print("<")

“‘Be”是唯一打印“EXIST”的字符串，但是“热力学”、“london”和“Max-Factor”也存在，并且程序打印“不存在”。如果我单独对热力学进行操作，它会正确地打印“EXISTS”。造成这种差异的原因和可能的解决方法是什么？可能是不同网页的加载时间('Be‘最小)？

list

python-3.x

python-requests

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-06-20 02:21:04

显然，britanica.com使用重定向，可能是为了负载平衡，所以你通常会得到301而不是200的状态。如果您使用以下命令，requests模块可以执行重定向：

request = requests.head('https://www.britannica.com/topic/' + word.lower(),
                        allow_redirects=True)

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/44637223

复制

相似问题

问当网页包含在列表中时，‘'request’模块不能正确list网页
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问当网页包含在列表中时，‘'request’模块不能正确list网页EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问当网页包含在列表中时，‘'request’模块不能正确list网页
EN