首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Python urllib2urllib的使用

Python中有很多库可以用来模拟浏览器发送请求抓取网页,本文中介绍使用urllib2来实现获取网页数据。...urllib2是在Python2标准库中的,无需安装即可使用,在Python3中不能使用urllib2,在Python3中urllib2被改为了urllib.request,所以本文中的代码在Python3...这时候需要在url中拼接查询字符串,Pythonurllib库提供了urlencode方法来将字典转换成查询字符串,而urllib2没有urlencode,所以可以通过urllib生成查询字符串来给urllib2...获取到的页面与我们在百度首页搜索python的页面相同。 ? 四、使用urllib2发送POST请求 上面的例子中,我们使用的都是GET方法,接下来我们使用POST方法。...使用urllib2发送请求时,我们并不需要声明使用的是GET请求还是POST请求,当我们给Request对象传入了data参数,urllib2就会自动以POST方式发送请求。

1K40
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    python爬虫入门(一)urlliburllib2

    Python中有很多库可以用来抓取网页,先学习urllib2。...urllib2模块直接导入就可以用,在python3中urllib2被改为urllib.request 开始爬虫需要准备的一些工具 (1)下载Fiddeler抓包工具,百度直接下载安装就可以(抓包) (...文件对象的操作方法 #read()方法就是读取文件里的全部内容,返回字符串 html = response.read() print html urllib2默认的User-Agent是Python-urllib...和urllib2的主要区别  urlliburllib2都是接受URL请求的相关模块,但是提供了不同的功能,最显著的区别如下: (1)urllib仅可以接受URL,不能创建,设置headers的request...类实例; (2)但是urllib提供urlencode()方法用来GET查询字符串的产生,而urllib2则没有(这是urlliburllib2经常一起使用的主要原因) (3)编码工作使用urllib

    1.9K60

    爬虫0020:urllib2操作urllib2的使用

    GET/POST请求 GET请求处理 POST请求处理 Handler处理器自定义开锁人opener 自定义HTTP OPENER 自定义PROXY OPENER 会话跟踪之cookie操作 cookie...urllib2的字样,这不是迅雷不及掩耳盗铃吗,用自己爬虫的身份直接访问服务器~很容被服务器进行分析过滤并屏蔽访问的!...请求处理方式get/post 请求常规处理方式GET/POST操作,通过两个案例进行操作,并通过抓包工具进行数据分析: # 添加注释,python2支持中文编码 # -*- coding:utf-8 -...*- # 引入需要的模块 from urllib2 import Request, urlopen from urllib import urlencode # 定义访问url地址和传递的数据 url...鉴于此,我们也可以自定义openr的实现过程: # -*- coding:utf-8 -*- import urllib2 # 引入需要的模块 handler = urllib2.HTTPSHandler

    71330

    urllib, urllib2, urllib3 都是小弟弟

    urllibpython 的内置模块, 主要用于处理url相关的一些操作,例如访问url、解析url等等。...有趣的是,urlliburllib2曾经同时出现在python2,python3又将两个模块合并成一个,社区又有大神提供了一个urllib3的库,都是用于处理网络请求相关功能,不过这些包在 requests...而python3中,urllib包下面用的最多的恐怕还是parse模块,主要处理url相关的操作。特别是爬虫应用中,用得多。...以下是我整理的关于urllib.parse的最常用方法,写爬虫过程中,经常要对url进行参数拼接、编码、解码、域名、资源路径提取等操作,parse 就可以排上用场。 ?...>>> from urllib import parse >>> url = 'https://mp.weixin.qq.com/s?

    50510

    Pythonurllib2模块的URLError与HTTPError

    urllib2 的异常错误处理 在我们用urlopen或opener.open方法发出一个请求时,如果urlopen或opener.open不能处理这个response,就产生错误。...下面的例子里我们访问了一个不存在的域名: # urllib2_urlerror.py import urllib2 requset = urllib2.Request('http://www.ajkfhafwjqh.com...注意,urllib2可以为我们处理重定向的页面(也就是3开头的响应码),100-299范围的号码表示成功,所以我们只能看到400-599的错误号码。...# urllib2_httperror.py import urllib2 requset = urllib2.Request('http://blog.baidu.com/itcast') try...改进版 由于HTTPError的父类是URLError,所以父类的异常应当写到子类异常的后面,所以上述的代码可以这么改写: # urllib2_botherror.py import urllib2

    2.3K10

    python 2.7 下urllib2 常见用法总结

    urllib2做为python下,在httplib之上再次封装的强大html协议实现,应用非常广泛。...下面分别总结个人在学习中的遇到的一些tips. 1、通常写法 urllib2.Request(url,data,headers) 其中url是你要访问的网站地址,data是post方法时要提交的post...origin_req_host=None, unverifiable=False): 另外要说明的是http协议中,post方法与get方法其实都是基于tcp通讯,其区别一个有post报文,一个没有。...            return "GET" Anyway: urllib2.py的源码文件在C:\Python27\Lib目录下,C:\Python27是我的python2.7安装目录。..._context = context 3、direct转向自动支持 urllib2支持自动转向,假如服务器端有自动redirect,urllib2会自动去提交获取到转向链接,并执行结果。

    2.5K30

    python使用urllib2抓取防爬取链接

    近来发现自己博客上python技术点的文章有点少,为了防止自己总是遗忘,还是写出来的好。...前几天刚看完《Linux/Unix设计思想》,真是一本不错的书,推荐想提高自己代码质量的童鞋看一下,里面经常提到要以小为美,一个程序做好一件事,短小精悍,因此我也按照这种思想来写python技术点的文章...开始了 一般情况下用python的童鞋是不可避免的要写一些爬虫程序的,因此对pythonurlliburllib2都比较熟悉。...下面的函数通过urllib2来模拟浏览器访问链接爬取内容: def get_url_content(url): i_headers = {"User-Agent": "Mozilla/5.0 (...,那么就需要用到urllib2中的代理设置了,如下: def get_content_by_proxy(url, proxy): opener = urllib2.build_opener(urllib2

    80620

    解决ModuleNotFoundError: No module named urllib2

    所以在Python 3中使用​​urllib2​​会导致找不到模块的错误。...要解决这个问题,有两种方法可以尝试:方法一:使用​​urllib.request​​模块替代​​urllib2​​由于​​urllib2​​在Python 3中已被移除,可以使用​​urllib.request​​...为了兼容Python 3,我们可以使用​​urllib.request​​​模块来替代​​urllib2​​​。...发送POST请求除了发送GET请求,​​urllib2​​还可以发送POST请求。需要使用​​Request​​类来构建请求对象,并通过​​urlopen​​函数发送请求。...但需要注意的是,由于在Python 3中被移除,所以在Python 3中应该使用​​urllib.request​​和​​urllib.error​​模块来代替​​urllib2​​。

    60140
    领券