【芝麻代理IP】大数据时代下,数据采集推动着数据分析,数据分析推动发展。但是在这个过程中会出现很多问题。拿最简单最基础的爬虫采集数据为例,过程中就会面临,IP被封,爬取受限、违法操作等多种问题,所以在爬取数据之前,一定要了解好预爬网站是否涉及违法操作,找到合适的代理IP访问网站等一系列问题。今天我们要介绍珍藏多年的Python爬虫笔记,大家小本本拿出来哦~
集合{ }:
集合是无序的,且集合中的元素是唯一的 set 集合是一个可变对象
可以使用set()类型转换成集合,set只能传一个对象所以创建时括号内使用元祖或者列表,例如:set([1,2,3,4,5]) 也可以直接定义 集合的运算以及函数
a =
b =
a | b = 获取a和b集合内所有的元素,有重复的去重
a &b = 获取a和b的交集
a - b = 获取a和b的差集,返回的元素以a为准,谁在前面就以谁的集合为准
a.add(’ x ') 将元素x 添加到集合a中
a.pop() 删除a集合中的元素 随机的 注意括号内不加任何参数
a.remove(‘x’) 删除a集合中的x 元素
a.update({‘teacher’,56,45,34})修改a集合 将这些参数增加到a中
函数
isdisjiont()判断两个集合是否没有交集 有返回False 没有交集返回Ture
issubset() 判断前面的集合是否包含于后面的集合 也就是说前面的集合一定比后面的交集元素少
issuperset() 判断前面的集合是否包含后面的集合 也就是说前面的集合一定比后面的交集元素多
字典
dict = {‘Name’: ‘Zara’, ‘Age’: 7, ‘Class’: ‘First’};
修改字典
update.[‘nama’] = ‘zhangren’
复制
a = dict.copy() 浅复制dict 给a 对a进行修改dict的不会变化
创建新字典
b = dict.fromkeys([1,2,3],[7] ) 返回一个键为1,2,3 键值都是7 的字典
dict.setdefault(‘name’,99) 查询dict中键为name的键值,如果没有就创建键为 name 键值为 99 的键值对 有则查无则增 与dict.get() 用法一样
删除
dict.clear() 清楚字典的内容
dict.pop(‘name’) 删除键值为name的元素
dict.popitem() 随机返回删除的一个键值对
dict.keys() 返回键
dict.value 返回键值
dict.items() 以列表返回可遍历的(键, 值) 元组数组 dict_items([(‘Name’, ‘Zara’), (‘Age’, 7), (‘Class’, ‘First’)])
芝麻软件双十一活动火热上线,更多资讯请到官网咨询:http://www.zhimaruanjian.com/
领取专属 10元无门槛券
私享最新 技术干货