Python作为一门薪酬最高且最简单的语言,用此语言入手数据科学和大数据实在是平生的一种荣幸。
在我们平时的生活当中,可以将Python进行有效导入,可以将立体的图像看成一种三维数组,这些数字就代表了各区域的像素值,声音则可以看作是一维数组,文本在自然语言处理领域也可以看作是一种量化的数值表示,不管是何种数据,我们第一步就是要将这些数据转化成数值数组成可分析的数据。
正因为如此,有效地转换和使用这些数据是数据科学当中至关重要的的过程。因此我们这里将会介绍Python的NumPy包。
NumPy包提供了给我们高效率的存储和操作密集的数据缓存的接口,让我们利用线性代数进行矩阵计算时会更加方便,为我们打开了一扇百万年薪之窗。是每一个大数据工程师和人工智能工程师必须掌握的基础技能。
一.利用numpy创建数组
安装NumPy包,在命令行模式下键入代码:
pip install numpy
不到两分钟就会自动安装好了
然后进入已经编辑环境变量的cmd窗口或者ipython窗口
python
import numpy as np(这样可以方便我们进行简写)
np.zeros(10,dtype=int)
输出:array([0,0,0,0,0,0,0,0,0,0])
#创建一个3^5的浮点型数组,数组的值全部为一
np.ones((3,5),dtype=float)
输出:array([[1.,1.,1.,1.,1.]
[1.,1.,1.,1.,1.]
[1.,1.,1.,1.,1.]]
)
#创建一个1^1的浮点型数据
np.full((1,1),3.14)
output:array([[3.14]])
.........
二.NumPy标准数据类型
NumPy标准数据类型前面均用dtype来说明我们开始写数据类型了,其中数据类型有下面多种:
这些数据类型十分重要,必须倒背如流。
三.numpy数组切片
numpy数组切片和我们Python列表进行切片的感觉是差不多的,确实也是差不多的,语法也十分的相似。
我们可以利用Python当中常见的格式对numpy同样进行切片。
例如:
x[开始的数值:结束的数值:步长]
假设:
input:x=np,arange(10)
x
output:array([0,1,2,3,4,5,6,7,8,9])
x[:5]#切片前面五个元素
array([0,1,2,3,4])
x[5:]#切片5之后的元素
array([6,7,8,9])
x([4,7])#切片4-7中间的数,右边不包含,这是Python的特殊要求
array([4,5,6])
以上还仅仅是一维数组的情况,我们可以看看多维数组的情况:
x2=array([[1,2,3]
[4,5,6]
[7,8,9]
])
x2[:2.:3]
array([
[4,5]
[7,8]
])
其道理可以以此类推,借鉴一下一维数组的用法就可以很清楚地了解到多维数组的用法了。
后面我们将会讲解通用函数的使用,这才是NumPy科学计算的真谛!
领取专属 10元无门槛券
私享最新 技术干货