前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >数据清洗之 数据修改和查找

数据清洗之 数据修改和查找

原创
作者头像
ruochen
修改2021-05-13 14:33:16
6780
修改2021-05-13 14:33:16
举报
文章被收录于专栏:若尘的技术专栏

数据修改和查找

  • 在数据中,可以使用rename修改列名称或者行索引名称
  • 使用loc方法修改数据
  • 使用loc方法查找符合条件的数据
  • 条件于条件之间用&或者|连接,分别代表 '且' 和 '或'
  • 使用between和isin选择满足条件的行
代码语言:txt
复制
import pandas as pd
import numpy as np
import os
代码语言:txt
复制
os.getcwd()
代码语言:txt
复制
'D:\\Jupyter\\notebook\\Python数据清洗实战\\数据清洗之数据表处理'
代码语言:txt
复制
os.chdir('D:\\Jupyter\\notebook\\Python数据清洗实战\\数据')
代码语言:txt
复制
df1 = pd.read_csv('sam_tianchi_mum_baby.csv', encoding='utf-8', dtype=str)
代码语言:txt
复制
df1.head(5)

<div>

<style scoped>

代码语言:txt
复制
.dataframe tbody tr th:only-of-type {
代码语言:txt
复制
    vertical-align: middle;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe tbody tr th {
代码语言:txt
复制
    vertical-align: top;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe thead th {
代码语言:txt
复制
    text-align: right;
代码语言:txt
复制
}

</style>

<table border="1" class="dataframe">

<thead>

代码语言:txt
复制
<tr style="text-align: right;">
代码语言:txt
复制
  <th></th>
代码语言:txt
复制
  <th>user_id</th>
代码语言:txt
复制
  <th>birthday</th>
代码语言:txt
复制
  <th>gender</th>
代码语言:txt
复制
</tr>

</thead>

<tbody>

代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>0</th>
代码语言:txt
复制
  <td>2757</td>
代码语言:txt
复制
  <td>20130311</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>1</th>
代码语言:txt
复制
  <td>415971</td>
代码语言:txt
复制
  <td>20121111</td>
代码语言:txt
复制
  <td>0</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>2</th>
代码语言:txt
复制
  <td>1372572</td>
代码语言:txt
复制
  <td>20120130</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>3</th>
代码语言:txt
复制
  <td>10339332</td>
代码语言:txt
复制
  <td>20110910</td>
代码语言:txt
复制
  <td>0</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>4</th>
代码语言:txt
复制
  <td>10642245</td>
代码语言:txt
复制
  <td>20130213</td>
代码语言:txt
复制
  <td>0</td>
代码语言:txt
复制
</tr>

</tbody>

</table>

</div>

代码语言:txt
复制
df1.info()
代码语言:txt
复制
<class 'pandas.core.frame.DataFrame'>
代码语言:txt
复制
RangeIndex: 953 entries, 0 to 952
代码语言:txt
复制
Data columns (total 3 columns):
代码语言:txt
复制
user_id     953 non-null object
代码语言:txt
复制
birthday    953 non-null object
代码语言:txt
复制
gender      953 non-null object
代码语言:txt
复制
dtypes: object(3)
代码语言:txt
复制
memory usage: 22.4+ KB
代码语言:txt
复制
# 修改0为女性
df1.loc[df1['gender']=='0', 'gender'] = '女性'
代码语言:txt
复制
df1.loc[df1['gender']=='1', 'gender'] = '男性'
df1.loc[df1['gender']=='2', 'gender'] = '未知'
代码语言:txt
复制
df1.head(5)

<div>

<style scoped>

代码语言:txt
复制
.dataframe tbody tr th:only-of-type {
代码语言:txt
复制
    vertical-align: middle;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe tbody tr th {
代码语言:txt
复制
    vertical-align: top;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe thead th {
代码语言:txt
复制
    text-align: right;
代码语言:txt
复制
}

</style>

<table border="1" class="dataframe">

<thead>

代码语言:txt
复制
<tr style="text-align: right;">
代码语言:txt
复制
  <th></th>
代码语言:txt
复制
  <th>user_id</th>
代码语言:txt
复制
  <th>birthday</th>
代码语言:txt
复制
  <th>gender</th>
代码语言:txt
复制
</tr>

</thead>

<tbody>

代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>0</th>
代码语言:txt
复制
  <td>2757</td>
代码语言:txt
复制
  <td>20130311</td>
代码语言:txt
复制
  <td>男性</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>1</th>
代码语言:txt
复制
  <td>415971</td>
代码语言:txt
复制
  <td>20121111</td>
代码语言:txt
复制
  <td>女性</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>2</th>
代码语言:txt
复制
  <td>1372572</td>
代码语言:txt
复制
  <td>20120130</td>
代码语言:txt
复制
  <td>男性</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>3</th>
代码语言:txt
复制
  <td>10339332</td>
代码语言:txt
复制
  <td>20110910</td>
代码语言:txt
复制
  <td>女性</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>4</th>
代码语言:txt
复制
  <td>10642245</td>
代码语言:txt
复制
  <td>20130213</td>
代码语言:txt
复制
  <td>女性</td>
代码语言:txt
复制
</tr>

</tbody>

</table>

</div>

代码语言:txt
复制
# 对列标签进行修改,传入参数为字典形式
# 加 inplace=True,会对原数据进行修改
df1.rename(columns={'user_id': '用户ID', 'birthday': '出生日期', 'gender': '性别'}, inplace=True)
代码语言:txt
复制
df1.head(5)

<div>

<style scoped>

代码语言:txt
复制
.dataframe tbody tr th:only-of-type {
代码语言:txt
复制
    vertical-align: middle;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe tbody tr th {
代码语言:txt
复制
    vertical-align: top;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe thead th {
代码语言:txt
复制
    text-align: right;
代码语言:txt
复制
}

</style>

<table border="1" class="dataframe">

<thead>

代码语言:txt
复制
<tr style="text-align: right;">
代码语言:txt
复制
  <th></th>
代码语言:txt
复制
  <th>用户ID</th>
代码语言:txt
复制
  <th>出生日期</th>
代码语言:txt
复制
  <th>性别</th>
代码语言:txt
复制
</tr>

</thead>

<tbody>

代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>0</th>
代码语言:txt
复制
  <td>2757</td>
代码语言:txt
复制
  <td>20130311</td>
代码语言:txt
复制
  <td>男性</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>1</th>
代码语言:txt
复制
  <td>415971</td>
代码语言:txt
复制
  <td>20121111</td>
代码语言:txt
复制
  <td>女性</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>2</th>
代码语言:txt
复制
  <td>1372572</td>
代码语言:txt
复制
  <td>20120130</td>
代码语言:txt
复制
  <td>男性</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>3</th>
代码语言:txt
复制
  <td>10339332</td>
代码语言:txt
复制
  <td>20110910</td>
代码语言:txt
复制
  <td>女性</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>4</th>
代码语言:txt
复制
  <td>10642245</td>
代码语言:txt
复制
  <td>20130213</td>
代码语言:txt
复制
  <td>女性</td>
代码语言:txt
复制
</tr>

</tbody>

</table>

</div>

代码语言:txt
复制
# 修改行标签
df1.rename(index={3: 333, 4:444}, inplace=True)
代码语言:txt
复制
df1.head(5)

<div>

<style scoped>

代码语言:txt
复制
.dataframe tbody tr th:only-of-type {
代码语言:txt
复制
    vertical-align: middle;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe tbody tr th {
代码语言:txt
复制
    vertical-align: top;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe thead th {
代码语言:txt
复制
    text-align: right;
代码语言:txt
复制
}

</style>

<table border="1" class="dataframe">

<thead>

代码语言:txt
复制
<tr style="text-align: right;">
代码语言:txt
复制
  <th></th>
代码语言:txt
复制
  <th>用户ID</th>
代码语言:txt
复制
  <th>出生日期</th>
代码语言:txt
复制
  <th>性别</th>
代码语言:txt
复制
</tr>

</thead>

<tbody>

代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>0</th>
代码语言:txt
复制
  <td>2757</td>
代码语言:txt
复制
  <td>20130311</td>
代码语言:txt
复制
  <td>男性</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>1</th>
代码语言:txt
复制
  <td>415971</td>
代码语言:txt
复制
  <td>20121111</td>
代码语言:txt
复制
  <td>女性</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>2</th>
代码语言:txt
复制
  <td>1372572</td>
代码语言:txt
复制
  <td>20120130</td>
代码语言:txt
复制
  <td>男性</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>333</th>
代码语言:txt
复制
  <td>10339332</td>
代码语言:txt
复制
  <td>20110910</td>
代码语言:txt
复制
  <td>女性</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>444</th>
代码语言:txt
复制
  <td>10642245</td>
代码语言:txt
复制
  <td>20130213</td>
代码语言:txt
复制
  <td>女性</td>
代码语言:txt
复制
</tr>

</tbody>

</table>

</div>

代码语言:txt
复制
# iloc按照位置取值,与标签无关
df1.iloc[:5]

<div>

<style scoped>

代码语言:txt
复制
.dataframe tbody tr th:only-of-type {
代码语言:txt
复制
    vertical-align: middle;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe tbody tr th {
代码语言:txt
复制
    vertical-align: top;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe thead th {
代码语言:txt
复制
    text-align: right;
代码语言:txt
复制
}

</style>

<table border="1" class="dataframe">

<thead>

代码语言:txt
复制
<tr style="text-align: right;">
代码语言:txt
复制
  <th></th>
代码语言:txt
复制
  <th>用户ID</th>
代码语言:txt
复制
  <th>出生日期</th>
代码语言:txt
复制
  <th>性别</th>
代码语言:txt
复制
</tr>

</thead>

<tbody>

代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>0</th>
代码语言:txt
复制
  <td>2757</td>
代码语言:txt
复制
  <td>20130311</td>
代码语言:txt
复制
  <td>男性</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>1</th>
代码语言:txt
复制
  <td>415971</td>
代码语言:txt
复制
  <td>20121111</td>
代码语言:txt
复制
  <td>女性</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>2</th>
代码语言:txt
复制
  <td>1372572</td>
代码语言:txt
复制
  <td>20120130</td>
代码语言:txt
复制
  <td>男性</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>333</th>
代码语言:txt
复制
  <td>10339332</td>
代码语言:txt
复制
  <td>20110910</td>
代码语言:txt
复制
  <td>女性</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>444</th>
代码语言:txt
复制
  <td>10642245</td>
代码语言:txt
复制
  <td>20130213</td>
代码语言:txt
复制
  <td>女性</td>
代码语言:txt
复制
</tr>

</tbody>

</table>

</div>

代码语言:txt
复制
# 重置索引
df1.reset_index(drop=True, inplace=True)
代码语言:txt
复制
df1.head(5)

<div>

<style scoped>

代码语言:txt
复制
.dataframe tbody tr th:only-of-type {
代码语言:txt
复制
    vertical-align: middle;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe tbody tr th {
代码语言:txt
复制
    vertical-align: top;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe thead th {
代码语言:txt
复制
    text-align: right;
代码语言:txt
复制
}

</style>

<table border="1" class="dataframe">

<thead>

代码语言:txt
复制
<tr style="text-align: right;">
代码语言:txt
复制
  <th></th>
代码语言:txt
复制
  <th>用户ID</th>
代码语言:txt
复制
  <th>出生日期</th>
代码语言:txt
复制
  <th>性别</th>
代码语言:txt
复制
</tr>

</thead>

<tbody>

代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>0</th>
代码语言:txt
复制
  <td>2757</td>
代码语言:txt
复制
  <td>20130311</td>
代码语言:txt
复制
  <td>男性</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>1</th>
代码语言:txt
复制
  <td>415971</td>
代码语言:txt
复制
  <td>20121111</td>
代码语言:txt
复制
  <td>女性</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>2</th>
代码语言:txt
复制
  <td>1372572</td>
代码语言:txt
复制
  <td>20120130</td>
代码语言:txt
复制
  <td>男性</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>3</th>
代码语言:txt
复制
  <td>10339332</td>
代码语言:txt
复制
  <td>20110910</td>
代码语言:txt
复制
  <td>女性</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>4</th>
代码语言:txt
复制
  <td>10642245</td>
代码语言:txt
复制
  <td>20130213</td>
代码语言:txt
复制
  <td>女性</td>
代码语言:txt
复制
</tr>

</tbody>

</table>

</div>

  • 查询
代码语言:txt
复制
df = pd.read_csv('baby_trade_history.csv', encoding='utf-8', dtype={'user_id':str})
代码语言:txt
复制
df.head(2)

<div>

<style scoped>

代码语言:txt
复制
.dataframe tbody tr th:only-of-type {
代码语言:txt
复制
    vertical-align: middle;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe tbody tr th {
代码语言:txt
复制
    vertical-align: top;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe thead th {
代码语言:txt
复制
    text-align: right;
代码语言:txt
复制
}

</style>

<table border="1" class="dataframe">

<thead>

代码语言:txt
复制
<tr style="text-align: right;">
代码语言:txt
复制
  <th></th>
代码语言:txt
复制
  <th>user_id</th>
代码语言:txt
复制
  <th>auction_id</th>
代码语言:txt
复制
  <th>cat_id</th>
代码语言:txt
复制
  <th>cat1</th>
代码语言:txt
复制
  <th>property</th>
代码语言:txt
复制
  <th>buy_mount</th>
代码语言:txt
复制
  <th>day</th>
代码语言:txt
复制
</tr>

</thead>

<tbody>

代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>0</th>
代码语言:txt
复制
  <td>786295544</td>
代码语言:txt
复制
  <td>41098319944</td>
代码语言:txt
复制
  <td>50014866</td>
代码语言:txt
复制
  <td>50022520</td>
代码语言:txt
复制
  <td>21458:86755362;13023209:3593274;10984217:21985...</td>
代码语言:txt
复制
  <td>2</td>
代码语言:txt
复制
  <td>20140919</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>1</th>
代码语言:txt
复制
  <td>532110457</td>
代码语言:txt
复制
  <td>17916191097</td>
代码语言:txt
复制
  <td>50011993</td>
代码语言:txt
复制
  <td>28</td>
代码语言:txt
复制
  <td>21458:11399317;1628862:3251296;21475:137325;16...</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20131011</td>
代码语言:txt
复制
</tr>

</tbody>

</table>

</div>

代码语言:txt
复制
# 选择buy_mount 大于10 的数据
# 返回的是布尔索引值
# 放入pandas dataframe 中,会自动筛选
# 数据太多,使用分片打印前5个
df[df['buy_mount'] > 10][:5]

<div>

<style scoped>

代码语言:txt
复制
.dataframe tbody tr th:only-of-type {
代码语言:txt
复制
    vertical-align: middle;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe tbody tr th {
代码语言:txt
复制
    vertical-align: top;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe thead th {
代码语言:txt
复制
    text-align: right;
代码语言:txt
复制
}

</style>

<table border="1" class="dataframe">

<thead>

代码语言:txt
复制
<tr style="text-align: right;">
代码语言:txt
复制
  <th></th>
代码语言:txt
复制
  <th>user_id</th>
代码语言:txt
复制
  <th>auction_id</th>
代码语言:txt
复制
  <th>cat_id</th>
代码语言:txt
复制
  <th>cat1</th>
代码语言:txt
复制
  <th>property</th>
代码语言:txt
复制
  <th>buy_mount</th>
代码语言:txt
复制
  <th>day</th>
代码语言:txt
复制
</tr>

</thead>

<tbody>

代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>49</th>
代码语言:txt
复制
  <td>103125167</td>
代码语言:txt
复制
  <td>18426669796</td>
代码语言:txt
复制
  <td>50018438</td>
代码语言:txt
复制
  <td>50014815</td>
代码语言:txt
复制
  <td>21458:46896;1628665:3233941;1628665:3233942;21...</td>
代码语言:txt
复制
  <td>16</td>
代码语言:txt
复制
  <td>20140220</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>65</th>
代码语言:txt
复制
  <td>605724983</td>
代码语言:txt
复制
  <td>19747694834</td>
代码语言:txt
复制
  <td>50006520</td>
代码语言:txt
复制
  <td>50014815</td>
代码语言:txt
复制
  <td>21458:30992</td>
代码语言:txt
复制
  <td>12</td>
代码语言:txt
复制
  <td>20141017</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>89</th>
代码语言:txt
复制
  <td>277279277</td>
代码语言:txt
复制
  <td>18024521052</td>
代码语言:txt
复制
  <td>211122</td>
代码语言:txt
复制
  <td>38</td>
代码语言:txt
复制
  <td>21458:33516;33480:3238774;2653417:7353464;3359...</td>
代码语言:txt
复制
  <td>12</td>
代码语言:txt
复制
  <td>20130513</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>247</th>
代码语言:txt
复制
  <td>392530596</td>
代码语言:txt
复制
  <td>17001611735</td>
代码语言:txt
复制
  <td>50011993</td>
代码语言:txt
复制
  <td>28</td>
代码语言:txt
复制
  <td>122218042:50276;21475:135183931;1628861:45151;...</td>
代码语言:txt
复制
  <td>101</td>
代码语言:txt
复制
  <td>20140301</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>409</th>
代码语言:txt
复制
  <td>1968453717</td>
代码语言:txt
复制
  <td>12567034563</td>
代码语言:txt
复制
  <td>122616024</td>
代码语言:txt
复制
  <td>28</td>
代码语言:txt
复制
  <td>135925585:42825;138052423:142000990;18822961:2...</td>
代码语言:txt
复制
  <td>14</td>
代码语言:txt
复制
  <td>20150127</td>
代码语言:txt
复制
</tr>

</tbody>

</table>

</div>

代码语言:txt
复制
# 选择buy_mount 小于等于10 的数据
df[~(df['buy_mount'] > 10)][:5]

<div>

<style scoped>

代码语言:txt
复制
.dataframe tbody tr th:only-of-type {
代码语言:txt
复制
    vertical-align: middle;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe tbody tr th {
代码语言:txt
复制
    vertical-align: top;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe thead th {
代码语言:txt
复制
    text-align: right;
代码语言:txt
复制
}

</style>

<table border="1" class="dataframe">

<thead>

代码语言:txt
复制
<tr style="text-align: right;">
代码语言:txt
复制
  <th></th>
代码语言:txt
复制
  <th>user_id</th>
代码语言:txt
复制
  <th>auction_id</th>
代码语言:txt
复制
  <th>cat_id</th>
代码语言:txt
复制
  <th>cat1</th>
代码语言:txt
复制
  <th>property</th>
代码语言:txt
复制
  <th>buy_mount</th>
代码语言:txt
复制
  <th>day</th>
代码语言:txt
复制
</tr>

</thead>

<tbody>

代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>0</th>
代码语言:txt
复制
  <td>786295544</td>
代码语言:txt
复制
  <td>41098319944</td>
代码语言:txt
复制
  <td>50014866</td>
代码语言:txt
复制
  <td>50022520</td>
代码语言:txt
复制
  <td>21458:86755362;13023209:3593274;10984217:21985...</td>
代码语言:txt
复制
  <td>2</td>
代码语言:txt
复制
  <td>20140919</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>1</th>
代码语言:txt
复制
  <td>532110457</td>
代码语言:txt
复制
  <td>17916191097</td>
代码语言:txt
复制
  <td>50011993</td>
代码语言:txt
复制
  <td>28</td>
代码语言:txt
复制
  <td>21458:11399317;1628862:3251296;21475:137325;16...</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20131011</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>2</th>
代码语言:txt
复制
  <td>249013725</td>
代码语言:txt
复制
  <td>21896936223</td>
代码语言:txt
复制
  <td>50012461</td>
代码语言:txt
复制
  <td>50014815</td>
代码语言:txt
复制
  <td>21458:30992;1628665:92012;1628665:3233938;1628...</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20131011</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>3</th>
代码语言:txt
复制
  <td>917056007</td>
代码语言:txt
复制
  <td>12515996043</td>
代码语言:txt
复制
  <td>50018831</td>
代码语言:txt
复制
  <td>50014815</td>
代码语言:txt
复制
  <td>21458:15841995;21956:3494076;27000458:59723383...</td>
代码语言:txt
复制
  <td>2</td>
代码语言:txt
复制
  <td>20141023</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>4</th>
代码语言:txt
复制
  <td>444069173</td>
代码语言:txt
复制
  <td>20487688075</td>
代码语言:txt
复制
  <td>50013636</td>
代码语言:txt
复制
  <td>50008168</td>
代码语言:txt
复制
  <td>21458:30992;13658074:3323064;1628665:3233941;1...</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20141103</td>
代码语言:txt
复制
</tr>

</tbody>

</table>

</div>

代码语言:txt
复制
# 多条件查询
# 每个条件用括号括起来
df[(df['buy_mount'] > 10) & (df['day'] > 20140101)][:5]

<div>

<style scoped>

代码语言:txt
复制
.dataframe tbody tr th:only-of-type {
代码语言:txt
复制
    vertical-align: middle;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe tbody tr th {
代码语言:txt
复制
    vertical-align: top;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe thead th {
代码语言:txt
复制
    text-align: right;
代码语言:txt
复制
}

</style>

<table border="1" class="dataframe">

<thead>

代码语言:txt
复制
<tr style="text-align: right;">
代码语言:txt
复制
  <th></th>
代码语言:txt
复制
  <th>user_id</th>
代码语言:txt
复制
  <th>auction_id</th>
代码语言:txt
复制
  <th>cat_id</th>
代码语言:txt
复制
  <th>cat1</th>
代码语言:txt
复制
  <th>property</th>
代码语言:txt
复制
  <th>buy_mount</th>
代码语言:txt
复制
  <th>day</th>
代码语言:txt
复制
</tr>

</thead>

<tbody>

代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>49</th>
代码语言:txt
复制
  <td>103125167</td>
代码语言:txt
复制
  <td>18426669796</td>
代码语言:txt
复制
  <td>50018438</td>
代码语言:txt
复制
  <td>50014815</td>
代码语言:txt
复制
  <td>21458:46896;1628665:3233941;1628665:3233942;21...</td>
代码语言:txt
复制
  <td>16</td>
代码语言:txt
复制
  <td>20140220</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>65</th>
代码语言:txt
复制
  <td>605724983</td>
代码语言:txt
复制
  <td>19747694834</td>
代码语言:txt
复制
  <td>50006520</td>
代码语言:txt
复制
  <td>50014815</td>
代码语言:txt
复制
  <td>21458:30992</td>
代码语言:txt
复制
  <td>12</td>
代码语言:txt
复制
  <td>20141017</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>247</th>
代码语言:txt
复制
  <td>392530596</td>
代码语言:txt
复制
  <td>17001611735</td>
代码语言:txt
复制
  <td>50011993</td>
代码语言:txt
复制
  <td>28</td>
代码语言:txt
复制
  <td>122218042:50276;21475:135183931;1628861:45151;...</td>
代码语言:txt
复制
  <td>101</td>
代码语言:txt
复制
  <td>20140301</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>409</th>
代码语言:txt
复制
  <td>1968453717</td>
代码语言:txt
复制
  <td>12567034563</td>
代码语言:txt
复制
  <td>122616024</td>
代码语言:txt
复制
  <td>28</td>
代码语言:txt
复制
  <td>135925585:42825;138052423:142000990;18822961:2...</td>
代码语言:txt
复制
  <td>14</td>
代码语言:txt
复制
  <td>20150127</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>462</th>
代码语言:txt
复制
  <td>1802549062</td>
代码语言:txt
复制
  <td>17383345857</td>
代码语言:txt
复制
  <td>50006520</td>
代码语言:txt
复制
  <td>50014815</td>
代码语言:txt
复制
  <td>22277:6262384;21458:30992;1628665:61550;162866...</td>
代码语言:txt
复制
  <td>11</td>
代码语言:txt
复制
  <td>20141120</td>
代码语言:txt
复制
</tr>

</tbody>

</table>

</div>

代码语言:txt
复制
# between方法不适用于字符串数据
df[df['buy_mount'].between(4, 10, inclusive=True)][:5]

<div>

<style scoped>

代码语言:txt
复制
.dataframe tbody tr th:only-of-type {
代码语言:txt
复制
    vertical-align: middle;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe tbody tr th {
代码语言:txt
复制
    vertical-align: top;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe thead th {
代码语言:txt
复制
    text-align: right;
代码语言:txt
复制
}

</style>

<table border="1" class="dataframe">

<thead>

代码语言:txt
复制
<tr style="text-align: right;">
代码语言:txt
复制
  <th></th>
代码语言:txt
复制
  <th>user_id</th>
代码语言:txt
复制
  <th>auction_id</th>
代码语言:txt
复制
  <th>cat_id</th>
代码语言:txt
复制
  <th>cat1</th>
代码语言:txt
复制
  <th>property</th>
代码语言:txt
复制
  <th>buy_mount</th>
代码语言:txt
复制
  <th>day</th>
代码语言:txt
复制
</tr>

</thead>

<tbody>

代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>22</th>
代码语言:txt
复制
  <td>469517728</td>
代码语言:txt
复制
  <td>8232924597</td>
代码语言:txt
复制
  <td>211122</td>
代码语言:txt
复制
  <td>38</td>
代码语言:txt
复制
  <td>21458:21782;36786:42781029;13023102:6999219;22...</td>
代码语言:txt
复制
  <td>6</td>
代码语言:txt
复制
  <td>20140502</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>52</th>
代码语言:txt
复制
  <td>55544814</td>
代码语言:txt
复制
  <td>4917672059</td>
代码语言:txt
复制
  <td>50015727</td>
代码语言:txt
复制
  <td>50014815</td>
代码语言:txt
复制
  <td>21458:4540492;1633959:58840623;7107736:3227806...</td>
代码语言:txt
复制
  <td>4</td>
代码语言:txt
复制
  <td>20131106</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>117</th>
代码语言:txt
复制
  <td>296448405</td>
代码语言:txt
复制
  <td>18524578446</td>
代码语言:txt
复制
  <td>50016030</td>
代码语言:txt
复制
  <td>50008168</td>
代码语言:txt
复制
  <td>21458:247918101;1628665:29782;1628665:29784;16...</td>
代码语言:txt
复制
  <td>7</td>
代码语言:txt
复制
  <td>20131202</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>134</th>
代码语言:txt
复制
  <td>97481514</td>
代码语言:txt
复制
  <td>41161316434</td>
代码语言:txt
复制
  <td>211122</td>
代码语言:txt
复制
  <td>38</td>
代码语言:txt
复制
  <td>6940834:29865;21458:4331527;1804977:606613769;...</td>
代码语言:txt
复制
  <td>6</td>
代码语言:txt
复制
  <td>20141126</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>148</th>
代码语言:txt
复制
  <td>662134541</td>
代码语言:txt
复制
  <td>7594318922</td>
代码语言:txt
复制
  <td>211122</td>
代码语言:txt
复制
  <td>38</td>
代码语言:txt
复制
  <td>21458:21776;36780:15333590;2675455:19653564;69...</td>
代码语言:txt
复制
  <td>6</td>
代码语言:txt
复制
  <td>20131211</td>
代码语言:txt
复制
</tr>

</tbody>

</table>

</div>

代码语言:txt
复制
df.dtypes
代码语言:txt
复制
user_id       object
代码语言:txt
复制
auction_id     int64
代码语言:txt
复制
cat_id         int64
代码语言:txt
复制
cat1           int64
代码语言:txt
复制
property      object
代码语言:txt
复制
buy_mount      int64
代码语言:txt
复制
day            int64
代码语言:txt
复制
dtype: object
代码语言:txt
复制
# 多个值放入列表中
df[df['cat1'].isin([38,28])][:5]

<div>

<style scoped>

代码语言:txt
复制
.dataframe tbody tr th:only-of-type {
代码语言:txt
复制
    vertical-align: middle;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe tbody tr th {
代码语言:txt
复制
    vertical-align: top;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe thead th {
代码语言:txt
复制
    text-align: right;
代码语言:txt
复制
}

</style>

<table border="1" class="dataframe">

<thead>

代码语言:txt
复制
<tr style="text-align: right;">
代码语言:txt
复制
  <th></th>
代码语言:txt
复制
  <th>user_id</th>
代码语言:txt
复制
  <th>auction_id</th>
代码语言:txt
复制
  <th>cat_id</th>
代码语言:txt
复制
  <th>cat1</th>
代码语言:txt
复制
  <th>property</th>
代码语言:txt
复制
  <th>buy_mount</th>
代码语言:txt
复制
  <th>day</th>
代码语言:txt
复制
</tr>

</thead>

<tbody>

代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>1</th>
代码语言:txt
复制
  <td>532110457</td>
代码语言:txt
复制
  <td>17916191097</td>
代码语言:txt
复制
  <td>50011993</td>
代码语言:txt
复制
  <td>28</td>
代码语言:txt
复制
  <td>21458:11399317;1628862:3251296;21475:137325;16...</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20131011</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>8</th>
代码语言:txt
复制
  <td>82830661</td>
代码语言:txt
复制
  <td>19948600790</td>
代码语言:txt
复制
  <td>50013874</td>
代码语言:txt
复制
  <td>28</td>
代码语言:txt
复制
  <td>21458:11580;21475:137325</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20121101</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>9</th>
代码语言:txt
复制
  <td>475046636</td>
代码语言:txt
复制
  <td>10368360710</td>
代码语言:txt
复制
  <td>203527</td>
代码语言:txt
复制
  <td>28</td>
代码语言:txt
复制
  <td>22724:40168;22729:40278;21458:21817;2770200:24...</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20121101</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>10</th>
代码语言:txt
复制
  <td>734147966</td>
代码语言:txt
复制
  <td>15307958346</td>
代码语言:txt
复制
  <td>50018202</td>
代码语言:txt
复制
  <td>38</td>
代码语言:txt
复制
  <td>21458:3270827;7361532:28710594;7397093:7536994...</td>
代码语言:txt
复制
  <td>2</td>
代码语言:txt
复制
  <td>20121101</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>13</th>
代码语言:txt
复制
  <td>377550424</td>
代码语言:txt
复制
  <td>15771663914</td>
代码语言:txt
复制
  <td>50015841</td>
代码语言:txt
复制
  <td>28</td>
代码语言:txt
复制
  <td>1628665:3233941;1628665:3233942;3914866:11580;...</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20121123</td>
代码语言:txt
复制
</tr>

</tbody>

</table>

</div>

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 数据修改和查找
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档