查看该CSV文件的表头,内容如下,其中最重要的两个字段就是text和stars,分别代表评语和打分。...#CSV格式表头内容:
#funny,user_id,review_id,text,business_id,stars,date,useful,cool
使用pandas读取该CSV文件,开发阶段可以指定仅读取前...#开发阶段读取前10000行
df = pd.read_csv(filename,sep=',',header=0,nrows=10000)
pandas的可以配置的参数非常多,其中比较重要的几个含义如下...指定分隔符。
header: int or list of ints, default ‘infer’。指定行数用来作为列名,数据开始行数。如果文件中没有列名,设置为None。...如果为True,则跳过空行;否则记为NaN
按照列名直接获取数据,读取评论内容和打分结果,使用list转换成list对象。