首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >用于机器学习算法的Python csv流

目前我有一个很大的CSV文件(大约5 5GB),我试图逐行读取整个文件,并尝试应用最典型的算法(SVM、朴素贝叶斯、线性回归等)。

代码语言:javascript
运行
AI代码解释
复制
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import csv

i_f = open('top2Mmm.csv', 'r' )
reader = csv.reader( i_f, delimiter = ';' )
for row in reader:
print("Fila  ->", row)

我刚刚阅读了CSV,但我不知道如何每一行都建立一个模型。我从一个较小的文件开始,以加快这个过程,但我不知道如何让这个过程正常工作。有什么线索或提示吗?

EN

回答 2

Stack Overflow用户

发布于 2017-05-29 10:48:09

您可以使用Pandas Dataframe对象加载CSV,并以这种方式操作数据。

如果需要,您还可以遍历数据帧。

代码语言:javascript
运行
AI代码解释
复制
df = pd.read_csv('top2Mmm.csv', sep=';')
for index, row in train.iterrows():
    print(row['fieldName'])
票数 1
EN

Stack Overflow用户

发布于 2017-05-29 10:48:14

将数据(行)分成要素(X)和标签(Y)。然后,您可以将它们应用于,例如,SVM。

代码语言:javascript
运行
AI代码解释
复制
from sklearn.svm import SVC
clf = SVC()
clf.fit(X, y)

sklearn.svm reference

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/44240145

复制
相关文章
机器学习Python实践》——数据导入(CSV)
逗号分隔值(逗号分隔值,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。CSV文件由任意数目的记录组成,记录间以某种换行符分隔;记录每条由字段组成,字段间的分隔符是其它字符或字符串,常见最的的英文逗号或制表符。通常,所有记录都有完全相同的字段序列。通常都是纯文本文件。建议使用WORDPAD或是记事本(注)来开启,再则先另存新档后用EXCEL开启,也是方法之一。
DrugAI
2021/01/28
2.5K0
【算法】Python实现机器学习算法
小编邀请您,先思考: 1 您使用Python做过什么? 2 如何用Python实现决策树系列算法? 人生苦短,就用 Python。 在 Kaggle 最新发布的全球数据科学/机器学习现状报告中,来自
陆勤_数据人网
2018/04/18
1.9K0
【算法】Python实现机器学习算法
机器学习算法Python实现
目录 一、线性回归 1、代价函数 2、梯度下降算法 3、均值归一化 4、最终运行结果 5、使用scikit-learn库中的线性模型实现 二、逻辑回归 1、代价函数 2、梯度 3、正则化 4、S型函数(即) 5、映射为多项式 6、使用的优化方法 7、运行结果 8、使用scikit-learn库中的逻辑回归模型实现 逻辑回归_手写数字识别_OneVsAll 1、随机显示100个数字 2、OneVsAll 3、手写数字识别 4、预测 5、运行结果 6、使用scikit-learn库中的逻辑回归模型实现 三、BP
企鹅号小编
2018/01/09
2.3K0
机器学习算法Python实现
[置顶] 《Python机器学习算法》勘误
本书在出版的过程中已经经过详细的检查,但是大小问题依旧存在,感谢各位细心的读者为本书指出的错误。 第34页的错误在Python2.7.9版本上不会报错。 第1版第一次印刷勘误 页码 原文 修改 XVI (目录)12.3.2 Mean shift 12.3.2 DBSCAN 26 (程序清单1-11:第11行)h result 33 (程序清单2-3:第8行参数)feature, label, k, 5000, 0.2 feature, label, k, 10000, 0.4 34
felixzhao
2018/03/19
6690
[置顶] 《Python机器学习算法》的写作历程
前言 首先,感谢各位支持我博客的同学,你们的支持是我一直努力的动力,正是因为你们的支持,才有了《Python机器学习算法》一书的面世: 目前,该书已经可以在各大商城预定,以下罗列各大商城的购买链接:
felixzhao
2018/03/19
1.1K0
[置顶]
                        
                                                《Python机器学习算法》的写作历程
机器学习实战 | Python机器学习算法应用实践
教程地址:http://www.showmeai.tech/tutorials/41
ShowMeAI
2022/03/21
1.6K0
机器学习实战 | Python机器学习算法应用实践
Python学习:读取csv文件
CSV是Conma Sepatrate Values(逗号分隔值)的缩写,文档的内容是由‘,’分隔的一列列数据构成的。CSV格式是电子表格和数据库最常用的导入和导出格式。 CSV模块实现了以CSV格式读取和写入表格数据,它允许程序员以Excel首选格式写入数据,或者从Excel生成的文件中读取数据。
烤粽子
2021/07/07
2.8K0
Python学习:读取csv文件
Python算法解析:机器学习算法的实现与应用!
机器学习算法是一类可以从数据中学习并做出预测或决策的算法。它们广泛应用于各个领域,如图像识别、自然语言处理、推荐系统等。
测试开发囤货
2023/08/08
2290
Python算法解析:机器学习算法的实现与应用!
机器学习算法中的向量机算法(Python代码)
掌握机器学习算法并不是一个不可能完成的事情。大多数的初学者都是从学习回归开始的。是因为回归易于学习和使用,但这能够解决我们全部的问题吗?当然不行!因为,你要学习的机器学习算法不仅仅只有回归!
商业新知
2019/06/28
1.5K0
机器学习算法中的向量机算法(Python代码)
机器学习-常用的机器学习算法
谷歌的自动驾驶汽车和机器人得到了很多新闻,但该公司真正的未来是机器学习,这种技术使计算机变得更聪明,更个性化。 - Eric Schmidt(谷歌主席)
XXXX-user
2019/09/12
5880
Python & R编码常见的机器学习算法
在拿破仑•希尔的名著《思考与致富》中讲述了达比的故事:达比经过几年的时间快要挖掘到了金矿,却在离它三英尺的地方离开了! 现在,我不知道这个故事是否真实。但是,我肯定在我的周围有一些跟达比一样的人,这些人认为,机器学习的目的就是执行以及使用2 – 3组算法,而不管遇到什么问题。他们不去尝试更好的算法和技术,因为他们觉得太困难或耗费时间。 像达比一样,他们无疑是在到达最后一步的时候突然消失了!最后,他们放弃机器学习,说计算量非常大、非常困难或者认为自己的模型已经到达优化的临界点——真的是这样吗下面这些内
小莹莹
2018/04/20
8070
Python & R编码常见的机器学习算法
用于入门的最佳机器学习资源
这是一个非常难写的文章,因为我希望它是真正有价值的。
天空
2018/02/07
1.2K0
【Python环境】Python &R编码常见的机器学习算法
在拿破仑•希尔的名著《思考与致富》中讲述了达比的故事:达比经过几年的时间快要挖掘到了金矿,却在离它三英尺的地方离开了! 现在,我不知道这个故事是否真实。但是,我肯定在我的周围有一些跟达比一样的人,这些
陆勤_数据人网
2018/02/26
6990
【Python环境】Python &R编码常见的机器学习算法
用于脑机接口的机器学习
(原文MACHINE LEARNING TECHNIQUES FOR BRAIN-COMPUTER INTERFACES K.-R. Müller, M. Krauledat, G. Dornhege, G. Curio, B. Blankertz)
一口盐汽水
2021/10/09
1.2K0
【Python环境】Python & R编码常见的机器学习算法
在拿破仑•希尔的名著《思考与致富》中讲述了达比的故事:达比经过几年的时间快要挖掘到了金矿,却在离它三英尺的地方离开了! 现在,我不知道这个故事是否真实。但是,我肯定在我的周围有一些跟达比一样的人,这些
陆勤_数据人网
2018/02/27
6070
【Python环境】Python & R编码常见的机器学习算法
python光流法算法学习「建议收藏」
光流法是空间运动物体在观察成像平面上的像素运动的瞬时速度,是利用图像序列中像素在时间域上的变化以及相邻帧之间的相关性来找到上一帧跟当前帧之间存在的对应关系,从而计算出相邻帧之间物体的运动信息的一种方法。一般而言,光流是由于场景中前景目标本身的移动、相机的运动,或者两者的共同运动所产生的。 简单来说,光流是空间运动物体在观测成像平面上的像素运动的“瞬时速度”。光流的研究是利用图像序列中的像素强度数据的时域变化和相关性来确定各自像素位置的“运动”。研究光流场的目的就是为了从图片序列中近似得到不能直接得到的运动场。
全栈程序员站长
2022/09/15
1.7K0
Python机器学习--决策树算法
一、决策树原理 决策树是用样本的属性作为结点,用属性的取值作为分支的树结构。 决策树的根结点是所有样本中信息量最大的属性。树的中间结点是该结点为根的子树所包含的样本子集中信息量最大的属性。决策树的叶结点是样本的类别值。决策树是一种知识表示形式,它是对所有样本数据的高度概括决策树能准确地识别所有样本的类别,也能有效地识别新样本的类别。 决策树算法ID3的基本思想: 首先找出最有判别力的属性,把样例分成多个子集,每个子集又选择最有判别力的属性进行划分,一直进行到所有子集仅包含同一类型的数据为止。最后得到一棵决
机器学习AI算法工程
2018/03/13
1.4K0
Python机器学习--决策树算法
机器学习算法Python实现--逻辑回归
传送门:https://github.com/lawlite19/MachineLearning_Python/tree/master/LogisticRegression
统计学家
2019/04/10
7430
机器学习算法Python实现--逻辑回归
Python 机器学习算法实践:树回归
本文介绍了决策树算法在机器学习中用于回归预测的常见方法,包括ID3、C4.5和CART等。同时,文章还探讨了如何使用回归树进行模型选择和剪枝,并给出了相应的Python代码示例。最后,文章对回归树模型和简单的标准线性回归模型进行了对比,并通过示例展示了回归树在复杂数据集上的预测效果。
企鹅号小编
2018/01/05
1.4K0
Python 机器学习算法实践:树回归
Python手写机器学习最简单的KNN算法
今天开始,我打算写写机器学习教程。说实话,相比爬虫,掌握机器学习更实用竞争力也更强些。
AI科技大本营
2019/06/14
1.1K0

相似问题

用于OpenCV机器学习算法的CSV格式

10

用于数据分类的机器学习算法。

29

机器学习算法

30

用于机器学习算法的Flink HBase输入

14

编写用于神经网络机器学习Python的CSV文件

17
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档