暂无搜索历史
虚拟机可以在我们自己的电脑上安装一个独立的系统,在测试软件或者想要使用其他系统的场景下还是挺方便的。
(它用于切换当前目录,它的参数是要切换到的目录的路径,可以是绝对路径,也可以是相对路径)
例3:ls -ltr 查看当前目录详细列表,按时间顺序逆序排序,最近修改的文件在后面
预处理数据包括:特征的标准化,数据的正则化,特征的二值化,非线性转换,数据特征编码,缺失值插补,生成多项式特征等。
有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。根据特征使用方案,有计划地获取、处理和监控数据和特征的工作称之为特...
预处理数据包括:数据的标准化,数据的归一化,数据的二值化,非线性转换,数据特征编码,处理缺失值等。
使用Python中的三个库可以优雅地进行数据分析,得到一只野生的Matlab,这三个库是numpy,pandas 和 matplotlib。 numpy是高性...
特征列 通常用于对结构化数据实施特征工程时候使用,图像或者文本数据一般不会用到特征列。
如果想从事数据挖掘或者机器学习的工作,掌握常用的机器学习算法是非常有必要的,在这简单的先捋一捋, 常见的机器学习算法:
PCA主成分分析算法(Principal Components Analysis)是一种最常用的降维算法。能够以较低的信息损失(以样本间分布方差衡量)减少特征数...
贝叶斯法则可能是概率论中最有生命力的一个公式。它可以用来计算条件概率或者主观概率。
决策树是一种非参数的监督学习方法,它主要用于分类和回归问题。 决策树模型通过一系列if then决策规则的集合,将特征空间划分成有限个不相交的子区域,对于落在...
DBSCAN是一种非常著名的基于密度的聚类算法。其英文全称是 Density-Based Spatial Clustering of Applications ...
概括性统计包括平均值、分位值、标准差。.describe方法能计算DataFrame中数值列的统计信息:
该项目侧重于使用Python进行B2B营销的探索性数据分析(EDA)。将使用来自Olist的数据,Olist是一个将中小型企业与巴西顶级市场连接起来的电子商务平...
探索性数据分析(Exploratory Data Analysis,简称EDA),是指对已有的数据在尽量少的先验假设下进行探索,通过作图、制表、方程拟合、计算特...
数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识...
知乎 | https://www.zhihu.com/people/xu-xiu-jian-33
为了更好地掌握数据科学必备库Pandas的基本使用,本文通过精灵宝可梦的数据集实战,我们一起过一遍Pandas的基本操作,文中的代码都附有注释,并给出了结果的配...
暂未填写公司和职称
暂未填写个人简介
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市
TA 很懒,什么都没有留下╮(╯_╰)╭