Python 编程
编程可以极大地提高我们收集和分析世界信息的能力,而这些信息又可以通过上一节所述的谨慎推理来发现。 在数据科学中,编写程序的目的是,指示计算机执行分析步骤。 电脑无法自行研究世界。 人们必须准确描述计算机应该执行什么步骤来收集和分析数据,这些步骤是通过程序来表达的。小编推荐大家加一下这个群:330637182 这个群里好几千人了!大家遇到啥问题都会在里面交流!而且免费分享零基础入门资料 web开发 爬虫资料一整套!是个非常好的学习交流地方!也有程序员大神给大家热心解答各种问题!很快满员了。欲进从速哦!各种PDF等你来下载!全部都是免费的哦!所以小编在群里等你们过来一起交流学习呢!
表达式
编程语言比人类语言简单得多。 尽管如此,在任何语言中,还是有一些语法规则需要学习,这里就是我们开始的地方。 在本文中,我们将使用 Python 编程语言。 学习语法规则是必不可少的,最基本的程序中使用的规则也是更复杂程序的核心。
常用操作符。 数据科学通常涉及数值的组合,而编程语言中的一组操作符,是为了使得表达式可以用于表示任何类型的算术。 在Python中,以下操作符是必不可少的。
Python 表达式遵循熟悉的优先级规则,与代数中相同:乘法和除法在加法和减法之前计算。 圆括号可以用来在较大的表达式中,将较小的表达式组合在一起。
示例
这里是一个图表, 20 世纪 80 年代初期的“华盛顿邮报”(The Washington Post),试图比较几十年来医生的收入与其他专业人员的收入。 我们是否真的需要在每个条形上看到两个头(一个带有听诊器)? 耶鲁大学教授爱德华·图夫特(Edward Tufte)是世界上量化信息可视化的专家之一,他为这种不必要的修饰创造了“垃圾图表”(chartjunk)一词。 这张图也是 Tufte 痛恨的“数据与油墨比例过低”的一个例子。
Ross Ihaka 的图片版本
在 1939 年到 1963 年间,医生的收入从 3,262 美元增加到 25,050 美元。 所以在这个时期,每年的平均收入增加了大约 900 美元。
数值
整数值
浮点值
浮点值非常灵活,但他们有限制。
示例:增长率
相同数量在不同时间取得的两次测量值之间的关系通常表示为增长率。 例如,美国联邦政府在 2002 年雇用了 276.6 万人,在 2012 年雇用了 281.4 万人。为了计算增长率,我们必须首先决定将哪个值作为初始值。 对于随着时间变化的数值,较早的值是一个自然的选择。 然后,我们将变动值和初始值之间的差除以初始值。
联邦预算增长 42.6% 远高于联邦雇员增长 1.74%。 实际上,联邦雇员的数量增长速度远远低于美国人口。美国人口同期增长 9.21%,从 2002 年的 2.8760 亿人增加到 2012 年的 3.41 亿。
调用表达式
调用表达式调用函数,这些函数是具名操作。 函数名称首先出现,然后是括号中的表达式。
示例
1869 年,一位名叫查尔斯·约瑟夫·米纳德(Charles Joseph Minard)的法国土木工程师,创造了一个图表,仍被认为是有史以来最伟大的图表之一。 它显示了拿破仑军队从莫斯科撤退期间的损失。 1812 年,拿破仑开始征服俄罗斯,他的军队中有超过 35 万人。他们确实到达了莫斯科,但是沿路一直受到损失的困扰。 俄国军队不断撤退到俄罗斯深处,故意焚烧田野,并在撤退时摧毁村庄。 这使法国军队在俄罗斯冬季来临之时,没有食物或避难所。法国军队在莫斯科没有取得决定性的胜利就撤退了。 之后天气变冷,死了更多的人。 回来的人还不到一万。
Tufte 说 Minard 的图是“可能是有史以来最好的统计图表”。
这里是 Minard 数据的一个子集,取自 Leland Wilkinson 的 The Grammar of Graphics。
在莫斯科的战斗中,人数下降了 45%。 换句话说,进入莫斯科的拿破仑的军队中,有几乎一半的人没有继续前进。
正如你在图表中看到的,Moiodexno 非常接近军队出发位置 Kowno。 在前进期间进入 Smolensk 的人中,只有不到 10% 的人在返回的途中到达了 Moiodexno。
一脸懵逼就对了!哈哈,如有侵权请联系小编删除!
领取专属 10元无门槛券
私享最新 技术干货