首页
学习
活动
专区
圈层
工具
发布
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    探索数据科学与机器学习中的视觉表达【Matplotlib实战指南】

    在数据科学和机器学习领域,数据可视化是一项至关重要的任务。它不仅可以帮助我们更好地理解数据,还能够有效地传达数据的洞察和趋势。...而在 Python 中,Matplotlib 是一个强大而灵活的工具,可以用来创建各种类型的数据可视化图表,从简单的折线图到复杂的热图都能胜任。1....如果你使用的是 Anaconda 环境,可以通过以下命令安装:conda install matplotlib如果使用 pip:pip install matplotlib2....Matplotlib 提供了丰富的工具和方法来实现动态更新图表。...Matplotlib 提供了丰富的功能和灵活的接口,使得我们能够轻松地进行数据可视化工作,并且能够满足各种不同场景下的需求。

    62410

    (数据科学学习手札100)搞定matplotlib中的字体设置

    被广泛用于数据分析之中,但不太友好的是matplotlib中书写非英文文字内容时,如果不事先对字体进行相关设置,会发现绘制出的诸如中文等均显示为方块乱码,而今天的内容,我们就来小小总结一下matplotlib...image.png 2 在matplotlib中设置字体的常用方法   在matplotlib中设置字体的方法按作用范围可分为全局设置与临时设置: 2.1 在matplotlib中设置全局字体   我们在默认状态下使用...matplotlib书写中文内容时之所以显示出乱码,是因为matplotlib默认的字体为英文字体,导致许多unicode编码的语言文字都无法书写。   ...所谓系统自带字体,譬如对于windows,其系统盘Windows/Fonts下的诸多已安装到系统中的字体: image.png 图2   当然,matplotlib可以检测到的字体不止上述的这些,我们可以通过下列方式查看...matplotlib中默认已经识别到的所有可用字体: import matplotlib.pyplot as plt from matplotlib import font_manager for font

    66510

    (数据科学学习手札100)搞定matplotlib中的字体设置

    被广泛用于数据分析之中,但不太友好的是matplotlib中书写非英文文字内容时,如果不事先对字体进行相关设置,会发现绘制出的诸如中文等均显示为方块乱码,而今天的内容,我们就来小小总结一下matplotlib...图1 2 在matplotlib中设置字体的常用方法   在matplotlib中设置字体的方法按作用范围可分为全局设置与临时设置: 2.1 在matplotlib中设置全局字体   我们在默认状态下使用...matplotlib书写中文内容时之所以显示出乱码,是因为matplotlib默认的字体为英文字体,导致许多unicode编码的语言文字都无法书写。   ...而全局设置字体的方式,指的是我们可以通过修改本地配置文件或在程序开头设置字体相关参数,从而人为地为当前kernel下的matplotlib规定使用指定的字体,主要有以下几种情况: 使用系统自带字体   ...图2   当然,matplotlib可以检测到的字体不止上述的这些,我们可以通过下列方式查看matplotlib中默认已经识别到的所有可用字体: import matplotlib.pyplot as

    64120

    (数据科学学习手札149)用matplotlib轻松绘制漂亮的表格

    本文示例代码已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介   大家好我是费老师,matplotlib作为数据可视化的强力工具...,可以帮助我们自由创作各式各样的数据可视化作品,其中matplotlib.pyplot.table模块就专门用于绘制表格,但是由于参数复杂,且默认样式单一简陋,想基于它绘制出美观的表格需要花费不少功夫。...而我最近发现的一个基于matplotlib的第三方库plottable,用它来生成数据表格图既简单又美观,今天的文章中费老师我就来带大家学习它的常用方法~ 2 基于plottable绘制漂亮的表格   ...使用pip install plottable完成安装后,我们先从一个简单的例子了解其基础的使用方式: 2.1 从简单例子出发 plottable的基础使用很简单,在已有数据框的基础上,直接调用plottable...控制表格奇数偶数行底色   通过在Table()中设置参数odd_row_color和even_row_color,我们可以传入matplotlib中合法的色彩值进行表格奇数偶数行底色的设置: 2.2.2

    1.8K10

    7个有用的Pandas显示选项

    =(100,25)) df = pd.DataFrame(arr_data) df 要查看显示上的更多列,可以更改display.max_columns参数 pd.set_option('display.max_columns...3、禁止科学记数法 通常在处理科学数据时,你会遇到非常大的数字。一旦这些数字达到数百万,Pandas就会将它们重新格式化为科学符号,这可能很有帮助,但并不总是如此。...这将重新格式化显示,使其具有不带科学记数法的值和最多保留小数点后3位。...可以使用matplotlib来构建一个plot,但是在Pandas中可以使用.plot()方法使用几行代码来完成它。...Pandas为我们提供了一系列可以使用的绘图库: matplotlib hvplot >= 0.5.1 holoviews pandas_bokeh plotly >= 4.8 altair 要更改当前的默认绘图库

    2K40

    数据科学 IPython 笔记本 8.15 Matplotlib 中的三维绘图

    8.15 Matplotlib 中的三维绘图 原文:Three-Dimensional Plotting in Matplotlib 译者:飞龙 协议:CC BY-NC-SA 4.0 本节是《Python...数据科学手册》(Python Data Science Handbook)的摘录。...Matplotlib 最初设计时只考虑了二维绘图。在 1.0 版本发布时,一些三维绘图工具构建在 Matplotlib 的二维显示之上,结果是一组方便(但是有限)的三维数据可视化工具。...,当使用 Matplotlib 的交互式后端之一时,通过单击和拖动可以交互式地完成这种类型的旋转。...例如,实际上可以使用它绘制三维莫比乌斯条带,我们将在下面看到。 示例:可视化莫比乌斯带 莫比乌斯条带类似于旋转 90 度而拼接的纸条。在拓扑上,它非常有趣,因为外观只有一面!

    2.4K30

    Metaflow|Kubernetes上以人为中心的数据科学

    AWS 上以人为中心的数据科学 Netflix 在 2019 年开源 Metaflow[9]时,我们使用亚马逊网络服务提供的服务提供了一条毕业路径: AWS Batch 为第二阶段提供了一个简单的解决方案...新:Kubernetes 上的 Metaflow AWS 原生路径的最大好处——它的简单性——也可能是它最大的弱点。...事实上,你过去使用 run --with batch 的任何流现在都可以使用 run --with kubernetes 运行,而无需对代码进行任何更改!...新:Argo Workflows 上的 Metaflow 为了在 Kubernetes 上原生支持生产级工作流编排(第 3 阶段),我们选择了Argo Workflows[12]。...我们致力于确保 Argo Workflows 是 Kubernetes 上最强大和可扩展的工作流编排器,能够满足最苛刻的组织的需求。

    1.1K10

    数据科学大佬的简历上都有哪些技能?

    作者:George Liu 编译:wLsq 如果你是一个数据科学的求职者,那么你一定想知道在你的简历上应该写些什么技能会有更大的概率接到面试。...▍Python现在是数据科学的首选语言 有很多人争论:Python和R,哪个是数据科学的首选语言。 市场需求报告告诉我们Python是现代的领导者。同样值得注意的是,R比SAS更少提及。...因此,如果您正在考虑进入数据科学,可以将你的学习重点放在Python上。而SQL作为数据库语言,是数据科学家第二重要的语言。 由于数据科学家职业的广泛性,其他语言也扮演着重要角色。...但对于数据科学家而言,Shiny,Matplotlib,ggplot和Seaborn也同样得重要。 ? ▍每个人都必须会Git,而Docker仅适用于工程师 ?...▍数据科学家:更关注机器学习 数据科学家一直被视为需要统计,分析,机器学习和商业知识的全方位专业。然而,现在从词云比重看来,数据科学家们更多地关注机器学习而不是其他的一些东西。 ? ?

    76430

    数据科学大佬的简历上都有哪些技能?

    作者:George Liu 编译:wLsq 来源:Python数据科学 如果你是一个数据科学的求职者,那么你一定想知道在你的简历上应该写些什么技能会有更大的概率接到面试。...▍Python现在是数据科学的首选语言 有很多人争论:Python和R,哪个是数据科学的首选语言。 市场需求报告告诉我们Python是现代的领导者。同样值得注意的是,R比SAS更少提及。...因此,如果您正在考虑进入数据科学,可以将你的学习重点放在Python上。而SQL作为数据库语言,是数据科学家第二重要的语言。 由于数据科学家职业的广泛性,其他语言也扮演着重要角色。...但对于数据科学家而言,Shiny,Matplotlib,ggplot和Seaborn也同样得重要。 ? ▍每个人都必须会Git,而Docker仅适用于工程师 ?...▍数据科学家:更关注机器学习 数据科学家一直被视为需要统计,分析,机器学习和商业知识的全方位专业。然而,现在从词云比重看来,数据科学家们更多地关注机器学习而不是其他的一些东西。 ? ?

    65730

    (数据科学学习手札128)在matplotlib中添加富文本的最佳方式

    本文示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介   长久以来,在使用matplotlib...,它设计了一套类似ggtext的语法方式,使得我们可以用一种特殊的语法在matplotlib中构建整段富文本,下面我们就来get它吧~ 2 使用flexitext在matplotlib中创建富文本   ...flexitext import flexitext import matplotlib.pyplot as plt # 将幼圆与楷体插入到matplotlib字体库中 plt.rcParams['...,关于matplotlib中的字体设置相关知识你可以参考我以前写过的搞定matplotlib中的字体设置https://www.cnblogs.com/feffery/p/14122415.html,下面分别演示系统自带的字体...,以及自行注册导入的自定义字体是如何在flexitext中使用的(其中每种字体的name你可以通过font_manager.fontManager.ttflist查看): from matplotlib

    2.6K20

    关于 IEEE 754 浮点数一些设计细节的疑问解释

    ,二进制表示就是 -110.101,那么使用浮点数表示 6.625 的话,内存中实际存储的比特位是这个样子的: 其实可以观察到,浮点数的存储,本质上就是二进制的科学记数法:由一个有效数字(绿色部分),...其实 0 也是可以的,但是这样其实就浪费了一个位的精度了。 我们知道浮点数在内存中的表示,其实就是二进制的科学记数法。...0.365 * 10^5 => 3.65 * 10^4 二进制的科学记数法也是一样的,我们为了高效简介的表达,也像十进制的科学记数法一样,规定有效数字的整数部分不能是 0(因为前导 0 是无效数字...也就是说,例如 111010 它的二进制科学记数法是 1.11010 * 2^5 而不是 0.111010 * 2^6,因为这种表示不是最高效简介的表示方法 但是专家们很快发现:既然都规定了科学记数法有效数字的整数部分不能是...对于浮点数,我们进行大小比较的时候,其实就是比较两个科学记数法表示的数字,所以第一步肯定是先比较他们的数量级。

    1.9K20

    小课堂 | POI读取科学记数法字段不准确?问题复现、尝试和解决

    上周,有一个简单的跑批任务,跑批之前对文件进行了解析和比对,发现针对科学记数法表示的统一社会信用代码,POI读取出来后与原值不一致。 本文记录一下问题复现、所做尝试、问题解决以及如何防止。...问题重现 原始数据 具体内容如下: 问题重现 读取含有科学记数法的Excel文件,重现问题。...思考 针对涉及诸如身份证号、社会信用统一代码等长字段的Excel导入,读取时需要较为小心,如遇到纯数字的场景,会采用科学记数法记录,POI读取的时候可能不准确。...在上述的测试中,貌似纯数字长度大于11位的时候会转换成科学记数法。...我们可以增加一层校验,如读取的内容是数字类型,且使用了科学记数法,可以提示一下,如“xxx包含科学记数法,请转换成文本格式再进行导入”。

    1.1K110

    命令行上的数据科学第二版:十、多语言数据科学

    在我看来,通晓多种语言的数据科学家是指使用多种编程语言、工具和技术来获取、清理、探索和建模数据的人。 命令行刺激了多语言方法。命令行并不关心工具是用哪种编程语言编写的,只要它们遵循 Unix 的理念。...此外,我们直接在 CSV 文件上执行 SQL 查询,并从命令行执行 R 表达式。简而言之,在没有完全意识到的情况下,我们已经在做多语言数据科学了! 在这一章中,我将进一步翻转它。...因为说实话,我们不会把整个数据科学生涯都花在命令行上。对于我来说,当我分析一些数据时,我经常使用 RStudio IDE,当我实现一些东西时,我经常使用 Python。...10.2 Jupyter Project Jupyter 是一个开源项目,诞生于 2014 年的 IPython 项目,因为它发展到支持跨所有编程语言的交互式数据科学和科学计算。...在这里,我将它拆分到每个换行符上,以计算pattern出现的次数。 这个命令行工具的用法如下: $ .

    1.5K20
    领券