暂无搜索历史
最具性价比的数据表达是用图表,用好图表的关键是基于数据本身的结构和内容,加上自己的分析视角 来选择适合的图形组合:
前几天写了 一组数据推算居民收入分布!被网友喷太简单了。今天来点难度,数据从一维升级到二维,并使用更高级的“多维标度”分析法来做数据的可视化。
最近看过很多居民收入的分布图,很困惑他们的数据从哪里来,怎么统计的,数据可信度高吗?
训练一个优秀的算法模型,本质上是数据、特征与模型三者协同优化的过程。 一、数据质量:模型训练的基石 在数据采集阶段,"源数据完整性"和"数据收集时效性"的...
本文清晰呈现,如何使用deepseek辅助我们高效的完成数据分析。从国家统计局下载了最近12年的全国居民主要食品消费数据,数据准备好后,我们开始PUA-deep...
我的小站 www.javacn.site,面试题贼多!
开源中国GVP
2025年是AI的爆发之年,gpt、deepseek、grok3等相互竞向奔跑。AI给我们的工作生活带了新的机遇与挑战。如果更好的拥抱AI,需要从认识AI开始。
大数据血缘主要体现在表与表之间的关系,描述了我的数据从哪里来,经过怎样的关联处理,流到哪里去,弄清楚关系是做数据治理的关键一环。
第一步:打开IDE(Pycharm):设置-插件-下载Continue,安装完成重启。
第二种,是逻辑删除,使用 update的方式标记记录状态is_delete=1,下游使用记录状态隔离无效数据。
使用sklearn包下的朴素贝叶斯算法,它包含三种模型——高斯模型、多项式模型和伯努利模型, 本文将使用贝叶斯多项式模型类来解决英文邮件分类的问题。
本文是一篇技术实战的记录:使用Python 爬取 豆瓣书评,结构化存取Mysql数据,并通过jieba分词 剥离书评关键词,基于词频制作词云图,让数据可视化。 ...
世界分成物理原子和信息比特两个部分,原子是物质单位,比特是信息单位,互联网一个是用移动比特代替移动原子,一个用移动比特辅助移动原子。 如果信息本身就是目的,你...
作为职场“老马”,做过电商运营系统开发、做过BI、目前在做数仓。不同的需求场景,要求研发对“数据”的掌控能力有很大不同。
SQL查询中 不同类型的字段 比较时,会强制做字段类型转换。保证比较字段二者类型的一致。
根本原因:一维抽象的文字语言很难描述三维的世界, 文字语言译成“具象的事物 ”很难做到“信达雅”。