但是,基于DBLP数据集这些基本的元素,可以挖掘、利用的也是很多。例如官网给出的统计信息,就能引申出很多东西。...http://dblp.uni-trier.de/xml/ dblp原始数据集示例 dblp数据集建表语句 /* Navicat MySQL Data Transfer Source Server : localmysql Source Server Version...Mr.B 此代码修正了上述不足,然后将解析后字段导入数据库 读取数据:dblp.xml 2.01G 导入Mysql:170万+ 导入表:visual_dataset.dblp...() 对于dblp数据的使用 (待续)
前一段时间利用大名鼎鼎的DBLP数据集做关于论文合作关系推荐的实验,感觉确实是一个非常不错的数据集,可挖掘的东西很多很多,在此对DBLP及其用法做一个简单介绍。...官网发了这篇文章,对DBLP做了详细解释。 另外,DBLP数据开放免费,版权和许可在这。 提供的服务 DBLP的支持团队基于DBLP数据做了很多工作。...提供各种搜索、统计等服务,并提供了API和可下载数据集。这里有些有意思的统计数据,并用google chart tool做了可视化处理。... DBLP可下载数据集 下载地址在这 。 其中:dblp.xml是我们需要的数据集。dblp.dtd是格式说明文件。解析的时候和前者放在一 起。...但是,基于DBLP数据集这些基本的元素,可以挖掘、利用的也是很多。例如官网给出的统计信息,就能引申出很多东西。
下载数据集请登录爱数科(www.idatascience.cn) 其记录了2014年之前天文学家在恒星(除了太阳)周围发现的行星的信息。 1. 字段描述 2. 数据预览 3....数据来源 来源于UCI机器学习库。
下载数据集请登录爱数科(www.idatascience.cn) 由电商平台爬取的图书信息,包括书名、出版信息、当前价格等。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4....数据来源 当当网搜索页面爬取。
下载数据集请登录爱数科(www.idatascience.cn) 该数据集记录了一家全球超市4年的订购数据,包含订单的订单号、下单时间、发货时间、运输模式、顾客名称和地区等信息。 1....数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。
下载数据集请登录爱数科(www.idatascience.cn) 通过物理测量预测鲍鱼的年龄。...从原始数据中删除了缺失值的样本,并且对连续值的范围进行了缩放。数据集共4177个样本,8个字段 1. 字段描述 2. 数据预览 3. 字段诊断信息 4....数据来源 Warwick J Nash, Tracy L Sellers, Simon R Talbot, Andrew J Cawthorn and Wes B Ford (1994) "The Population...数据引用 Nash W J, Sellers T L, Talbot S R, et al.
下载数据集请登录爱数科(www.idatascience.cn) 小费数据集 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源
下载数据集请登录爱数科(www.idatascience.cn) 数据集由 Jose Portilla 和 Pierian Data 为他的 Udemy 课程(Python 数据科学和机器学习训练营)...创建,适合用于数据分析与逻辑回归预测。...数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。
下载数据集请登录爱数科(www.idatascience.cn) 本数据集包含北美2017年驾驶员在城市中寻找停车位的情况(只包含人口超过10万的城市)。...可以用本数据集识别停车存在困难的区域,并辅助城市标志牌的设置。 1. 字段描述 2. 数据预览 3. 字段诊断信息
下载数据集请登录爱数科(www.idatascience.cn) 该数据集包括 2013-2021 年美国一级大学篮球赛季的数据。 1. 字段描述 2. 数据预览 3....数据来源 来源于Kaggle。
下载数据集请登录爱数科(www.idatascience.cn) 一家汽车公司计划利用其现有产品(P1,P2,P3,P4和P5)进入新市场。...数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。
下载数据集请登录爱数科(www.idatascience.cn) 该数据集提供了用于统计的欧洲领土单位命名,缩写为 NUTS(来自法语Nomenclature des Unités regiones...数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。 5. 数据引用 https://ec.europa.eu/eurostat/data/database
下载数据集请登录爱数科(www.idatascience.cn) 一家位于新加坡的第三方旅行保险服务公司的数据,用于预测索赔状态。 1. 字段描述 2. 数据预览 3....数据来源 来源于Kaggle。
下载数据集请登录爱数科(www.idatascience.cn) 共享单车在过去的十几年内在世界范围内得到了广泛的推广。...这份数据集是在2011-2012年收集的有关于每天的共享单车租赁信息,十年后共享单车市场或许发生了改变,但人们租赁共享单车的使用习惯会改变吗? 1. 字段描述 2. 数据预览 3....数据来源 来源于Kaggle。
下载数据集请登录爱数科(www.idatascience.cn) 该数据是从Google图书商店获取的。使用Google API来获取数据。数据集中为每本书收集了九种属性。 1. 字段描述 2....数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。
下载数据集请登录爱数科(www.idatascience.cn) 这是对公司人力资源有用的数据集。公司记录员工的不同参数(例如满意度,薪水,晋升次数,离职等)。...该数据集可用于预测员工是离开公司还是留在公司。。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。
下载数据集请登录爱数科(www.idatascience.cn) 本数据集包含航班的起点、终点、定价、所含服务等信息,可用于预测航班票价。 1. 字段描述 2. 数据预览 3.
数据集下载请登录爱数科(www.idatascience.cn) 根据世界卫生组织(WHO)的数据,中风是全球第二大死亡原因,约占总死亡人数的11%。...该数据集用于根据输入参数(例如性别,年龄,各种疾病和吸烟状况)预测患者是否可能中风。数据中的每一行都提供有关患者的相关信息。 1. 字段描述 2. 数据预览 3. 字段诊断信息
下载数据集请登录爱数科(www.idatascience.cn) 这个数据集涵盖了过去6年苹果公司的股价。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4....数据来源 来源于Kaggle。
下载数据集请登录爱数科(www.idatascience.cn) 人口稠密的城市中超市数量在快速增加,市场竞争也很激烈。...该数据集记录了几家超市在3个不同分店中3个月的历史销售额,包含顾客性别、商品单价、销售数量、销售日期、总收入和顾客评价等信息。预测数据分析方法很容易应用于此数据集。 1. 字段描述 2....数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。
领取专属 10元无门槛券
手把手带您无忧上云