编辑丨极市平台 3D-IRCADB 脏器分割数据集 数据集链接:http://m6z.cn/6x5OSn 3D-IRCADb-01 数据库由 10 名女性和 10 名男性 75% 的肝肿瘤患者的 3D...FASCICLE 小腿肌肉超声数据集 数据集链接:http://m6z.cn/631rex FAscicle 小腿肌肉超声数据集是一个由 812 幅小腿肌肉超声图像组成的数据集,用于分析肌肉弱点并预防受伤...肿瘤数据集 数据集链接:http://m6z.cn/5zCyGj 这一数据集是通过仔细注释几名患有不同器官肿瘤并在多家医院被诊断出的患者的组织图像获得的。...结直肠腺癌组织学图像数据集 数据集链接:http://m6z.cn/6axBLk 该数据集包含 100 张 H&E 染色的结直肠腺癌组织学图像。...淋巴结切片的组织病理学数据集 数据集链接:http://m6z.cn/6axBNq 本数据集由从淋巴结切片的组织病理学扫描中提取的 327.680 张彩色图像 (96 x 96px) 组成。
0x00 前言 数据为王,使用相同机器学习算法,不同质量的数据能训练出不同效果的模型。本文将分享数据科学领域中经典的几个开源数据集。...正文分三部分: 详细介绍最常用的几个经典数据集 介绍如何使用 Python 优雅地观察数据集 其它开源数据集的获取方式 0x01 经典数据集 一、概述 下面表格中是居士整理的一些最常用的数据集,基本上能用于整个机器学习的过程中...Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。是由杰出的统计学家R.A.Fisher在20世纪30年代中期创建的,它被公认为用于数据挖掘的最著名的数据集。...七、MNIST MNIST数据集机器学习领域内用于手写字识别的数据集,数据集中包含6个万训练集、10000个示例测试集。,每个样本图像的宽高为28*28。...0x03 其它 一、UCI数据集 UCI数据集中包括了众多用于监督式和非监督式学习的数据集,数量大概400多个,其中很多数据集在其他众多数据工具中被反复引用,例如Iris、Wine、Adult、Car
Huggingface排行榜默认数据集 Huggingface开源大模型排行榜: Open LLM Leaderboard - a Hugging Face Space by HuggingFaceH4...Huggingface数据集:Hugging Face – The AI community building the future....本文主要介绍Huggingface开源大模型排行榜上默认使用的数据集以及如何搭建自己的大模型评估工具 搭建大模型评估工具 1.下载数据集到本地 from datasets import load_dataset...包含1.0.0、2.0.0、3.0.0三个子集,每个子集包含train、validation、test三种数据集。...包含113子集,每个子集包含train、validation两种数据集。
在机器学习任务实施前,如何快速寻找到可用数据集,是令每一位研究人员最头痛的事情。本文为大家列举了八大主流数据集来源,不仅包含大量的数据集信息,而且包含了描述、用法以及一些实施案例等。...01 Kaggle数据集 Kaggle数据集地址 https://www.kaggle.com/datasets 这是我最喜欢的数据集之一,每个数据集都对应于一个小型社区,你可以在其中讨论数据、查找公共代码...这里包含了大量不同类型、不同结构的数据集内容。同时,还可以在其中获取到与每个数据集关联的资料,其中包含了许多数据科学家们提供的数据集分析笔记等。...根据机器学习问题的类型对数据集进行分类,可找到单变量或多变量时间序列数据集,以及分类、回归或推荐系统的数据集。...其中列出的大多数数据集都是免费的,但在使用任何数据集之前,均需检查数据集的许可要求。
本文来源于 GitHub 仓库 youngguncho/awesome-slam-datasets,整理出了几乎所有提供姿位姿和地图信息的各种 SLAM 数据集。...Generation and Benchmarking of SLAM Algorithms for Robotics and VR/AR workshop 中的相关数据集(如The UZH-FPV...Drone Racing Dataset 无人机快速竞赛数据集)。...00 总览 本文不仅收集了各式各样的数据集,和评估工具,并对其进行了按照不同标准的分类,供大家快速选择。...下图对每个数据集的来源机构,年份,环境,是否包含 GT pose,GT Map,IMU,GPS,语义标签,LIDAR,相机,事件相机,深度相机,雷达,声纳,多普勒速度记录,或其他相关信息进行了总结。
此外,由于人和四足动物在身体结构上的相似性,不难引发研究人员对基于人体姿态估计的预训练模型可能会对大规模动物姿态数据集的训练效果起到促进作用的猜想。...本文分享了一些姿态估计的开源模型和数据集,涵盖了人体姿态和动物姿态。希望这些资源能够帮助研究人员促进这两者技术的共同发展,实现全面开花。...,支持 21 种算法、34 种数据集、14 种主流骨干。...AlphaPose 还是首个在 COCO 数据集上实现了 70+ mAP(75 mAP)和 MPII 数据集上实现了 80+ mAP(82.1 mAP)的开源系统。...id=rH8yliN6C83 17个关键点的定义 动物种类分布 Human3.6M Human3.6M 数据集是一个 3D 人体姿态识别的数据集,通过 4 个经过校准的摄像机拍摄获得,对于 3D 人体的
编辑丨极市平台 导读 本文总结整理了10个开源的人脸识别数据集,并附有相关下载链接,希望能给大家带来一些帮助。...LFW 数据集。...2.CelebA人脸数据集 数据集链接:http://m6z.cn/60EW0n CelebFaces Attributes Dataset (CelebA) 是一个大规模的人脸属性数据集,包含超过 20...6.PersonID人脸识别数据集 数据集链接:http://m6z.cn/5So6vR 该数据集所选用的人脸照片均来自于两部比较知名的电视剧,《吸血鬼猎人巴菲》和《生活大爆炸》。...8.Youtube视频人脸数据集 数据集链接:http://m6z.cn/6u3P2V 该数据集包含 1,595 个不同人的 3,425 个视频。所有视频都是从 YouTube 下载的。
简单工具类 写作初衷:由于日常开发经常需要用到很多工具类,经常根据需求自己写也比较麻烦 网上好了一些工具类例如commom.lang3或者hutool或者Jodd这样的开源工具,但是 发现他们之中虽然设计不错...以外的源码 2.牺牲代码复用性,每个类都必须是单独的组件,绝不互相引用,做到完全解耦 package *; /** * @program: simple_tools * @description: 打码加密工具
自 2017 年末该模型首次面世以来,已出现许多开源的 Deepfake 生成方法,合成的视频片段数量也随之激增。虽然其中许多视频片段的制作初衷是为了搞笑,但其中有些会对个人和社会造成危害。...去年 1 月,我们发布了合成语音数据集,为高性能识别合成音频检测的国际挑战赛提供支持。超过 150 个研究机构和行业组织在参赛期间下载使用此数据集,此数据集现在已免费提供给公众使用。...近日,我们发布了一个由我们与 Jigsaw 共同制作的大型视觉 Deepfake 数据集。...这个领域的发展十分迅速,随着 Deepfake 技术的推进,我们会不断为这个数据集丰富数据,而且我们会继续与合作伙伴在此领域开展合作。...这个数据集的诞生离不开他们的帮助。 如果您想详细了解 本文提及 的相关内容,请参阅以下文档。
Kaggle数据集 Kaggle数据集地址 https://www.kaggle.com/datasets 这是我最喜欢的数据集之一,每个数据集都对应于一个小型社区,你可以在其中讨论数据、查找公共代码...这里包含了大量不同类型、不同结构的数据集内容。同时,还可以在其中获取到与每个数据集关联的资料,其中包含了许多数据科学家们提供的数据集分析笔记等。 2....UCI机器学习数据集 UCI数据集地址: https://archive.ics.uci.edu/ml/datasets.html 这个数据集来自于加州大学信息与计算机科学学院,其中包含了100多个数据集...根据机器学习问题的类型对数据集进行分类,可找到单变量或多变量时间序列数据集,以及分类、回归或推荐系统的数据集。 4....其中列出的大多数数据集都是免费的,但在使用任何数据集之前,均需检查数据集的许可要求。 7.
本文收集和整理了15个目标检测相关的开源数据集,希望能给大家的学习带来帮助。...1.火焰和烟雾图像数据集 数据集链接:http://m6z.cn/6fzn0f 该数据集由早期火灾和烟雾的图像数据集组成。数据集由在真实场景中使用手机拍摄的早期火灾和烟雾图像组成。...T-LESS数据集 数据集链接:http://m6z.cn/5wnucm 该数据集采集的目标为工业应用、纹理很少的目标,同时缺乏区别性的颜色,且目标具有对称性和互相关性,数据集由三个同步的传感器获得,一个结构光传感器...12.Unsplash图片检索数据集 数据集链接:http://m6z.cn/5wnuoM 使用迄今为止公开共享的全球最大的开放检索信息数据集。...14.上海科技大学人群统计数据集 数据集链接:http://m6z.cn/5Sgafn 上海科技数据集是一个大规模的人群统计数据集。它由1198张带注释的群组图像组成。
本文收集和整理了15个目标检测相关的开源数据集,希望能给大家的学习带来帮助。 1.火焰和烟雾图像数据集 数据集链接:http://m6z.cn/6fzn0f 该数据集由早期火灾和烟雾的图像数据集组成。...T-LESS数据集 数据集链接:http://m6z.cn/5wnucm 该数据集采集的目标为工业应用、纹理很少的目标,同时缺乏区别性的颜色,且目标具有对称性和互相关性,数据集由三个同步的传感器获得,一个结构光传感器...9.印度车辆数据集 数据集链接:http://m6z.cn/6uxAIx 该数据集包括小众印度车辆的图像,如Autorikshaw、Tempo、卡车等。...12.Unsplash图片检索数据集 数据集链接:http://m6z.cn/5wnuoM 使用迄今为止公开共享的全球最大的开放检索信息数据集。...14.上海科技大学人群统计数据集 数据集链接:http://m6z.cn/5Sgafn 上海科技数据集是一个大规模的人群统计数据集。它由1198张带注释的群组图像组成。
CrackForest数据集 数据集下载链接:http://suo.nz/2wdNdX CrackForest数据集是一个带注释的道路裂缝图像数据库,可以大致反映城市路面状况。...道路裂缝坑洼图像数据集 数据集下载链接:http://suo.nz/3eEDlj 这个数据集是一个极具挑战性的集合,包含 5,000 多张野外道路上的坑洼图像。...坑洼检测数据集 数据集下载链接:http://m6z.cn/5wJJTa 700个在坑洼处带有3K +注释的图像 坑洼图像数据集 数据集下载链接:http://suo.nz/2vtaK6 包含 600...道路坑洼检测数据集 数据集下载链接:http://suo.nz/2nWXFp 包含 300 多张包含坑洼的道路图像的标记图像数据集。 数据集包含两个文件夹 - 正常和坑洼。...道路裂缝检测数据集 数据集下载链接:http://suo.nz/2ZCfNd CrackSeg3 数据集下载链接:http://suo.nz/2S62Iw 用于实例分割的道路缝隙检测数据集,共有116
为此,这项工作提出了三种类型的口罩遮挡人脸数据集,包括口罩遮挡人脸检测数据集(MFDD),真实口罩遮挡人脸识别数据集(RMFRD)和模拟口罩遮挡人脸识别数据集(SMFRD)。...在本数据中,训练数据集与测试数据集占比约为5:1。...坑洼检测数据集 数据集下载地址:http://m6z.cn/5wJJTa 本数据集汇总了700个在坑洼处带有3K +注释的图像,用于从道路图像中检测坑洼,检测道路地形和坑洼。...Linkopings交通标志数据集 数据集下载地址:http://m6z.cn/68ldS0 通过记录超过 350 公里的瑞典高速公路和城市道路的序列,创建了一个数据集。...水下垃圾检测数据集 数据集下载地址:http://m6z.cn/6nnDQK 该数据来自 J-EDI 海洋垃圾数据集。构成该数据集的视频在质量、深度、场景中的对象和使用的相机方面差异很大。
解题 并查集学习 先复制一份地图,把要敲的地方先敲掉 使用并查集合并剩余的砖块 逆序遍历敲击的砖块,合并周围砖块,记录 top 砖块所在集团在合并前后的 size 之差 class dsu // 并查集
Github:https://github.com/1061700625/small_tools_v2 之前做了一个下载百度的旋转图片验证码的工具(多进程下载百度旋转验证码图片-制作数据集...),那么拿到了图片数据,就需要手动校正调整来制作数据集,所以出了这个工具。
之所以使用视频中的关键帧作为数据集,主要的原因是:这类数据比较有代表性、画面质量相对较高,包含高质量的多种分类的图片。...言归正传,开始一起了解,如何使用 ffmpeg 来搞定数据集的生成,以及生成过程中的细节。...FFmpeg 的安装 FFmpeg 是全平台的开源软件,所以其实在包括手机上、游戏机中都能够找到它的身影,但是我们今天主要聊的是转换视频为图片数据集,所以就只看主流三大生产力平台就好: 在 Ubuntu...所以,提升转换性能的第一个方案就是,减少不必要的图片数据集的生成。...当然,如果你追求的是超级高清的壁纸数据集,那么这篇文章,已经讲完了你所需要的一切内容啦。接下来你选择你喜欢的视频素材,进行壁纸数据集准备即可。
点击蓝字 关注我们 #TSer# 数据是驱动科技发展的源泉,平时我们科研中也经常需要在各种开源数据上验证自己模型的效果。那时间序列目前可以使用的开源数据集有哪些呢?...UCR时间序列数据集是时序领域的“Imagnet”,涵盖医疗/电力/地理 等诸多领域,目前全量数据有128种。...该数据集是由人工神经网络公司Numenta所提供的,包含互联网服务场景下的各种流式数据与评测脚本。...,提供了非常丰富的开源时间序列数据。...数据竞赛平台 除了上面整理的常用的开源时间序列数据以外,我们如果想获取针对特定任务的时间序列数据,还可以通过各种竞赛平台获取数据。这些数据集通常干净且科研性非常高。
补全未下载完的 GitHub 数据集 当我们“完成” GitHub 数据集的下载之后,可以先来统计下已下载完毕的数据文件的总数: # find ....其他:聊聊 GitHub 和它的公开数据集 接下来,聊聊 GitHub 和它的数据集背后的一些故事。...GitHub 数据集相关的故事 文章开头提到,在 GHArchive 项目中,我们能够看到目前全球有至少二十~三十个基于 GitHub 进行分析的开源项目,它们基于不同的维度、提供了不同的功能,甚至有一些项目因为年代久远...图片 在 GH Archive 网站上,还列举了其他的前人,对于这份数据的探索、贡献列表,可以供任何想要了解开源世界的人,进行学习和研究。...最近,团队有同学想深入了解这个数据集,趁着机会,将内容整理成文,希望能够帮助到有同样需求的,对开源世界好奇的你。
领取专属 10元无门槛券
手把手带您无忧上云