首页
学习
活动
专区
工具
TVP
发布

数据科学(冷冻工厂)

专栏成员
405
文章
224376
阅读量
30
订阅数
Linux |使用“at”命令在指定时间运行任务
作为 cron 作业调度程序的替代方案,at 命令允许您安排命令在给定时间运行一次,而无需编辑配置文件。
数据科学工厂
2024-07-05
390
大型语言模型如何工作?
第一个模型是文档补全器,只会根据最有可能成为下一个字符的内容来补全提示。这是我们用一部分互联网数据训练的基础模型。
数据科学工厂
2024-07-05
280
Linux|如何查找和删除重复文件
整理您的个人文件夹甚至整个操作系统可能会相当棘手,特别是当您习惯于使用下载管理器从网上下载各种资料时。
数据科学工厂
2024-07-05
440
Python 爬虫数据抓取(10):LXML
它是一个第三方库,专门用于操作XML文件。我们在上一节中已经对XML有了深入的了解。
数据科学工厂
2024-07-05
300
Python|玩转 Asyncio 任务处理(2)
Python 的 Asyncio 模块在处理 I/O 密集型任务时表现出色,并且在最近的 Python 版本迭代中获得了诸多增强。不过,由于处理异步任务的途径多样,选择在特定情境下最合适的方法可能会让人感到迷惑。在这篇文章[1]中,我会先从任务对象的基本概念讲起,接着探讨各种处理异步任务的方法,并分析它们各自的优势和劣势。
数据科学工厂
2024-07-05
280
空间单细胞|在Seurat中对空间数据进行分析(4)
在这篇指南[1]中,我们介绍了Seurat的一个新扩展功能,用以分析新型的空间解析数据,将重点介绍由不同成像技术生成的三个公开数据集。
数据科学工厂
2024-07-05
450
空间单细胞|基于图像的数据分析(3)
在这篇指南[1]中,我们介绍了Seurat的一个新扩展功能,用以分析新型的空间解析数据,将重点介绍由不同成像技术生成的三个公开数据集。
数据科学工厂
2024-07-05
330
空间单细胞|基于图像的空间数据分析(2)
在这篇指南[1]中,我们介绍了Seurat的一个新扩展功能,用以分析新型的空间解析数据,将重点介绍由不同成像技术生成的三个公开数据集。
数据科学工厂
2024-07-05
280
为什么深度学习模型在GPU上运行更快?
当前,提到深度学习,我们很自然地会想到利用GPU来提升运算效率。GPU最初是为了加速图像渲染和2D、3D图形处理而设计的。但它们强大的并行处理能力,使得它们在深度学习等更广泛的领域中也发挥了重要作用。
数据科学工厂
2024-07-05
210
Linux必备|如何重置忘记的 Root 密码
这是一种常见的情况 - 您正在使用 Ubuntu 系统,突然意识到您忘记了 root 密码,这可能是一次令人沮丧的经历,因为 root 帐户对于执行关键管理任务至关重要。
数据科学工厂
2024-07-05
320
Python|玩转 Asyncio 任务处理(1)
Python 的 Asyncio 模块在处理 I/O 密集型任务时表现出色,并且在最近的 Python 版本迭代中获得了诸多增强。不过,由于处理异步任务的途径多样,选择在特定情境下最合适的方法可能会让人感到迷惑。在这篇文章[1]中,我会先从任务对象的基本概念讲起,接着探讨各种处理异步任务的方法,并分析它们各自的优势和劣势。
数据科学工厂
2024-07-05
190
单细胞空间|在Seurat中对基于图像的空间数据进行分析(1)
在这篇指南[1]中,我们介绍了Seurat的一个新扩展功能,用以分析新型的空间解析数据,将重点介绍由不同成像技术生成的三个公开数据集。
数据科学工厂
2024-06-21
1090
实战|YOLOv10 自定义目标检测
由清华大学的研究团队基于 Ultralytics Python 包研发的 YOLOv10,通过优化模型结构并去除非极大值抑制(NMS)环节,提出了一种创新的实时目标检测技术。这些改进不仅实现了行业领先的检测性能,还降低了对计算资源的需求。大量实验结果证明,YOLOv10 在不同规模的模型上都能提供卓越的准确率和延迟之间的平衡。
数据科学工厂
2024-06-21
2640
Linux|如何安装和运行多个 glibc 库
GNU C 库 (glibc) 是 Linux 操作系统的基本组件,为各种应用程序提供基本功能。在某些情况下,您可能需要安装多个版本的 glibc 以支持不同的应用程序或确保与旧软件的兼容性。本指南[1]将向您展示如何使用简单的步骤在 Linux 系统上安装和管理多个 glibc 库。
数据科学工厂
2024-06-19
1190
Docker|了解容器镜像层(1)
容器非常神奇。它们允许简单的进程表现得像虚拟机。在这种优雅的底层是一组模式和实践,最终使一切运作起来。在设计的根本是层。层是存储和分发容器化文件系统内容的基本方式。这种设计既出人意料地简单,同时又非常强大。在今天的帖子[1]中,我将解释什么是层以及它们的概念性工作原理。
数据科学工厂
2024-06-18
790
什么是大型语言模型 ?
2023年11月,我偶然间听闻了OpenAI的开发者大会,这个大会展示了人工智能领域的革命性进展,让我深深着迷。怀着对这一领域的浓厚兴趣,我加入了ChatGPT,并很快被激发了学习其背后的大型语言模型(LLMs)技术的热情。然而,像许多人一样,我对LLMs一窍不通,不知道如何入门。
数据科学工厂
2024-06-18
600
Python:从头创建 Asyncio (1)
现在,asyncio 已成为 Python 社区中的热门话题,并且名副其实——它提供了一种非常出色的处理 I/O 密集型程序的方法!在我探索 asyncio 的过程中,我起初并不太明白它的工作原理。但随着深入学习,我意识到 asyncio 实际上是在 Python 生成器的基础上增加了一层非常便利的封装。
数据科学工厂
2024-06-18
810
Signac|成年小鼠大脑 单细胞ATAC分析(2)
在本教程中,我们将探讨由10x Genomics公司提供的成年小鼠大脑细胞的单细胞ATAC-seq数据集。本教程中使用的所有相关文件均可在10x Genomics官方网站上获取。
数据科学工厂
2024-06-18
690
Docker|了解容器镜像层(2)
容器非常神奇。它们允许简单的进程表现得像虚拟机。在这种优雅的底层是一组模式和实践,最终使一切运作起来。在设计的根本是层。层是存储和分发容器化文件系统内容的基本方式。这种设计既出人意料地简单,同时又非常强大。在今天的帖子[1]中,我将解释什么是层以及它们的概念性工作原理。
数据科学工厂
2024-06-18
570
深度学习长文|使用 JAX 进行 AI 模型训练
在人工智能模型的开发旅程中,选择正确的机器学习开发框架是一项至关重要的决策。历史上,众多库都曾竞相争夺“人工智能开发者首选框架”这一令人垂涎的称号。(你是否还记得 Caffe 和 Theano?)在过去的几年里,TensorFlow 以其对高效率、基于图的计算的重视,似乎已经成为了领头羊(这是根据作者对学术论文提及次数和社区支持力度的观察得出的结论)。而在近十年的转折点上,PyTorch 以其对用户友好的 Python 风格接口的强调,似乎已经稳坐了霸主之位。但是,近年来,一个新兴的竞争者迅速崛起,其受欢迎程度已经到了不容忽视的地步。JAX 以其对提升人工智能模型训练和推理性能的追求,同时不牺牲用户体验,正逐步向顶尖位置发起挑战。
数据科学工厂
2024-06-18
1230
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档