首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
首页标签数据挖掘

#数据挖掘

跨学科的计算机科学分支。用人工智能、机器学习、统计学和数据库的交叉方法在相对较大型的数据集中发现模式的计算过程

加载数据模型:在数据采集中实现动态数据处理

jackcode

在现代网络爬虫技术中,数据的动态处理成为了提升采集效率和准确性的重要手段。随着目标网站数据的多样性和复杂性增加,静态数据采集方法逐渐无法满足需求。本文以拼多多为...

10010

网络爬虫的最佳实践:结合 set_time_limit() 与 setTrafficLimit() 抓取云盘数据

jackcode

在数据爬取领域,百度云盘作为国内领先的云存储服务平台,拥有海量的用户和数据资源。因此,对于技术开发者而言,如何高效、稳定地对百度云盘中的公开资源进行数据抓取成为...

7410

优化数据的抓取规则:减少无效请求

jackcode

在爬取房价信息的过程中,如何有效过滤无效链接、减少冗余请求,是提升数据抓取效率的关键。本文将介绍如何优化爬虫抓取贝壳等二手房平台中的房价、小区信息,并通过代理I...

12910

单细胞拟时序/轨迹分析monocle3流程学习和整理

凑齐六个字吧

拟时序/轨迹分析的基础知识和Monocle2流程可见推文: https://mp.weixin.qq.com/s/aVUpRIkDi83B8_Y_BSBkVA

5810

基于长短期记忆模型的股价预测及可视化

皮大大

1、https://easyai.tech/ai-definition/lstm/

8910

如何使用Cheerio与jsdom解析复杂的HTML结构进行数据提取

jackcode

在现代网页开发中,HTML结构往往非常复杂,包含大量嵌套的标签和动态内容。这给爬虫技术带来了不小的挑战,尤其是在需要精确提取特定数据的场景下。传统的解析库可能无...

16110

CMap数据库学习及结果可视化

凑齐六个字吧

CMap是一个生物信息学数据库和工具,旨在通过比较基因表达谱来揭示药物、基因和疾病之间的潜在关联。CMap数据库主要用于寻找药物、化合物和生物过程之间的关系,并...

15010

图片相似度检索设计

liddytang

相似度检索的应用场景颇多,不管是互联网生态下的内容理解还是工业界质量检、人脸对比等,向量相似度检索技术的核心是通过向量表征的感兴趣区域并通过向量距离计算衡量输入...

6710

一文速学-零成本与数据沟通NL2SQL的概念和实现技术

fanstuck

关于NL2SQL的技术,如果大家最近有关注AI圈的话,或多或少都有所了解。其实很多业务场景下,于用户而言更多的是想要获取到最终数据的呈现效果,关于数据是如何获取...

489120

单细胞测序—不同格式的单细胞测序数据读写(多样本)

sheldor没耳朵

读写过程中需要将一个GSE数据集中多个样本的seurat对象合并成一个大的seurat对象

28110

单细胞测序—标准流程代码(2) — 标记基因与细胞注释

sheldor没耳朵

书接上回,已经做好数据质控、过滤、去批次、降维聚类分群后,接下来就是进行细胞注释方面的工作

15710

转录组GSE105789_小鼠数据下游分析注意事项

sheldor没耳朵

简单记录下GSE105789小鼠数据的下游分析的主要事项,与human的数据分析的主要区别是在进行id转换、kegg、go、gsea时,需要注意数据库和物种信息...

14710

转录组上游分析—使用iseq下载原始数据、小鼠基因组、单端测序数据处理

sheldor没耳朵

进行数据集GSE105789上游分析的时候,总共才四个数据集,使用prefetch下载的时候,不知道网络抽了什么风,速度一直都很慢。下了10个小时才下了三分之一...

17410

单细胞测序—标准流程代码(1)

sheldor没耳朵

现在的单细胞测序很少是单个样本测序了,一般是多个样本。这里用ifnb.SeuratData包中的ifnb示例数据来模拟单细胞测序多样本分析流程。

18410

单细胞测序—比较两个Seurat分析结果中细胞簇和细胞类型的对应关系

sheldor没耳朵

如果一个数据集我们采用了两种方法对其进行了分析,可采用如下方法比较两个Seurat分析结果中细胞簇和细胞类型的对应关系。

13410

单细胞测序—PBMC注释的细胞类型

sheldor没耳朵

刚开始做单细胞测序的下游分析时,常用的是官方文档提供的pbmc3K数据集,但是我对注释出来的细胞类型缺乏相应的背景知识,对单细胞测序背后的生物学意义也很模糊,这...

14520

转录组-样品表达总体分布及质控可视化

sheldor没耳朵

在拿到表达矩阵时我们常常会对其基因表达的总体分布(可选),以及质量控制进行可视化(必须)。这里总结记录相关代码。

9110

相关产品

  • 跨学科的计算机科学分支。用人工智能、机器学习、统计学和数据库的交叉方法在相对较大型的数据集中发现模式的计算过程

领券