首页
学习
活动
专区
圈层
工具
发布

「Workshop」第二期:程序控制与数据操作流

涉及编程的数据和代码都会放到 https://github.com/XSLiuLab/Workshop 推荐图书 《R for Data Science》[1] 《R 语言编程指南》 《R 实战》 其他推荐见...one_of matches 行筛选 slice, filter, sample_n, sample_frac, top_n, distinct 列筛选 select 排序 arrange 行列增加/更新 基本的数学和比较逻辑运算符...is.na()) 位置 mean, meadian 逻辑值 mean, sum 位置 dplyr:: first last nth 排序 quantile min max 分布 IQR mad sd var...文档和《R 语言编程指南》 后几期主题 本期未讲述的内容???...正则表达式与字符串处理:base 与 stringr 列表处理与迭代计算:purrr 统计建模:stats 与 broom 绘图:graphics 与 ggplot2 函数编程:apply家族和purrr

2.1K30

「R」dplyr 列式计算

你可以通过对第二个参数传入一个函数(包括 lambda 函数)的命名列表来对每个变量同时执行多个函数操作。..._if, _at, _all 「dplyr」 以前的版本允许以不同的方式将函数应用到多个列:使用带有_if、_at和_all后缀的函数。这些功能解决了迫切的需求而被许多人使用,但现在被取代了。...across() 统一了 _if 和 _at 的语义让我们可以随心按照位置、名字和类型选择变量,甚至是随心所欲地组合它们,这在以前是不可能的。..._at() 函数是 「dplyr」 中唯一你需要手动引用变量名的地方,这让它们比较奇怪且难以记忆。 为什么过了这么久才发现 across()?...」 的开发者们通过 across() 简化了 「dplyr」 对于一些数据复杂操作的处理逻辑,提高了整体的学习和使用效率,让我们使用者更关注于逻辑而非实现上。

3.1K10
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    R&Python Data Science 系列:数据处理(1)

    在数据转换和可视化模块中,R和Python有很多相近的语法代码。 1 数据转换 数据转换广义上也是数据处理,是根据业务需求,筛选、衍生新的变量以及计算一些统计量。...这一部分介绍一下R和Python数据处理用到的筛选、衍生以及计算函数。主要介绍如何使用R语言和Python中的两个程序包进行数据处理,R语言中的dplyr和Python中的dfply第三方包。...注意Python与R语言中有点不同,Python中使用X记录了每一步的结果,当需要选择结果中的列的是需要使用X,而R语言则不需要这个中间变量。...4.2 row_slice函数 使用row_slice进行行切片操作,可以传递单个整数索引或者索引列表选择行: Python实现 ##筛选出diaminds中第11行和第16行 diamonds...注意:python中按比例抽样和抽样指定的几列,是通过参数限制的;R语言按比例抽样使用sample_frac()函数,抽样几列使用sample_n()函数 4.4 distinct函数 选择唯一值

    1.8K10

    第四章:activiti流程中,变量的传递和获取流程变量 ,设置和获取多个流程变量,设置和获取局部流程变量「建议收藏」

    大家好,又见面了,我是你们的朋友全栈君。 上一章我们介绍了部署流程实例,启动流程,查看任务,完成任务的service和实例,下面我们介绍下怎么获取流程中需要传递的变量。...开始前,先撸一遍流程的任务节点名和任务委派人: 流程图如上,三个任务节点名分别是leave001,leave002,leave003,因为我的Navicat不能看流程中的汉字所以可以简单理解为三个请假流程...然后把这个值放到刚才我们写的设置流程变量的方法中: 、 执行上面的方法,成功后我们看看数据库的act_ru_variable表会有我们设置的几个变量: 然后我们继续往下走,执行完成任务方法,注意修改任务...下面再介绍一种可以设置多个变量的方法: /** * 设置多个流程变量数据 */ @Test public void setVariableValue1(){ TaskService taskService...2018 请假原因:faShao 请假的天数是2覆盖了数据库中另一个请假天数的值。

    7.5K30

    【C 语言】指针间接赋值 ( 直接修改 和 间接修改 指针变量 的值 | 在函数中 间接修改 指针变量 的值 | 在函数中 间接修改 外部变量 的原理 )

    文章目录 一、直接修改 和 间接修改 指针变量 的值 二、在函数中 间接修改 指针变量 的值 三、在函数中 间接修改 外部变量 的原理 一、直接修改 和 间接修改 指针变量 的值 ---- 直接修改 指针变量...= &a; 间接修改 指针变量 的值 , 首先要 将 指针变量 的 地址值 , 赋值给 1 个 二级指针 变量 , 通过 * 符号 , 间接修改 一级指针变量的值 ; // 将一级指针的地址赋值给二级指针...p2 = &p; // 间接修改指针的值 *p2 = 12345678; 直接修改 和 间接修改 指针变量 的值 代码示例 : #include #include...间接修改 指针变量 的值 ---- 在 函数 中 间接修改 指针变量 的值 , 将 指向一级指针 的 二级指针 变量 , 传递到 函数形参 中 , 在 函数中 , 使用 * 符号 , 修改 二级指针 指向的...三、在函数中 间接修改 外部变量 的原理 ---- 如果要 修改 一级指针 的值 , 必须 传入 指向 一级指针 的 二级指针 变量 才可以 , 传入一级指针变量 , 不能修改一级指针变量值 ; 这是因为

    23.6K11

    R 数据整理(七:使用tidyr和dplyr处理数据框 2.0)

    ,后续的参数是条件,这些条件是需要同时满足的,另外,条件中取 缺失值的观测自动放弃,这一点与直接在数据框的行下标中用逻辑下标有所不同,逻辑下标中有缺失值会在结果中 产生缺失值。...pivot_longer/pivot_wider 大部分功能是类似的,这里主要说下pivot_longer 针对下面情况的功能: 我们需要 指定切分变量名和随访号的模式,以解决一行中有多个属性的多次观测的情形...,再转换回长列表,比如: 这个数据的问题是 x, y 应该放在两列中却合并成一个了,2018 和 2019 应该放在一列中却分成了两列。...nest 与unnest 对于数据框,我们可以使用split 将数据框按某列拆分为多个数据框,并储存在列表中。...实际上,tibble 允许存在数据类型是列表 (list) 的列,子数据框就是以列表数据类型保存在 tibble 的一列中的。

    12.6K30

    MLQuant:基于XGBoost的金融时序交易策略(附代码)

    ,我们将清理一下数据,将所有列表放入一个单独的数据框中,计算每种资产的每日收益并创建向上或向下的方向,这将是分类模型试图进行预测。...nested_df % mutate(duplicate_ID = ID) %>% nest(-ID) 我们将时间序列数据分为多个列表,以使该analysis()列表在每个列表中包含...100个观测值,并具有一个包含1个观测值的相应assessment()列表。...该函数对我们数据中的每项资产执行以下操作: 使用样本外t+1(assessment)数据,将这些列表绑定到一个dataframe中。...接下来,我们使用变量X_train和X_test把数据拆分成X个变量以及使用Y_train和Y_test把相应的Y变量分开。xgboost包需要一个特定类型的xgb.DMatrix()。

    3.3K41

    Python从零开始第三章数据处理与分析①python中的dplyr(2)目录

    目录 第二章(pandas) Python从零开始第三章数据处理与分析①dplyr风格的python代码 Python从零开始第三章数据处理与分析①python中的dplyr(2) ==========...===================================== filter/select功能 select和drop函数在数据处理中很有用,可以轻松地选择和删除列。...这些功能旨在select和drop功能,并可与〜一起使用。 首先,快速了解可用功能: starts_with(prefix):查找以字符串前缀开头的列。...ends_with(suffix):查找以字符串后缀结尾的列。 contains(substr):查找名称中包含子字符串的列。 everything():所有列。...可以传递单个整数索引或索引列表来选择行。 这与使用pandas包的的.iloc功能相同。

    62910

    开发实例:怎样用Python找出一个列表中的最大值和最小值?

    在Python中,可以使用内置函数max和min来分别找出一个列表中的最大值和最小值。这两个函数非常简单易用,无需编写任何复杂的代码即可找到指定列表中的最大或最小值。...,然后使用max函数来获取nums中的最大值,并将结果赋值给变量max_num。...最后使用print语句输出该变量的值,结果是8。 类似地,使用min函数也可以获取列表中的最小值。...接着,声明两个变量min_num和max_num分别记录最小值和最大值,稍微复杂一点的地方在于使用了Python中的多赋值语法来同时获取这两个值。最后使用print语句输出变量的值,结果是1和8。...总之,在日常应用中,获取列表中的最大值和最小值是非常常见的需求,Python提供了多种方法来解决这个问题,比如max、min和sorted等内置函数,具体使用方法灵活多样,可以根据具体情况进行选择。

    1.6K10

    2018-7-18pythoh中函数的参数,返回值,变量,和递归

    ***************************************************************                                  函数中的参数的初级和返回值...: 技术文档中[]方括号里面的东西表示可选的 参数:函数运行需要的数据   如果没有参数会提示:missing 1 required positional, 函数的两个要点,参数和返回值: 1.如果函数有参数在调用执行函数的时候要把参数写里面...,多写                                                      少些都不对 2.如果参数有返回值,需要用返回值时要定义一个变量接收返回值,如果不接收的话返回值不会打印出来...: variable  变量 函数中的变量分全局变量和局部变量,函数外的为全局变量,函数内的为局部变量 在函数中如果需要修改全局变量的值,需要先用global+name声明一下全局变量放在定义的函数顶部...#修改原来全局变量的值      msg="留言"  test()  print("修改后的全局变量:",name)  #tom  print("新定义的全局变量:",msg)   #留言 函数自己调用自己就是函数的递归

    2.8K40

    数据分析:宏基因组数据的荟萃分析

    数据分析:宏基因组数据的荟萃分析​介绍宏基因组数据的荟萃分析是一种综合多个独立宏基因组研究结果的方法,目的是揭示不同人群或样本中微生物群落的共同特征和差异。...meta 包中的 metagen 函数用于进行宏基因组数据的荟萃分析,其核心原理是综合多个独立研究的结果,以评估不同组别间在微生物群落组成上的差异性,并得出更加全面和可靠的结论。...获取该模型中微生物物种的效应值和效应值误差,它们将用于后续荟萃分析。...荟萃分析的结果包含所有研究的效应值(RE)和效应值的误差(SE_RE)。...可视化结果采用森林图展示荟萃分析的结果,该结果包含效应值RE的95%置信区间和对应的P值。

    48010

    Python在生物信息学中的应用:在字典中将键映射到多个值上

    我们想要一个能将键(key)映射到多个值的字典(即所谓的一键多值字典[multidict])。 解决方案 字典是一种关联容器,每个键都映射到一个单独的值上。...如果想让键映射到多个值,需要将这多个值保存到另一个容器(列表、集合、字典等)中。...如果你想保持元素的插入顺序可以使用列表, 如果想去掉重复元素就使用集合(并且不关心元素的顺序问题)。 你可以很方便地使用 collections 模块中的 defaultdict 来构造这样的字典。...如果你并不需要这样的特性,你可以在一个普通的字典上使用 setdefault() 方法来代替。...因为每次调用都得创建一个新的初始值的实例(例子程序中的空列表 [] )。 讨论 一般来说,构建一个多值映射字典是很容易的。但是如果试着自己对第一个值做初始化操作,就会变得很杂乱。

    2.2K10
    领券