首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Excel实战技巧110:快速整理一列数据拆分成多列(使用公式)

    在《Excel实战技巧109:快速整理一列数据拆分成多列》中,我们使用一种巧妙的思路解决了将一列数据拆分成多列的问题。本文介绍使用公式实现的方法。 示例工作簿中的数据如下图1所示。...图2 可以使用下面的公式来实现。...在单元格E4中输入数组公式: =INDEX(A3:A29,ROWS(E4:E4)+(COUNTA(E3:G3)-1)*(ROWS(E4:E4)-1)+COLUMNS(E3:E3)-1) 向右拖至列G,向下拖至行...公式中: A3:A29,是列A中原数据列表。 ROWS(E4:E4),统计指定区域的行数,区域通过锁定第一个引用并保留第二个引用为相对引用来扩展。...COLUMNS(E3:E3),统计指定区域的列数。区域通过锁定第一个引用并保留第二个引用为相对引用来扩展。当公式向右拉时,列数将增加(1,然后是 2,3,等等……)。

    4K20

    懒癌必备-dplyr和data.table让你的数据分析事半功倍

    mutate( ) 为数据增加新列 mutate(df,vnew1=v1-v2,vnew2=vnew1+v3) 与基础包里的transform()函数接近,但mutate可以使用你刚刚创建的column...data.table这个包的语法用起来稍微有点奇怪(哈哈~), 但是速度亲妈快啊!!小伙伴们一定不能错过的绝世好包! 铺垫了这么多,来来来,数据分析神器data.table走起来!!...DTdata.table() DT[i,j,by] take DT,subset rows using i,then calculate j grouped by by 我们在横轴上过滤数据..."B")] 使用j DT[,v1] #选择v1列 那如果我要选择多列呢,大家注意一下这里不是用c()来选取了, 而是通过.()来选取,注意前面有一个”.”号,所以我说data.table的语法有点奇怪呢...(sum_v1=sum(v1),sd_v3=sd(v3))] 还可以直接给计算的列赋予名称哦!!功能强大得我都要笑开花了! 使用by 这还只是小试牛刀,你忘了我们还有个by吗!! DT[,.

    2.5K70

    R语言学习笔记之——数据处理神器data.table

    data.table 1、I/O性能: data.table的被推崇的重要原因就是他的IO吞吐性能在R语言诸多包中首屈一指,这里以一个1.6G多的2015年纽约自行车出行数据集为例来检验其性能到底如何,...data.table列索引 列索引与数据框相比操作体验差异比较大,data.table的列索引摒弃了data.frame时代的向量化参数,而使用list参数进行列索引。...(carrier,tailnum)] #但心里要清楚列索引接受的条件是含有列表的列表,而且这里的列表作为变量给出,而非data.frame时代的字符串向量。 行列同时索引毫无压力。...注意以上新建列时,如果只有一列,列名比较自由,写成字符串或者变量都可以,但是新建多列,必须严格按照左侧列名为字符串向量,右侧为列表的模式,当然你也可以使用第二种写法。...当聚合函数与data.table中的分组参数一起使用时,data.table的真正威力才逐渐显露。 mydata[,.

    3.6K80

    R语言数据分析利器data.table包 —— 数据框结构处理精讲

    因此,在对大数据处理上,使用data.table无疑具有极高的效率。这里我们主要讲的是它对数据框结构的快捷处理。...会将非数字转化为字符 data.table数据框也可使用dplyr包的管道,这里不作阐述。...当使用dt_names = names(DT)的时候,修改dt_names会修改原data.table的列名,如果不想被修改,这个时候应copy原data.table,也可以使用dt_names <-...=getOption("datatable.fread.datatable") # default: TRUE ) input输入的文件,或者字符串(至少有一个"\n"); sep列之间的分隔符;...,即x相当于DT$"x",当是FALSE时,列名仅仅作为字符串,可以用传统data.frame方法并且返回data.table,x[, cols, with=FALSE] 和x[, .SD, .SDcols

    5.9K20

    R练习50题 - 第一期

    我们的所有答案都将使用data.table这个包。我们认为data.table是最优秀的数据处理工具,没有之一。...我们可以借助与stringr这个字符串处理包。这一步不难,稍微有些挑战的是去重。如果我们不去重,那么我们会得到非常多的重复观测。...为了去重,我们需要借助于data.table中的unique函数。 我们希望最终的输出是一个字符串向量: ?...在data.table的语法中,先进行列选择操作,再对列进行处理。所以上述语句会先执行str_detect,再执行unique。 练习2:每天上涨和下跌的股票各有多少?...这是因为data.table的第一个语句用来对列进行选择,由于我们这里需要对所有列进行统计,所以不需要进行任何操作。 keyby用来进行分组,是整个代码的核心。先来看keyby = .

    2.5K40

    好强一个Julia!CSV数据读取,性能最高多出R、Python 22倍

    而在使用多线程处理时,CSV.jl则表现得更好,是data.table速度的2倍以上。 单线程CSV.jl是没有多线程的Pandas(Python)的1.5倍,而多线程的CSV.jl可以达到11倍。...字符串数据集 I 此数据集在且具有1000k行和20列,并且所有列中不存在缺失值。 ? Pandas需要546毫秒来加载文件。 使用R,添加线程似乎不会导致任何性能提升。...单线程CSV.jl比data.table快2.5倍,而在10个线程中,CSV.jl则大约比data.table快14倍。 字符串数据集 II 该数据集的大小与字符串数据集 I 中相同。...单线程中,CSV.jl比R快2倍,而使用10个线程则快了10倍。 按揭贷款风险数据集 从Kaggle取得的按揭贷款风险数据集是一种混合型的数据集,具有356k行和2190列。...但是,使用更多线程,Julia的速度与R一样快或稍快。 宽数据集 这是一个相当宽的数据集,具有1000行和20k列。数据集包含的数据值类型有:String、Int。 ?

    2K63

    R语言基因组数据分析可能会用到的data.table函数整理

    因此,在对大数据处理上,使用data.table无疑具有极高的效率。这里主要介绍在基因组数据分析中可能会用到的函数。...,不要其它的; drop 需要取掉的列名或者列号,要其它的; colClasses 类字符矢量,用于罕见的覆盖而不是常规使用,只会使一列变为更高的类型,不能降低类型; integer64...TRUE返回data.table,FALSE返回data.frame 可见1.8GB的数据读入94秒,读入文件速度非常快 fwrite 对数据框数据进行处理后,需要保存到文件,我们就可以使用...equal尚不能使用。...当时TRUE的时候,工作台交互 chmatch 返回各字符串在第二个对象的首匹配位置,是match和%in%的加速版本。

    3.4K10

    使用awk和正则表达式过滤文件中的文本或字符串

    当我们在 Unix/Linux 中运行某些命令来读取或编辑字符串或文件中的文本时,我们很多时候都会查找指定特征的字符串。这可能会使用正则表达式。 什么是正则表达式?...正则表达式可以定义为表示多个字符序列的字符串。关于正则表达式的最重要的事情之一是它们允许你过滤命令或文件的输出、编辑文本或配置文件的一部分等等。...为了过滤文本,必须使用文本过滤工具,例如 awk 你可以想到awk作为自己的编程语言。但是对于本教程的使用范围awk,我们将把它作为一个简单的命令行过滤工具来介绍。...如何在 Linux 中使用 awk 过滤工具 在下面的例子中,我们将重点讨论我们在 awk 特性下讨论的元字符。.... # awk '/l.c/{print}' /etc/hosts 在模式中使用带有 (*) 字符的 awk 它将匹配包含的字符串 localhost, localnet, lines, capable

    2.3K10

    data.table包使用应该注意的一些细节

    fread中nThread 参数的使用   注意默认nThread=getDTthreads(),即使用所有能用的核心,但并不是核心用的越多越好,本人亲自测试的情况下,其实单核具有较强的性能,只有在数据大于...  as.matrix作用于data.table时会调用as.matrix.data.table,有一个rownames参数可以指定保留为行名的列 矩阵转换成data.table时可以保留列名   在...as.data.table函数中同样有一个rownames参数,设置为T可以将行名保留下来作为data.table的一列 不建议set和for循环一起使用   虽然set可以在内存上直接改变数值,但在R...中用for循环比批量列运算慢的多,因此首选:=或者apply等 在处理浮点数时会有一些准确性的问题   比如用seq函数numeric类型的数值时,会存在不准确的问题,比如seq(0,1,by=0.2)...中fintersect, fsetdiff, funion,fsetequal函数能对不同数据框的行求交集,差集,并集等 可以直接对列按分隔符进行分割   应用tstrsplit函数可以将一列按照分隔符分成多列

    1.5K10
    领券