首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    【R的极客理想系列文章】RHadoop培训 之 R基础课

    向量中对应索引向量元素为TRUE 的元素将会被选中,而那些对应FALSE 的元素则被忽略。 y <- x[!...is.na(x)] 正整数向量:索引向量必须是1, 2, … , length(x)的子向量。索引向量中索引对应的元素将会被选中,并且在结果向量中的次序和索引向量中的次序一致。...任何含有NA 数据的运算结果都将是NA。 函数is.na(x)返回一个和x同等长度的向量。它的某个元素值为TRUE 当且仅当x中对应元素是NA。...所有对象都有模式(mode)和长度(length)两个内在属性 mode(x),length(x) 外部属性 attributes(x):给出对象当前定义的非内在属性的列表。...其中,第一个向量是字符模式,另外两个是数值模式,文件是input.dat。

    2.9K20

    数据处理的R包

    plyr包是Hadley Wickham为解决split – apply – combine问题而写的一个包。...使用plyr包可以针对不同的数据类型,在一个函数内同时完成split – apply – combine三个步骤。...plyr包的主函数是**ply形式的,函数名的第一个字符代表输入数据的类型,第二个字符代表输出数据的类型,其中第一个字符可以是(d、l、a),第二个字母可以是(d、l、a、_ ),不同的字母表示不同的数据格式...plyr具体函数如下表所示: 函数名 输入值类型 输出值类型 aaply 数组/向量/矩阵 数组/向量/矩阵 adply 数组/向量/矩阵 数据框 aply 数组/向量/矩阵 列表 a_ply 数组/向量.../矩阵 无 ddply 数据框 数据框 dlply 数据框 列表 daply 数据框 数组/向量/矩阵 d_ply 数据框 无 laply 列表 数组/向量/矩阵 ldply 列表 数据框 lldpiy

    4.7K20

    10个令人相见恨晚的R语言包

    3. plyr 当我第一次使用R时,我用基本的控制运算来操纵数据(for, if, while, etc.)。我很快知道这是一个业余的做法,并且有更好的方法去实现。...在R中,apply函数族是在对列表或者向量每个元素调用函数的首选方法。虽然R基础库中有这些函数,但它们的使用可能难以掌握。...我发现plyr包 是一个对R基础库中诸如split,apply, combine的泛函的更好用的替代。...plyr 给予你一些函数 (ddply, daply, dlply, adply, ldply)按照常见的蓝图:将数据结构分组拆分,对每个组应用一个函数,将结果返回到数据结构中。...("plyr")library(plyr)# 按照 Species 拆分数据库,汇总一下,然后转换结果# 到数据框ddply(iris, .

    1.6K100

    「R」用purrr实现迭代

    通过添加支持函数到每列的参数,我们可以使用同一个函数解决3个问题: col_summary = function(df, fun){ out = vector("double", length(...使用purrr函数替代for循环的目的是将常见的列表问题分解为独立的几部分: 对于列表的单个元素,我们能找到解决办法吗?如果可以,我们就能使用purrr将该方法扩展到列表的所有元素。...映射函数 先对向量进行循环,然后对其每一个元素进行一番处理,最后保存结果。这种模式太普遍了,因而purrr包提供了一个函数族替我们完成这种操作。...$cyl) %>% map(function(df) lm(mpg ~ wt, data = df)) 因为在R中创建匿名函数的语法比较复杂,所以purrr提供了一种更方便的快捷方式——单侧公式...这样,修改后的函数就不会抛出错误,相反,它总是返回由下面两个元素组成的列表: result - 原始结果。如果出现错误,那么它就是NULL error - 错误对象。

    4.8K20

    C++ Vector

    - 根据下标随机访问某个元素的时间是常数,在尾部添加一个元素的时间大多情况下也是常数,总体来说速度很快 缺点 - 若要表示的向量长度较长(需要为向量内部保存很多数),容易导致内存泄漏,而且效率会很低...vector - void assign(size_type num, const TYPE & val); // 赋num个值为val的元素到vector中 - assign函数会清除掉为...n个类型为T的对象,p必须是一个先前由allocate返回的指针,且n必须是p创建时所要求的大小,且在调用该函数之前必须销毁在这片内存上创建的对象,这是因为在创建的过程中我们分配的是最原始的内存,所以在释放内存的时候也只能严格释放这片最原始的内存...size, TYPE val); // 改变当前vector的大小为size,且对新创建的元素赋值val resize 与 reserve 的区别 - reserve 是容器预留空间,但并不真正创建元素对象...- 在 Dev C++ 中,上面写法中 int 后面的两个`>`之间需要有空格,否则有的编译器会把它们当作`>>`运算符,编译会出错 vector 的元素不仅仅可以是int,double,string

    1.9K97

    向量数据库:使用Elasticsearch实现向量数据存储与搜索

    在向量函数的计算过程中,会对所有匹配的文档进行线性扫描。因此,查询预计时间会随着匹配文档的数量线性增长。...二、实验前准备 2.1 创建索引设置向量字段   创建一个支持向量检索的mapping,字段类型为dense_vector。 // 7.x 支持的 dims 最大为 1024。...为了更好的利用DSL优化器,可以使用参数的方式提供一个查询向量。 4. 检查缺失值:如果文档中没有用于执行向量函数的向量字段的值,会抛出错误。...使用标准的sigmoid函数可以防止分数为负。 3.3 曼哈顿距离:l1norm l1norm函数计算给定查询向量和文档向量之间的L1距离(曼哈顿距离)。...• doc[].magnitude – 将向量的大小作为浮点数返回(对于7.5版本之前创建的向量,其向量的大小不会被存储)。所以这个函数每次被调用时都会进行重新计算。

    3.5K20

    理解 TypeScript 类型拓宽

    假设你正在编写一个向量库,你首先定义了一个 Vector3 接口,然后定义了 getComponent 函数用于获取指定坐标轴的值: interface Vector3 { x: number;...前面的 mixed 示例说明了数组的问题:TypeScript 应该推断 mixed 类型为元组类型吗?它应该为 mixed 推断出什么类型?对象也会出现类似的问题。...它需要推断一个足够具体的类型来捕获错误,但又不能推断出错误的类型。它通过属性的初始化值来推断属性的类型,当然有几种方法可以覆盖 TypeScript 的默认行为。...这是一个纯粹的类型级构造。...在下面的例子中,我们通过两个拓宽的字符串字面量类型来创建数组: // Type "http" (widening) const http = "http"; // Type "https" (widening

    1.6K40

    Glusterfs之rpc模块源码分析(中)之Glusterfs的rpc模块实现(3)

    iobref) {                 iobref = iobref_new ();//如果io缓存引用池为null就新建一个                 new_iobref...if (priv->incoming.iobref == NULL) {//io缓存引用池为null就新建一个                                         priv...= NULL) {//负载向量不为null                                         vector[count] = priv->incoming.payload_vector...//请求的数量等于2                         if (actor->vector_actor) {//向量过程不为null,就执行向量处理函数                                 ...glusterd_handle_create_volume,如果在处理rpc请求的过程中遇到错误就会向客户端发送一个错误信息的相应消息。

    1.2K40

    机器学习算法的R语言实现:朴素贝叶斯分类器

    对这三个特征描述的苹果中,对苹果的按味道进行分类,可取的值为good、bad。...朴素贝叶斯分类器就要要解决如下一个问题,已知苹果味道取good和bad的概率,那么如果给定一个一组苹果的特征,那么这个苹果味道取good和bad的概率是多少?这是个典型的逆概率的问题。...(reshape2)#1、根据训练集创建朴素贝叶斯分类器#1.1、生成类别的概率##计算训练集合D中类别出现的概率,即P{c_i}##输入:trainData 训练集,类型为数据框## strClassName...,pc,by="class.name",type="inner") #输出结果 ddply(class.all,....,如果为连续数据可先进行离散化; 3、训练集的特征取值要尽量完备,如果有缺失需进行预处理(Laplace校准); 4、关于特征值相互独立的假设,在实际问题中一般无法满足,但基于此假设做的预测是可以接受的

    72390

    R语言学习笔记之——数据处理神器data.table

    、parallel) 切片索引:subset——dplyr::select+filter 聚合运算:aggregate——plyr::ddply+mutate——dplyr::group_by+summarize...data.table 1、I/O性能: data.table的被推崇的重要原因就是他的IO吞吐性能在R语言诸多包中首屈一指,这里以一个1.6G多的2015年纽约自行车出行数据集为例来检验其性能到底如何,...注意以上新建列时,如果只有一列,列名比较自由,写成字符串或者变量都可以,但是新建多列,必须严格按照左侧列名为字符串向量,右侧为列表的模式,当然你也可以使用第二种写法。...mydata[carrier %in% c("AA","AS"),.N] [1] 26876 .N是一个计数函数,相当于plyr中的count,或者基础函数中的length。...左手用R右手Python系列——数据合并与追加 长宽转换: 长宽转换仍然支持plyr中的melt/dcast函数以及tidyr中的gather/spread函数。

    3.6K80

    PyTorch 4.0版本迁移指南

    在此版本中,我们引入了许多振奋人心的新功能和重要的bug修复,旨在为用户提供更好,更清晰的接口。...x.data的任何变化都不会被autograd跟踪,并且如果在反向传递中需要x,计算出的梯度会出错。...支持0维(标量)张量 在过去,索引到一个Tensor向量(1维张量)会得到一个Python数字,而索引到一个Variable向量中会得到一个尺寸为(1,)的向量!...类似的反应还存在与降阶函数中,例如tensor.sum()返回一个Python数字,但variable.sum()会重新调用一个尺寸为(1,)的向量。...而且,如果dtype没有给定,它会根据数据推理出合适的dtype。这是从现有数据(比如,Python列表)创建张量的推荐方法。

    2.8K20

    C++11:模板实现opencl向量类型的简单运算符重载及length,distance函数

    我们知道,在opencl内核代码中,向量类型(vector data type)的数据可以像普通标量类型(scala data type)一样,用各种算术和逻辑运算符进行操作。.../计算向量长度 非常方便,有时候,我们也需要在主机端代码中对这种向量类型的数据进行一些处理,但c/c++以及opencl的API本身并没有提供对这些向量类型的一般运算支持。...* 根据opencl 向量类型返回向量的元素类型和向量长度, * 如is_cl_vector::type 为 cl_int * is_cl_vector::...opencl向量类型的+,-运算,支持两个向量类型数据的加/减运算,以及一个向量和一个标量类型的加/减运算,以及legnth,distance函数。...is_cl_vector则用于判断一个类型是否是opencl的向量类型,如果是value为true,size中保存向量长度,type则是向量元素的类型。

    1.7K10

    C语言中数组长度的计算详解

    d\n", length); } 二、 在函数调用中计算数组的长度 上述计算数组长度的方法在函数调用中不可使用,有bug; 考虑下面代码: #include void test(...(arr) 计算得到的是一整段连续内存空间的大小,即36字节; 子函数中, 由于主函数中的数组首元素经过函数参数传递给子函数, 将实参赋值给形参的过程中,数组首元素转化为一个整型指针,所以子函数中sizeof...(arr)得到的是一个指针内存大小。...将二维数组都赋值为0;可以实现; 子函数中, 将二维数组赋值为0,失败;经过分析,子函数中一旦出现arr[i][i] 语句就会失败; 本人猜测的原因在于,arr在主函数中是数组首地址, arr在子函数中就是一个单纯的指针...; 其他解决办法: 1) 在子函数test中,函数声明变成如下所示,编译不会出错 void test(int arr[][n], int n) 2) 将arr声明为全局变量, 也不会有编译出错 3)

    3.1K40
    领券