首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

为什么cut()把我的POSIXct向量变成一个因子向量,我能做些什么来阻止它呢?

cut()函数是R语言中用于将连续变量划分为离散区间的函数。当使用cut()函数时,如果输入的变量是POSIXct类型的向量(表示日期和时间),则cut()函数会将其转换为因子向量。这是因为cut()函数默认将连续变量划分为等距离的区间,并将结果表示为因子。

如果你不希望cut()函数将POSIXct向量转换为因子向量,可以通过设置参数labels为FALSE来实现。具体来说,你可以使用以下代码来阻止cut()函数将POSIXct向量转换为因子向量:

代码语言:txt
复制
cut(x, breaks, labels = FALSE)

其中,x是输入的POSIXct向量,breaks是划分区间的边界值。

通过设置labels为FALSE,cut()函数将返回一个整数向量,而不是因子向量。这样可以保留POSIXct向量的类型。

需要注意的是,如果你希望将POSIXct向量划分为具有特定标签的离散区间,你可以自定义标签,并将labels参数设置为你自定义的标签向量。

总结起来,为了阻止cut()函数将POSIXct向量转换为因子向量,你可以使用labels = FALSE参数。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

R Tricks: 如何处理Gaps & Islands问题?

提 出问题 话说有个擅长使用SQL的小伙伴在StackOverflow上提出了这样一个问题,他说,Gaps & Islands问题在SQL中能很容易解决,那么在R中也能高效解决吗?...慢着——什么是Gaps & Islands问题?这个小伙伴举了个栗子来说明,让我们看一下。假如我们有如下数据集: ? 这是一个记录时间的数据集。...实际上,大猫听说在处理基因数据的时候也常遇见这个问题,但是大猫自己没有接触,欢迎有经验的小伙伴分享经历哦。 那么,如何处理Gaps & Islands问题呢?...顾名思义,它记录了每个ID中结束时间的累计最大值: ▶ dat[, etime.max := as.POSIXct(cummax(as.numeric(etime)), origin = '1970-01...其中,stime[2, .N]表示截取stime向量的第2个元素至最后一个元素,etime.max[1, (.N - 1)]表示截取etime.max向量的第1个元素至倒数第二个元素。

1.1K20

论程序员怎么拥有咪蒙的文笔

虽然我很讨厌咪蒙,但不可否认的是,咪蒙有很好的文笔~ 作为半个程序员的我,是怎么训练我的文笔的呢?...为了简化,把“辞藻华丽程度”量化为一个段落里的“形容词密度”,写一段代码用来统计各段落的形容词密度,然后把徐志摩的几篇散文放进去,让它输出辞藻华丽程度Top5的段落,结果如下: Top1 《北戴河海滨的幻想...什么伟大的深沉的鼓舞的清明的优美的思想的根源不是可以在风籁中,云彩里,山势与地形的起伏里,花草的颜色与香息里寻得?......由此我想到词向量的应用,如果你学过线性代数应该知道向量这个东西,词向量实际就是把一个词变成一个高维向量,变成向量的好处之一,是通过计算两个向量的相似度,来近似于他们在语料里边的相似度。...比如你想学金庸的描写手法,可以用词向量把他对一件事物的描写手法全部枚举出来。 试试枚举跟笑相关的描述 ?

55140
  • 基于Spark Tensorflow使用CNN处理NLP的尝试

    ,就是目前我还没想到如何把一些非文本类的因子给融合进去。...就是有时候我是希望能够做些特征工程,抽取出一些因子,然后加入到模型里面的。...b 为啥是一个size_out大小的一维张量呢?我们说CNN会阐述共享,就是一次卷积操作,也就是把图片扫描一遍,会共用一组参数。 下面一段代码设计到了很多数字,这些数字都是计算出来的。...接着再进行一次大小为 3X1的池化操作,按相同的公式计算,变成了 55X1。 接着再进行一次卷积,一次池化,变成了 51X1。 所以每个通道都是一个51维的向量。...这里还有一个问题,有时候我们希望能够把最后产生的那51个128维的向量给提取出来,因为这些向量是CNN对某个内容做完分析后抽取出来的特征。

    1K60

    基于Spark Tensorflow使用CNN处理NLP的尝试

    主要好处有: CNN能自动抽取出一些高级特征,减少了特征工程的时间 使用WordEmbedding技术将词汇表达为向量后,可以很方便的将文本表示为类似图片的2D向量 神经网络表达能力强 缺点的话,就是目前我还没想到如何把一些非文本类的因子给融合进去...就是有时候我是希望能够做些特征工程,抽取出一些因子,然后加入到模型里面的。...b 为啥是一个size_out大小的一维张量呢?我们说CNN会阐述共享,就是一次卷积操作,也就是把图片扫描一遍,会共用一组参数。 下面一段代码设计到了很多数字,这些数字都是计算出来的。...接着再进行一次大小为 3X1的池化操作,按相同的公式计算,变成了 55X1。 接着再进行一次卷积,一次池化,变成了 51X1。 所以每个通道都是一个51维的向量。...这里还有一个问题,有时候我们希望能够把最后产生的那51个128维的向量给提取出来,因为这些向量是CNN对某个内容做完分析后抽取出来的特征。

    1K20

    AI 行业实践精选:深度学习股市掘金

    为什么 NLP 与股票预测息息相关 在许多 NLP 问题中,我们最终会得到一个序列并将它编码成一个单个固定大小的形式,然后将该形式编码到另一个序列中。...所以我要做的第一件事是把它放在一个更低维的空间,比如说300维,因为我喜欢这部电影。 ? 当你奋力把4000维缩小至300维时,你的表情。...我们将采用一个函数,并将其应用到向量中的每个数字中,使它们都处于0和1之间(也可以是0和无穷大,视情况而定)。为什么呢?...现在谈论什么 暂且把市场向量放到一边,我们先来谈论下语言模型。...它是通过观察指数中每个股票特定期权的隐含波动率得出的。 旁注——为什么预测波动指数 VIX 使 VIX 成为有趣目标的原因在于: 它只是一个数字,而不是1000个股票。

    71640

    OpenBLAS项目与矩阵乘法优化 | 公开课+文字转录

    我把他的内容基本上是抠出来了,一步步带着大家过一下,如果我们从最简单的矩阵乘法实现,到一个高性能的矩阵乘法实现,大概是几步,怎么来的?或者是为什么优化,每一步能获得多少性能收益。...我想只要学过《线性代数》之类的,这种矩阵乘法,是一个非常简单的问题,如果转换成C代码来做的话,就是一个三重循环,我在这张图里列出了一个【i j k】的三重循环,这里面矩阵乘法的代码就已经是,它实现的功能就是矩阵...为什么呢,我们就做了一下最后的性能测试 这张图也是截自教程里,代表了一个性能图,越高越好。这里的测试平台是Intel core i5 ,只是测了单线程,没管多线程的事情。...随着规模变大,矩阵的性能在下降是为什么呢?因为在实现的过程中,没有考虑到cache的原因,当矩阵比较小的时候,速度还能快一些,当矩阵大了的时候,一定会跌下去,所以图里就有一个下滑的过程。...变成这样的实现之后,对整体的性能其实没什么帮助,那为什么换成这种形式来写呢,是为了之后的优化,留下一定的空间。 ?

    4.5K71

    周博磊:深度生成模型中的隐藏语义

    生成模型本身其实是一个卷积网络,每一层有很多的卷积神经元,通过逐渐把特征图放大,最后变成一张图片。这里就带来一个问题:为什么网络可以把一个完全噪声的向量变成一张图片?...这样我们就可以把预测出来的标签当做隐空间向量的真实标签,我们进一步再回到隐空间,把预测的标签当成真实标签,然后训练一个分类器,对隐空间向量进行分类。...另外这位女性觉得拍照角度不令人满意,我们可以把侧脸照变成正脸照,如果对自己的性别也不是很满意,我们照样能实现这个需求。每一个边界其实都是一个线性的二分类器。...但是我们实际需要的是编辑“自己”的图片,例如下图我个人真实的照片。但这就会面临一个问题:GAN逆映射(GAN Inversion) 为什么有这个问题?...为什么人脸生成器可以把一个非人脸的图片“完美”重建出来?我们进一步进行了测试,发现重建过程完全是在“过拟合”。

    1.6K10

    2022年3月_生信入门班_微信群答疑笔记

    这里为什么不能加逗号呢? 一句完整的R语言代码最后不需要加逗号的,这是一个规定好的基本语法,没有为什么。...你自己翻译一下它的英文说了个啥意思,然后就是我教你的判断,一个R包是否安装成功的标准是啥,你用那个标准来验证一下他是不是成功了。好吧,做完给我个反馈。...老师,我想问一下,像这样用tr把文件里的字符替换之后再用>重定向给源文件,为什么源文件就空了呢?我重定向给一个新的文件名就没问题 这是一个无解的问题,就是不能把同一个文件给重定向了,没有为什么的。...老师,这个图我已经能出结果了,不过为什么lable出来的总是setosa和virginica的P值呢?...上课练习服务器,一般有效期是两个月,实际上我们很久才清理一次账号,但是建议大家不要在练习服务器上保存重要数据 老师,我也报了两个班,怎么进另一个群呢 小助手有拉大家进群了 老师请问为啥这道题我把参数设置成有多个元素的数值型向量就报错了呢

    1.7K40

    OpenGL矩阵变换的数学推导

    还没有,大家可以想像一下,我把一个东西放在世界坐标系的某个地方,我可以从近处看观察它,也可以从远处观察它,还可以从上下左右观察它,甚至还可以倒着观察它,因些还需要确定我们观察它的状态。...、以及Camera的上方向向量得到对应的View Matrix,首先给Camera定一个坐标系: NUV这三个向量是怎么来的呢?...我们用一个括号把其中一个部分括了起来,外面乘了一个因子(-1/z0),后面会说这个因子是什么东西,现在只需要知道,x2、y2实际上就是前面括号里那堆东西,所以上面投影矩阵的第一行和第二行就自然能轻松地构造出来...第三行有4个值,现在都不知道是什么,我们需要构造4个未知数吗?对于解方程来说,在能解决问题的情况下,未知数能少就尽量少,不然只会徒增烦恼。 这里其实不需要4个未知数,为什么呢?...那就要理解z2这个值是什么东西,它就是投影之后未归一化的深度值,而深度和x0、y0没有关系,这个如何理解?就是说我把一个东西放在左,上边,还是右边,不影响它的深度,要改变深度需要前后移动。

    1.1K30

    全球股市巨震,如何用深度学习预测股价?

    ▌为什么 NLP 与股票预测息息相关 在许多 NLP 问题中,我们最终会得到一个序列并将它编码成一个单个固定大小的形式,然后将该形式编码到另一个序列中。...所以我要做的第一件事是把它放在一个更低维的空间,比如说300维,因为我喜欢这部电影。 当你奋力把4000维缩小至300维时,你的表情。...我们将采用一个函数,并将其应用到向量中的每个数字中,使它们都处于0和1之间(也可以是0和无穷大,视情况而定)。为什么呢?...▌现在谈论什么 暂且把市场向量放到一边,我们先来谈论下语言模型。...它是通过观察指数中每个股票特定期权的隐含波动率得出的。 旁注——为什么预测波动指数 VIX 使 VIX 成为有趣目标的原因在于: 它只是一个数字,而不是1000个股票。

    83250

    OpenGL矩阵变换的数学推导

    还没有,大家可以想像一下,我把一个东西放在世界坐标系的某个地方,我可以从近处看观察它,也可以从远处观察它,还可以从上下左右观察它,甚至还可以倒着观察它,因些还需要确定我们观察它的状态。...Camera的位置、朝向的点坐标、以及Camera的上方向向量得到对应的View Matrix,首先给Camera定一个坐标系:  [ot0j4l80eg.jpeg] NUV这三个向量是怎么来的呢?...我们用一个括号把其中一个部分括了起来,外面乘了一个因子(-1/z0),后面会说这个因子是什么东西,现在只需要知道,x2、y2实际上就是前面括号里那堆东西,所以上面投影矩阵的第一行和第二行就自然能轻松地构造出来...第三行有4个值,现在都不知道是什么,我们需要构造4个未知数吗?对于解方程来说,在能解决问题的情况下,未知数能少就尽量少,不然只会徒增烦恼。 这里其实不需要4个未知数,为什么呢?...那就要理解z2这个值是什么东西,它就是投影之后未归一化的深度值,而深度和x0、y0没有关系,这个如何理解?就是说我把一个东西放在左,上边,还是右边,不影响它的深度,要改变深度需要前后移动。

    6.6K62

    支持向量机(SVM)入门详解(续)与python实现

    还注意到式子中只有xi和x是向量,因此一部分可以从内积符号中拿出来,得到g(x)的式子为: 发现了什么?w不见啦!从求w变成了求α。 但肯定有人会说,这并没有把原问题简化呀。...例子是下面这张图: 我们把横轴上端点a和b之间红色部分里的所有点定为正类,两边的黑色部分里的点定为负类。试问能找到一个线性函数把两类正确分开么?...回想一下我们二维空间里的函数定义 g(x)=ax+b 变量x是一维的,为什么说它是二维空间里的函数呢?...以我们人类的常识来判断,说有一万个点都符合某种规律(因而线性可分),有一个点不符合,那这一个点是否就代表了分类规则中我们没有考虑到的方面呢(因而规则应该为它而做出修改)?...啰嗦了这么多,读者一定可以马上自己总结出来,松弛变量也就是个解决线性不可分问题的方法罢了,但是回想一下,核函数的引入不也是为了解决线性不可分的问题么?为什么要为了一个问题使用两种方法呢?

    1.6K90

    斯坦福CS224W 图与机器学习5】Spectral Clustering

    对于一个好的划分,一个很自然的想法,直觉上就是最大化组内连接数,最小化组间连接数 [gj2h67qvq1.jpeg] 因此,利用“edge cut”来定义划分: [76avalbqhu.svg] ,...但是如果我们想最小化cut有一个问题,如下图所示,当有一个节点度数为1时,切割这一条边可最小化cut,即cut=1,但是很显然这并不是最优化的划分结果,直觉上看,最优化的划分应该为蓝色线所示。...关于细节实现以及原理,有这样几个问题: Q1:拉普拉斯矩阵有怎样的性质? Q2:为什么是第二小特征值对应的特征向量?(为什么不是最小的?) Q3:为什么用特征向量聚类来实现划分?...这样的划分为什么是合理的?...为什么不是利用 [fv87ukp6ia.svg] 呢,因为 [fv87ukp6ia.svg] 恒为0,此时图一定是不连通的,最小化没有意义,所以要给一个限制条件后利用第二小的特征值。

    1K30

    学习SVM(五)理解线性SVM的松弛因子

    Support Vector) 学习SVM(五)理解线性SVM的松弛因子 先说一个事引出这个博客的内容,我最近投的一篇论文被拒稿,用到的方法使SVM(很惭愧,还在用20年前的算法,当然这并不是重点)...,审稿意见里面有一段话是这样说的(说的很中肯):“该方法本身的特点来看就很难达到100%正确率”,当然这并不是说SVM无法做到100%,我理解的很难达到的原因就是在于SVM算法本身的松弛因子的引入。...为什么要引入松弛因子 从前面四个内容来看,SVM理论可以完美的找到正负样本间的最大的分类间隔,这意味着不仅仅可以实现对训练数据的分类,还保证了决策平面是最理想的。那么SVM为什么还要引入松弛因子呢?...Screenshot (44).png 可以拿一个很直观的例子说明惩罚因子C的影响,C越大意味着对训练数据而言能得到很好的分类结果,但是同时最大分类间隔就会变小,毕竟我们做模型不是为了在训练数据上有个多么优异的结果...2.拉格朗日乘子法为新的约束条件引入的参数。 需要注意的是,参数C是一个已知量,是人为设定的! 拉格朗日函数: ? 其中,a和u是拉格朗日乘子,对偶后就变成了: ?

    1.7K50

    12. 泊松图像编辑

    (这里我把苍老师的权重设置为0.2,鄙人的手的权重设为0.8) ? 那么用多频带融合呢?得到的结果也无法达到要求,甚至更是难看: ?...泊松融合的原理 讲了这么多泊松图像编辑的好处,那么到底它的原理是怎样的呢?为什么叫做泊松图像编辑呢?我们先来看看最基本的泊松融合。 2.1 基本的泊松融合 我们先对这个问题做一些基本符号定义。...这里:∇f 指的是图像函数f的梯度 ? v在原论文中是指一个引导向量场(guidance field),当用于图像合成时,它指的就是源图像的梯度。...这里我讲讲CMU课程中提到的一种方法,它的关键是将上述泊松方程表示为线性向量形式Af=b ? 等号的右边是图像g中每一个像素的拉普拉斯滤波结果∆gp,这很容易理解。...我把A写成下面的形式你可能更容易理解(别忘了矩阵和向量的乘法的基本过程,可以稍稍复习下大一的基本知识?) ? 对于每一个元素fp,它的拉普拉斯算子作用结果是4fp 减去p的所有4邻域像素值的和。

    1.1K30

    R语言基础教程——第3章:数据结构——因子

    因子在R中非常重要,因为它决定了数据的分析方式以及如何进行视觉呈现。...因子(factor)是R语言中比较特殊的一个数据类型, 它是一个用于存储类别的类型,举个例子,从性别上,可以把人分为:男人和女人,从年龄上划分,又可以把人分为:未成年人(=18)。...R把表示分类的数据称为因子,因子的行为有时像字符串,有时像整数。因子是一个向量,通常情况下,每个元素都是字符类型,也有其他数据类型的元素。...)函数可以把因子转换成对应的整数. > as.integer(sex) [1] 1 2 1 1 2 7 把连续变量分割为类别 函数cut()能够把数值变量切成不同的块,然后返回一个因子. cut(x,...breaks, labels = NULL) 参数注释: x:数值变量 breaks:切割点向量 labels:每一个分组的标签 例如,把身高数据,按照指定的切割点向量分割: cut(heights$height_cm

    4.4K30

    「Deep Learning」读书系列分享第二章:线性代数 | 分享总结

    像这个 x 是一个单位向量,它的特点是长度是 1 个单位。 关于向量,有这两种理解: 把它当做线性空间里面一个点 把它当做带有方向一个线段 这两种都可以。...这个 (x y z) 这是一个向量,一个矩阵对它进行变换之后变成了 (ax by cz),对应的就是把原来的 X、Y、Z 三个方向分别作 a、b、c 放大。 ? 在图上面怎么理解呢?...如果里面有这样情况,这就是矩阵不可逆的情况,它的行列式是 0。0 的话会有什么变化?原来这是一个坐标系,到这里变成一条线了,这就是做了一个降维操作,把两维的变成一位了。那一位能返回去吗?...形象理解就是站在上面,然后把箱子往这边推,底部是不动的,那么就有一个推移的动作。为什么会这样?大家可以拿这个矩阵,随机取一个点去感受一下。 第一行始终作用在 X 轴方向上,它跟原来相比加了一项。...接下来讲矩阵的特征值和特征向量。先有直观概念,特征向量反映的是经过这次变换之后它的变化方向;特征值反映的是变换的幅度。为什么会这样?往下看。 ?

    1.1K50

    SVM-支持向量机算法概述

    还注意到式子中只有xi和x是向量,因此一部分可以从内积符号中拿出来,得到g(x)的式子为: ? 发现了什么?w不见啦!从求w变成了求α。 但肯定有人会说,这并没有把原问题简化呀。...小Tips:为什么说f(y)=ay是四维空间里的函数? 大家可能一时没看明白。回想一下我们二维空间里的函数定义 g(x)=ax+b 变量x是一维的,为什么说它是二维空间里的函数呢?...以我们人类的常识来判断,说有一万个点都符合某种规律(因而线性可分),有一个点不符合,那这一个点是否就代表了分类规则中我们没有考虑到的方面呢(因而规则应该为它而做出修改)?...把损失加入到目标函数里的时候,就需要一个惩罚因子(cost,也就是libSVM的诸多参数中的C),原来的优化问题就变成了下面这样: ?...啰嗦了这么多,读者一定可以马上自己总结出来,松弛变量也就是个解决线性不可分问题的方法罢了,但是回想一下,核函数的引入不也是为了解决线性不可分的问题么?为什么要为了一个问题使用两种方法呢?

    72310

    【转载】理解矩阵(三)

    要我说,还不如反复强调这一个事情,把它深深刻在脑子里,别的东西忘了就忘了,真碰到问题了,再查数学手册嘛,何必因小失大呢? 言归正传。...换句话说,你不是有一个坐标系M吗,现在我让它乘以个\(M^{-1}\),变成\(I\),这样一来的话,原来M坐标系中的a在\(I\)中一量,就得到b了。...而让它原形毕露的办法,就是把原来那个坐标系: 2 0 0 3 的x方向度量缩小为原来的1/2,而y方向度量缩小为原来的1/3,这样一来坐标系就变成单位坐标系I了。...在这里,我实际上已经回答了一般人在学习线性代数是最困惑的一个问题,那就是为什么矩阵的乘法要规定成这样。...至于矩阵乘以向量为什么要那样规定,那是因为一个在M中度量为a的向量,如果想要恢复在I中的真像,就必须分别与M中的每一个向量进行內积运算。我把这个结论的推导留给感兴趣的朋友吧。

    43221

    如何用Python和机器学习训练中文文本情感分类模型?

    这就叫向量化。 这个例子里面,特征的数量叫做维度。于是向量化之后的这两句话,都有5个维度。 你一定要记住,此时机器依然不能理解两句话的具体含义。但是它已经尽量在用一种有意义的方式来表达它们。...例如把: “我喜欢这个游戏” 变成: “我 喜欢 这个 游戏” 这样一来,就可以仿照英文句子的向量化,来做中文的向量化了。 你可能担心计算机处理起中文的词语,跟处理英文词语有所不同。...举一反三,你会发现分词后的中文语句: “我 喜欢 这个 游戏” 其中的“这个”应该也是停用词吧? 答对了! 要处理停用词,怎么办呢?当然你可以一个个手工来寻找,但是那显然效率太低。...为了做特征向量化,下面我们利用结巴分词工具来拆分句子为词语。 import jieba 我们建立一个辅助函数,把结巴分词的结果用空格连接。...看,我们刚才做的工作,都在管道里面了。我们可以把管道当成一个整体模型来调用。 下面一行语句,就可以把未经特征向量化的训练集内容输入,做交叉验证,算出模型分类准确率的均值。

    1.7K30
    领券