开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

使用lubridate中的parse_date_time()解析的日期在与tibble合并时会丢失其格式

在使用lubridate包中的parse_date_time()函数解析日期时，确实可能会遇到在与tibble或其他数据框合并时丢失格式的问题。这通常是因为日期时间对象在R中被存储为特殊的类（如POSIXct或POSIXlt），而这些类在数据框中可能不会被保留其原始格式。

基础概念

lubridate: 是R语言中的一个包，专门用于处理日期和时间。
parse_date_time(): 是lubridate包中的一个函数，用于解析各种格式的日期时间字符串。
tibble: 是R语言中的一个数据框类，类似于传统的data.frame，但具有更好的打印性能和一些额外的功能。

相关优势

lubridate: 提供了简单易用的接口来处理复杂的日期时间格式。
tibble: 提供了更现代的数据框操作方式，易于处理和查看。

类型与应用场景

日期时间类型: 在R中，日期时间可以是Date、POSIXct或POSIXlt类型。
应用场景: 数据分析、数据清洗、时间序列分析等。

问题原因

当使用parse_date_time()解析日期并将其存储在tibble中时，日期时间对象可能会被转换为基本的数据类型（如数值或字符），从而丢失其原始的日期时间格式。

解决方法

为了避免这个问题，可以在合并之前确保日期时间对象保持其原始格式。以下是一些解决方法：

方法一：保留原始格式

在解析日期时间后，直接将其存储在tibble中，而不是进行转换。

library(lubridate)
library(tibble)

# 示例数据
date_str <- "2023-04-30 12:34:56"
date_time <- parse_date_time(date_str, "ymd HMS")

# 创建tibble并存储日期时间对象
df <- tibble(date_time = date_time)

# 查看结果
print(df)

方法二：使用`as.character()`转换

如果需要在合并时保持格式，可以先将日期时间对象转换为字符类型。

library(lubridate)
library(tibble)

# 示例数据
date_str <- "2023-04-30 12:34:56"
date_time <- parse_date_time(date_str, "ymd HMS")

# 转换为字符类型
date_time_char <- as.character(date_time)

# 创建tibble并存储字符类型的日期时间
df <- tibble(date_time = date_time_char)

# 查看结果
print(df)

方法三：在合并时指定列类型

在合并数据框时，可以显式指定日期时间列的类型。

library(lubridate)
library(tibble)

# 示例数据
date_str <- "2023-04-30 12:34:56"
date_time <- parse_date_time(date_str, "ymd HMS")

# 创建两个tibble
df1 <- tibble(id = 1, date_time = date_time)
df2 <- tibble(id = 1, value = 100)

# 合并数据框并指定列类型
result <- left_join(df1, df2, by = "id") %>%
  mutate(date_time = as.POSIXct(date_time))

# 查看结果
print(result)

通过这些方法，可以确保在使用lubridate解析日期时间并在tibble中处理时，不会丢失其格式。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

R语言：哪个函数解析时间最快？

写在前面本期依旧由村长为大家供稿，主要讲述R语言在时间格式处理中的很多问题。...问题提出把“以字符格式存储”（chr）的时间日期数据解析成R中的时间日期（Date，POSIXct, POSIXlt...）格式是一项非常常见的工作。...举个例子，如果用ASCII编码字符“2019-01-19”，里面有10个字符，每个字符占用8 bit，那么一共要用80 bit，但是在R的“Date”格式中，这个日期实际上用整数“17951”代表（R中的代码是...不过，快也是有代价的，为了使用fast_strptime，我们必须手动指定需要解析的日期格式，在我们的例子中就是"%Y-%m-%d"。...而且fast_strptime也有对应的变体，例如parse_date_time和parse_date_time2。不过这些变体所用的时间和其原型几乎没有差别，因此并没有放到本次测试中。

1.5K5 0

Fama French (FF) 三因子模型和CAPM模型分析股票市场投资组合风险收益可视化

这篇文章的很大一部分内容涉及从FF网站导入数据，并对其进行整理，以用于我们的投资组合收益。我们将看到，处理数据在概念上很容易理解，但在实际操作中却很耗时。...我们可以使用该 lubridate 包将该日期字符串解析为更好的日期格式。我们将使用该 parse_date_time() 函数，并调用该 ymd() 函数以确保最终结果为日期格式。...同样，在处理来自新来源的数据时，日期，任何列都可以有多种格式。...但是，请注意 FF 使用当月的第一天，而我们的投资组合收益使用的是当月的最后一天。这会将每月日期回滚到上个月的最后一天。我们 FF 数据中的第一个日期是“1990-07-01”。让我们回滚。...最后，我们只想要与我们的投资组合数据一致的 FF 因子数据，因此我们在投资组合返回对象中按日期first() 和 last()日期filter()。

3.9K3 0

《高效R语言编程》6--高效数据木匠

这是本书最重要的一章，将涉及以下内容：使用tidyr整理数据使用dplyr处理数据使用数据库使用data.table处理数据软件配置 library("tibble") library("tidyr...tibble会打印每个变量的类，data.frame不会 stringAsFactors默认不转换输出时，只输出前10行使用tidyr与正则表达式整理数据整理数据包括数据清理和数据重构，前者是重定格式与标记脏数据...通常的数据清理是将非标准文本字符串转换成lubridate简介所描述的数据格式。vignette("lubridate") ? 整洁是个广泛的概念，也包括重构数据，以便有利于数据分析和建模。...与基本R中类似函数不同，变量无需使用 $ 操作符就可直接使用，设计与magrittr包的%>%管道操作符一起使用，以允许每个数据阶段写成新的一行。其是一个大型包，本身可以看成一门语言。...非标准计算代码中没有引号包裹的原始名字，这种方式叫做非标准计算（NSE），高效交互使用函数，减少键盘输入，允许Rstudio中自动完成。还是函数名多个_。

1.9K2 0

R语言中的生存分析Survival analysis晚期肺癌患者4例

第一步是确保将这些格式设置为R中的日期。让我们创建一个小的示例数据集，其中sx_date包含手术日期和last_fup_date上次随访日期的变量。...例如，如果您的日期格式为m / d / Y，则需要format = "%m/%d/%Y" 格式化日期-lubridate程序包我们还可以使用该lubridate包来格式化日期。...在base中R，用于difftime计算两个日期之间的天数，然后使用将其转换为数字值as.numeric。然后将除以365.25年的平均天数转换为年。...第2部分：地标分析和时间相关协变量在第1部分中，我们介绍了使用对数秩检验和Cox回归来检验感兴趣的协变量与生存结果之间的关联。...使用BMT数据的Cox回归界标示例在Cox回归中，可以使用中的subset选项coxph来排除那些在标志性时间内没有被随访的患者时间相关协变量界标分析的替代方法是合并时间相关的协变量。

1.2K1 0

R语言中的生存分析Survival analysis晚期肺癌患者4例

第一步是确保将这些格式设置为R中的日期。让我们创建一个小的示例数据集，其中sx_date包含手术日期和last_fup_date上次随访日期的变量。...例如，如果您的日期格式为m / d / Y，则需要format = "%m/%d/%Y" 格式化日期-lubridate程序包我们还可以使用该lubridate包来格式化日期。...在base中R，用于difftime计算两个日期之间的天数，然后使用将其转换为数字值as.numeric。然后将除以365.25年的平均天数转换为年。...第2部分：地标分析和时间相关协变量在第1部分中，我们介绍了使用对数秩检验和Cox回归来检验感兴趣的协变量与生存结果之间的关联。...使用BMT数据的Cox回归界标示例在Cox回归中，可以使用中的subset选项coxph来排除那些在标志性时间内没有被随访的患者时间相关协变量界标分析的替代方法是合并时间相关的协变量。

1.8K1 0

R语言日期、时间和lubridate包

" 二、把文本解析成日期和时间 1、as.Date() 当导入数据时日期值通常以字符串的形式输入到R中，这时需要转化为以数值形式存储的日期变量。...用as.Date()把文本转换为Date类型：其语法为as.Date(x,"input_format"),其中x是字符型数据，#input_format则给出了用于读入日期的适当格式 %d 数字表示的日期...，返回POSIXlt日期（即以列表的形式存储日期和时间）,在解析时必须制定文本和日期对应的位置，日期的格式使用%+字母来指定。...(today, format="%A") [1] "星期三" 4、计算时间间隔 1）：R的内部在存储日期时，是使用1970年1月1日以来的天数表示的，更早的日期则表示为负数。...lubridate中所有解析函数都会返回POSIXct日期，默认都是用UTC时区。

5.8K1 0

左手用R右手Python系列14——日期与时间处理

日期与时间格式数据处理通常在数据过程中要相对复杂一些，因为其不仅涉及到不同国家表示方式的差异，本身结构也较为复杂，在R语言和Python中，存在着不止一套方法来处理日期与时间，因而做一个清洗的梳理与对比将会很有价值...as.Date() 日期与时间变量的格式通常在文件导入之后就丢失了（有些特殊文件格式确实会有保留机制），导入之后会统一还原为字符串，需要我们自行根据其格式进行日期与时间格式的转换。...R语言默认的日期格式按照识别优先级，分别是”%Y-%m-%d” 或者 “%Y/%m/%d”,倘若你导入之前的日期是此种格式，那么在使用as.Date()格式进行日期转换时，便无需显式声明该日期的原始格式...因而POSIXct函数使用的更为频繁，这里以POSIXct函数为主进行讲解。 POSIXct函数与as.Date()函数类似，在日期输入时，默认支持的日期格式是包含月日年，由斜杠或者破折号分割。...该包封装了大量简化时间与日期操作的函数，也是我平时用于处理时间日期使用频率最高的包。 library(“lubridate”) lubridate可以识别的日期格式非常丰富。

2.3K7 0

【视频】R语言生存分析原理与晚期肺癌患者分析案例|数据分享|附代码数据

第一步是确保将这些格式设置为R中的日期。让我们创建一个小的示例数据集，其中sx_date包含手术日期和last_fup_date上次随访日期的变量。...例如，如果您的日期格式为m / d / Y，则需要format = "%m/%d/%Y" 格式化日期-lubridate程序包我们还可以使用该lubridate包来格式化日期。...在base中R，用于difftime计算两个日期之间的天数，然后使用将其转换为数字值as.numeric。然后将除以365.25年的平均天数转换为年。...第2部分：地标分析和时间相关协变量在第1部分中，我们介绍了使用对数秩检验和Cox回归来检验感兴趣的协变量与生存结果之间的关联。...使用BMT数据的Cox回归界标示例在Cox回归中，可以使用中的subset选项coxph来排除那些在标志性时间内没有被随访的患者时间相关协变量界标分析的替代方法是合并时间相关的协变量。

6940 0

翻译｜给数据科学家的10个提示和技巧Vol.1

只需在by中添加列，这些列称之为“键”，比如by = c("x1" = "x2"， "y1" = "y2") ，结果如下所示： library(dplyr) set.seed(5) df1 tibble...for循环在R中存储模型假设我们想对鸢尾花数据集中的每个物种分别构建不同的回归模型，可以使用以下两种不同的方法: 用一个列表存储模型 my_models<-list() for (s in unique...，如下所示: colnames(df)[max.col(df,ties.method="random")] [1] "V1" "V2" "V2" "V1" 2.5 生成随机日期可以使用均匀分布从特定范围的...例如，生成10个随机日期: library(lubridate) lubridate::as_datetime( runif(10, 1546290000, 1577739600)) [1] ".../usr/bin/python3 在许多.py文件中，脚本顶部可能出现shebang行。它的作用是设置解释器的位置。通过在脚本顶部添加#!

4774 0

【视频】R语言生存分析原理与晚期肺癌患者分析案例|数据分享|附代码数据

第一步是确保将这些格式设置为R中的日期。让我们创建一个小的示例数据集，其中sx_date包含手术日期和last_fup_date上次随访日期的变量。...例如，如果您的日期格式为m / d / Y，则需要format = "%m/%d/%Y" 格式化日期-lubridate程序包我们还可以使用该lubridate包来格式化日期。...在base中R，用于difftime计算两个日期之间的天数，然后使用将其转换为数字值as.numeric。然后将除以365.25年的平均天数转换为年。...第2部分：地标分析和时间相关协变量在第1部分中，我们介绍了使用对数秩检验和Cox回归来检验感兴趣的协变量与生存结果之间的关联。...使用BMT数据的Cox回归界标示例在Cox回归中，可以使用中的subset选项coxph来排除那些在标志性时间内没有被随访的患者时间相关协变量界标分析的替代方法是合并时间相关的协变量。

4540 0

【视频】R语言生存分析原理与晚期肺癌患者分析案例|数据分享

第一步是确保将这些格式设置为R中的日期。让我们创建一个小的示例数据集，其中sx_date包含手术日期和last_fup_date上次随访日期的变量。...例如，如果您的日期格式为m / d / Y，则需要format = "%m/%d/%Y" 格式化日期-lubridate程序包我们还可以使用该lubridate包来格式化日期。...在base中R，用于difftime计算两个日期之间的天数，然后使用将其转换为数字值as.numeric。然后将除以365.25年的平均天数转换为年。...第2部分：地标分析和时间相关协变量在第1部分中，我们介绍了使用对数秩检验和Cox回归来检验感兴趣的协变量与生存结果之间的关联。...使用BMT数据的Cox回归界标示例在Cox回归中，可以使用中的subset选项coxph来排除那些在标志性时间内没有被随访的患者时间相关协变量界标分析的替代方法是合并时间相关的协变量。

1.4K3 0

【视频】R语言生存分析原理与晚期肺癌患者分析案例|数据分享|附代码数据

第一步是确保将这些格式设置为R中的日期。让我们创建一个小的示例数据集，其中sx_date包含手术日期和last_fup_date上次随访日期的变量。...例如，如果您的日期格式为m / d / Y，则需要format = "%m/%d/%Y" 格式化日期-lubridate程序包我们还可以使用该lubridate包来格式化日期。...在base中R，用于difftime计算两个日期之间的天数，然后使用将其转换为数字值as.numeric。然后将除以365.25年的平均天数转换为年。...第2部分：地标分析和时间相关协变量在第1部分中，我们介绍了使用对数秩检验和Cox回归来检验感兴趣的协变量与生存结果之间的关联。...使用BMT数据的Cox回归界标示例在Cox回归中，可以使用中的subset选项coxph来排除那些在标志性时间内没有被随访的患者时间相关协变量界标分析的替代方法是合并时间相关的协变量。

4810 0

R 机器学习预测时间序列模型

目前我们经常会用到ARIMA来预测疾病在未来的变化趋势。...这里只需要日期与当日的使用量“date” and “value”。然后可以简单绘制一下。注意这里的时间序列是tibble格式。...该过程使用“日期”列创建了我要建模的45个新的列。这些列包含了时间序列的详细信息及傅立叶变化的数据。...为什么需要recipe是因为在tidymodel里面，设置了建立机器学习模型的一套准则，感兴趣可以去：机器学习模型这里我们新建了glmnet与RF模型。...现在我们有了几个时间序列模型，让我们对其进行分析，并通过模型时间工作流程预测未来变化趋势。 Modeltime使用ID来定位我们之前建立的模型，以帮助我们识别模型。

9493 0

【视频】R语言生存分析原理与晚期肺癌患者分析案例|数据分享|附代码数据

第一步是确保将这些格式设置为R中的日期。让我们创建一个小的示例数据集，其中sx_date包含手术日期和last_fup_date上次随访日期的变量。...例如，如果您的日期格式为m / d / Y，则需要format = "%m/%d/%Y" 格式化日期-lubridate程序包我们还可以使用该lubridate包来格式化日期。...在base中R，用于difftime计算两个日期之间的天数，然后使用将其转换为数字值as.numeric。然后将除以365.25年的平均天数转换为年。...第2部分：地标分析和时间相关协变量在第1部分中，我们介绍了使用对数秩检验和Cox回归来检验感兴趣的协变量与生存结果之间的关联。...使用BMT数据的Cox回归界标示例在Cox回归中，可以使用中的subset选项coxph来排除那些在标志性时间内没有被随访的患者时间相关协变量界标分析的替代方法是合并时间相关的协变量。

9500 0

如何用R和API免费获取Web数据？

我们在浏览器里，看到上图中那一长串文字。你可能感觉很奇怪——这是什么玩意儿？恭喜你，这就是我们需要获得的数据了。只不过，它使用了一种特殊的数据格式，叫做JSON。...中间我们跳过的，是10月2日到10月30日之间的数据。存储格式都是一样的，也只是日期和访问量两项数据值在变化。需要的数据都在这里，你只需要提取出相应的信息，就可以了。...操作实际操作过程中，我们从维基百科上换另外一篇维基文章作为样例，以证明本操作方法的通用性。选择的文章是我们在介绍词云制作时使用过的，叫做“Yes, Minisiter”。...但是这个日期格式不是标准格式，后面分析会有问题。我们需要做转化。处理时间日期格式，最好的办法是用lubridate软件包。我们先调用它。...library(stringr) 然后我们开始转换，先用str_sub函数（来自于stringr软件包）把日期字符串的后两位抹掉，然后用lubridate软件包里面的ymd函数，将原先的字符串转换为标准日期格式

2.2K2 0

【视频】R语言生存分析原理与晚期肺癌患者分析案例|数据分享|附代码数据

第一步是确保将这些格式设置为R中的日期。让我们创建一个小的示例数据集，其中sx_date包含手术日期和last_fup_date上次随访日期的变量。...例如，如果您的日期格式为m / d / Y，则需要format = "%m/%d/%Y"格式化日期-lubridate程序包我们还可以使用该lubridate包来格式化日期。...，我们使用中位数对其进行量化。...第2部分：地标分析和时间相关协变量在第1部分中，我们介绍了使用对数秩检验和Cox回归来检验感兴趣的协变量与生存结果之间的关联。...使用BMT数据的Cox回归界标示例在Cox回归中，可以使用中的subset选项coxph来排除那些在标志性时间内没有被随访的患者时间相关协变量界标分析的替代方法是合并时间相关的协变量。

7380 0

数据处理的R包

使用plyr包可以针对不同的数据类型，在一个函数内同时完成split – apply – combine三个步骤。...格式数据的整合，tidyr是同样也是出自 Hadley Wickham，常与dplyr包结合使用。...Lubridate包可以减少在R中操作时间变量，内置函数提供了很好的解析日期与时间的便利方法。lubridate 包是 Hadley Wickham开发的用于高效处理时间数据的 R 包。...（base包函数） [1] "2020-01-23" （2）日期格式转化日期值通常以文本的形式输入到R中，然后转化为以数值形式存储的日期变量。...可以方便的与ggplot进行涂层叠加，实现在R中的地图绘制需求。 ggmap包中的函数 get_map：ggmap包中最基本函数，用来下载地图。 geocode：用来返回某地的经纬度。

4.7K2 0

一步解决R中中文字符问题

❝今天会员交流群内有朋友询问图片预览遇到问题该如何解决，本节就来详细介绍一下R中图形预览及导出会遇到的问题，个人观点仅供参考。...可以看到如往常一样，中文字符也是以方块的形式展示，但是如果我们点击Export将其导出为pdf格式可以看到中文字符正常显示了，如下图所示。...❝Cairo是R中的一个包，用于创建向量图形（如PDF、SVG）和位图图形（如PNG、BMP、GIF、JPEG）。它基于Cairo图形库，该库是一个跨平台的图形API，支持多种输出设备。...❞ 安装cairo包 install.packages("Cairo") 修改Graphics设置 ❝要访问和修改这些设置，可以在RStudio中按照以下步骤操作： 1.打开RStudio 2.在菜单栏中...（全局选项...） 3.在弹出的Options窗口中，从左侧菜单选择General 在General设置中，找到Graphics这里列出了上述的一些设置项，选择Cairo点击Apply->OK ❞ 完成上述设置后

6671 0

时间序列分解和异常检测方法应用案例

在这篇文章中，我们将概述anomalize它的作用和方式。案例研究我们与许多教授数据科学的客户合作，并利用我们的专业知识加速业务发展。...的frequency和trend参数是基于使用所述时间序列的时间尺度（或周期性）自动设置tibbletime在引擎盖下基于函数。...它使用基于STL的离群值检测方法，其具有围绕时间序列分解的余数的3X内四分位数范围。它非常快，因为最多有两次迭代来确定异常值带。但是，它没有设置整洁的工作流程。也不允许调整3X。...一些时间序列可能需要更多或更少，这取决于剩余部分的方差的大小与异常值的大小的关系。 tsoutliers包该tsoutliers软件包非常有效地用于检测异常的许多传统预测时间序列。...基于时间：整个工作流程使用tibbletime基于时间的索引设置数据。这很好，因为根据我们的经验，几乎所有时间数据都带有日期或日期时间戳，这对数据的特征非常重要。

1.5K3 0

盘一盘Tidyverse| 只要你要只要我有-filter 筛选行

，可以根据使用filter()函数筛选出后续需要的“行”子集。... 1 Big brown bat 19.7 2 Thick-tailed opposum 19.4 2 筛选sleep_total在16...1 filter_all()筛选所有行 #筛选name:order, sleep_total, -vore中，任何一列包含“Ca”的所有行 msleep %>% select(name:order, sleep_total...is.numeric, is.integer, is.double, is.logical, is.factor判别，日期数据的话，可以加载 lubridate 包，使用 is.POSIXt 或者 is.Date.... 3 filter_at()筛选条件列优点：自定义待筛选的列，无需指定待筛选的列的类型 #筛选sleep_total, sleep_rem两个变量，所有值均大于5的行 msleep %>%

1.3K1 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭