开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

如何在R中使用function创建新列？

在R中使用function创建新列的方法是通过数据框的dplyr包来实现的。dplyr包提供了一组简洁且高效的函数来对数据框进行操作。

首先，需要安装并加载dplyr包：

install.packages("dplyr")
library(dplyr)

接下来，可以使用mutate()函数来创建新列。mutate()函数可以在数据框中添加新的变量，并根据现有变量进行计算或转换。

假设我们有一个名为df的数据框，其中包含两列：age和salary。我们想要创建一个新列birth_year，用于计算年龄对应的出生年份。可以使用以下代码实现：

df <- df %>% mutate(birth_year = 2021 - age)

上述代码中，df %>%表示将df数据框作为管道输入，然后使用mutate()函数创建新列birth_year，并通过2021减去age计算出出生年份。

如果需要使用自定义的函数进行计算，可以将函数作为mutate()函数的参数。例如，假设我们有一个名为calculate_bonus()的函数，用于根据工资计算奖金。可以使用以下代码创建一个新列bonus：

calculate_bonus <- function(salary) {
  # 自定义函数计算奖金
}

df <- df %>% mutate(bonus = calculate_bonus(salary))

需要根据具体的需求定义自定义函数calculate_bonus()。

至于腾讯云相关产品和产品介绍链接地址，请访问腾讯云官方网站（https://cloud.tencent.com/）获取相关信息。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

【DB笔试面试550】在Oracle中，函数索引是什么？

在Oracle中，有一类特殊的索引，称为函数索引（Function-Based Indexes，FBI），它基于对表中列进行计算后的结果创建索引。函数索引在不修改应用程序的逻辑基础上提高了查询性能。如果没有函数索引，那么任何在列上执行了函数的查询都不能使用这个列的索引。当在查询中包含该函数时，数据库才会使用该函数索引。函数索引可以是一个B-Tree索引或位图索引。

01

Excel图表学习76：Excel中使用超链接的交互式仪表图

仔细观察图1，会发现我们只有一个图表，并且根据用户选择的选项来更改图表的源数据。因此，假设有4个系列的数据——销售额、成本、利润和顾客数量，我们将添加第五个系列。这将始终显示用户选择的系列的数据，如下图2所示。

02

SparkR：数据科学家的新利器

摘要：R是数据科学家中最流行的编程语言和环境之一，在Spark中加入对R的支持是社区中较受关注的话题。作为增强Spark对数据科学家群体吸引力的最新举措，最近发布的Spark 1.4版本在现有的Scala/Java/Python API之外增加了R API（SparkR）。SparkR使得熟悉R的用户可以在Spark的分布式计算平台基础上结合R本身强大的统计分析功能和丰富的第三方扩展包，对大规模数据集进行分析和处理。本文将回顾SparkR项目的背景，对其当前的特性作总体的概览，阐述其架构和若干技术关键点，最后进行展望和总结。

02

【数据科学家】SparkR：数据科学家的新利器

摘要：R是非常流行的数据统计分析和制图的语言及环境，有调查显示，R语言在数据科学家中使用的程度仅次于SQL，但大数据时代的海量数据处理对R构成了挑战。摘要：R是数据科学家中最流行的编程语言和环境之一，在Spark中加入对R的支持是社区中较受关注的话题。作为增强Spark对数据科学家群体吸引力的最新举措，最近发布的Spark 1.4版本在现有的Scala/Java/Python API之外增加了R API（SparkR）。SparkR使得熟悉R的用户可以在Spark的分布式计算平台基础上结合R本身强大的统计

翻译|给数据科学家的10个提示和技巧Vol.2

原文：10 Tips And Tricks For Data Scientists Vol.2[1]

03

R语言中 "apply" 函数详解

数据操作是机器学习生命周期中最关键的步骤之一。它需要转换所提供的数据，以便用于建立预测模型。

04

「R」ggplot2在R包开发中的使用

没有特别系统的学习 tidy evaluation 这方面的高级操作，最近有空准备补一补，学习下这方面的知识。

03

如何在Hue中添加Spark Notebook

CDH集群中可以使用Hue访问Hive、Impala、HBase、Solr等，在Hue3.8版本后也提供了Notebook组件（支持R、Scala及python语言），但在CDH中Hue默认是没有启用Spark的Notebook，使用Notebook运行Spark代码则依赖Livy服务。在前面Fayson也介绍了《Livy，基于Apache Spark的开源REST服务，加入Cloudera Labs》、《如何编译Livy并在非Kerberos环境的CDH集群中安装》、《如何通过Livy的RESTful API接口向非Kerberos环境的CDH集群提交作业》、《如何在Kerberos环境的CDH集群部署Livy》、《如何通过Livy的RESTful API接口向Kerberos环境的CDH集群提交作业》、《如何打包Livy和Zeppelin的Parcel包》和《如何在CM中使用Parcel包部署Livy及验证》，本篇文章Fayson主要介绍如何在Hue中添加Notebook组件并集成Spark。

03

Shinyforms | 用 Shiny 写一个信息收集表

创建问题列表。每个问题都是一个带有 id，type，title 以及 mandatory （mandatory 默认为 FALSE）的列表：

01

linux中14个有趣的排序命令示例

Sort 是一个 Linux 程序，用于打印输入文本文件的行并按排序顺序连接所有文件。排序命令将空格作为字段分隔符，将整个输入文件作为排序键。重要的是要注意 sort 命令实际上并不对文件进行排序，而只是打印排序后的输出，直到您重定向输出。

04

T-SQL进阶：超越基础 Level 2：编写子查询

By Gregory Larsen, 2016/01/01 (首次发布于: 2014/01/29) 关于系列本文属于进阶系列：T-SQL进阶：超越基础跟随Gregory Larsen的T-SQL DML进阶系列，其涵盖了更多的高级方面的T-SQL语言，如子查询。在您开始创建超出基本Transact-SQL语句的更复杂的SQL代码时，您可能会发现需要使用其他SELECT语句的结果来限制查询。当在父Transact-SQL语句中嵌入SELECT语句时，这些嵌入式SELECT语句被称为子查询或相关子查询。

01

【强强联合】在Power BI 中使用Python（2）

其实我们仔细看一下场景1和场景2，它们之间是个逆过程，场景1是从Python获取数据传递到Power BI，而场景2是Power BI或者Power Query获取了数据，用python来处理。

03

canvas像素操作原

(adsbygoogle = window.adsbygoogle || []).push({});

04

R语言逻辑回归logistic模型分析泰坦尼克titanic数据集预测生还情况

逻辑回归是一种拟合回归曲线的方法，y=f(x)，当y是一个分类变量时。这个模型的典型用途是在给定一组预测因素x的情况下预测y，预测因素可以是连续的、分类的或混合的。

01

【Java 进阶篇】JavaScript 动态表格案例

在这篇博客中，我们将深入了解JavaScript如何创建和操作动态表格。我们将从头开始构建一个动态表格，并逐步添加各种功能，使其能够实现数据的添加、删除和编辑。这个示例将有助于理解如何在前端开发中使用JavaScript创建交互性强大的表格。

02

如何在Kudu1.5中使用Sentry授权

Fayson在之前的文章详细介绍了CDH5.13的新功能，参考《CDH5.13和CM5.13的新功能》。CDH5.13中默认打包了Kudu，我们在安装Kudu的时候再也不用单独下载Kudu的Parcel包，与其他组件一样直接增加服务即可。另外这个版本Kudu1.5支持Sentry的database，table以及column的SELECT/INSERT授权，旧的版本只能支持数据库或表的全部授权，不能区分SELECT和INSERT，且不支持列授权。

08

.NET 2.0运行时的LINQ

从理论上讲,LINQ只不过是语法糖,而得到的IL代码应该与.NET 2.0中的代码相同.

01

「R」tidyverse 中的公式函数

本文的写作由来是知识星球一个朋友对如何在 tidyverse 系列包中使用公式函数（单侧公式）不太熟悉，所以通过本文分享一下我的心得。

02

Google Earth Engine（GEE）——使用 GeoPandas 和 Uber 的 H3 空间索引进行快速多边形点分析

空间索引方法有助于加速空间查询。大多数 GIS 软件和数据库都提供了一种机制来计算和使用数据图层的空间索引。QGIS 和 PostGIS 使用基于 R-Tree 数据结构的空间索引方案 - 它使用几何边界框创建分层树。这是非常有效的，并在某些类型的空间查询中产生了很大的加速。查看我的高级 QGIS 课程的空间索引部分，我将展示如何在 QGIS 中使用基于 R 树的空间索引。

01

Mongo散记–聚合（aggregation）& 查询（Query）

工作中使用到Mongo，可是没有系统的学习研究过Mongo，仅对工作过程中，在Mongo的使用过程中的一些知识点做一下记录，并随时补充，达到总结备忘的目的。

02

使用R或者Python编程语言完成Excel的基础操作

尽管Excel在职场和学术界非常流行，但对于一些高级的统计分析、数据可视化、大规模数据处理等任务，可能需要更专业的软件或编程语言，如R、Python、SAS或Stata。此外，对于特定的行业或研究领域，可能会有其他更适合的工具和平台。

01

【重磅来袭】在Power BI 中使用Python（4）——PQ数据导出&写回SQL

1.可视化对象导出CSV格式限制3万行数据，这对于数据量动辄上百万甚至上亿的表来说是不可接受的；

04

【R的极客理想系列文章】RHadoop培训之 R基础课

R是一种语法非常简单的表达式语言(expression language),大小写敏感。可以在R 环境下使用的命名字符集依赖于R 所运行的系统和国家(系统的locale 设置),允许数字,字母,“.”,“_”

02

R语言多项式回归拟合非线性关系

当我们分析有一些弯曲的波动数据时，拟合这种类型的回归是很关键的。在这篇文章中，我们将学习如何在R中拟合和绘制多项式回归数据。我们在这个回归模型中使用了lm()函数。虽然它是一个线性回归模型函数，但通过改变目标公式类型，lm()对多项式模型也适用。本教程包括

03

40个重要的HTML 5面试问题及答案

目录介绍 SGML、HTML、XML和XHTML之间的关系？什么是HTML 5？如果我不输入<!DOCTYPE HTML>，HTML 5能工作吗？哪些浏览器支持HTML 5？ HTML 5的页面结构和HTML 4或早先的HTML有什么不同？ HTML 5中的DataList是什么？ HTML 5中不同的新表单元素类型是什么？ HTML 5中的输出元素是什么？ SVG是什么？能否使用HTML 5举个简单的SVG例子？ HTML 5中的Canvas画布是什么？如何在HTML 5中使用Canvas和S

使用PandasGUI进行探索性数据分析

Pandasgui是一个开源的python模块，它为pandas创建了一个GUI界面，我们可以在其中使用pandas的功能分析数据和使用不同的功能，以便可视化和分析数据，并执行探索性数据分析。

05

MySQL 8 新特性详解

在MySQL 8之前，当你不再需要某个索引时，你必须显式地删除它。然而，在某些情况下，你可能不确定删除索引是否会对查询性能产生负面影响。为了解决这个问题，MySQL 8引入了隐藏索引的特性。隐藏索引允许你将索引设置为不可见，而不是完全删除它。这样，你可以在不实际删除索引的情况下评估查询的性能。如果发现性能下降，你可以轻松地使索引再次可见。

01

检查约束与默认值约束

检查约束（CHECK Constraint）是一种用于限制列中允许的值的约束。使用检查约束可以确保列中的值满足一定的条件。在MySQL中，检查约束是使用CHECK关键字来创建的。

02

前端必读：如何在 JavaScript 中使用SpreadJS导入和导出 Excel 文件

JavaScript在前端领域占据着绝对的统治地位，目前更是从浏览器到服务端，移动端，嵌入式，几乎所有的所有的应用领域都可以使用它。技术圈有一句很经典的话“凡是能用JavaScript实现的东西，最后都会用JavaScript实现”。 Excel 电子表格自 1980 年代以来一直为各行业所广泛使用，至今已拥有超过3亿用户，大多数人都熟悉 Excel 电子表格体验。许多企业在其业务的各个环节中使用了 Excel 电子表格进行数据管理。

01

如何使用 JavaScript 导入和导出 Excel

在现代的Web应用开发中，与Excel文件的导入和导出成为了一项常见而重要的任务。无论是数据交换、报告生成还是数据分析，与Excel文件的交互都扮演着至关重要的角色。本文小编将为大家介绍如何在熟悉的电子表格 UI 中轻松导入 Excel 文件，并以编程方式修改表格或允许用户进行编辑，最后使用葡萄城公司的纯前端表格控件SpreadJS组件它们导出回 Excel 文件。

02

Web | Django 与数据库交互，你需要知道的 9 个技巧

对开发人员来说，Django的ORM 确实非常实用，但是将数据库的访问抽象出来本身是有成本的，那些愿意在数据库中探索的开发人员，经常会发现修改 ORM 的默认行为可以带来性能的提升。在本文中，我将分享在 Django 中使用数据库的 9 个技巧。

04

生态学建模：增强回归树（BRT）预测短鳍鳗生存分布和影响因素|附代码数据

最近我们被客户要求撰写关于增强回归树（BRT）的研究报告，包括一些图形和统计输出。

00

生态学建模：增强回归树（BRT）预测短鳍鳗生存分布和影响因素|附代码数据

在本文中，在R中拟合BRT（提升回归树）模型。我们的目标是使BRT（提升回归树）模型应用于生态学数据，并解释结果。

02

OpenTelemetry：轻松在 Gin 框架中实现链路追踪

亲爱的读者，你好！今天，我们将继续探索在 Go 项目中使用 OpenTelemetry 的主题，特别是如何在使用 Gin 框架的项目中自动实现链路追踪。

02

PostgreSQL 教程

本 PostgreSQL 教程可帮助您快速了解 PostgreSQL。您将通过许多实际示例快速掌握 PostgreSQL，并将这些知识应用于使用 PostgreSQL 开发应用程序。

01

带你和Python与R一起玩转数据科学: 探索性数据分析（附代码）

本系列将介绍如何在现在工作中用两种最流行的开源平台玩转数据科学。先来看一看数据分析过程中的关键步骤 – 探索性数据分析。

03

「R」Shiny：用户界面（三）布局

在我们知道如何创建一系列输入和输出控件之后，我们需要学会如何在一个页面中对它们进行排列，以达到比较好的展示效果。这正是布局函数的工作，布局函数提供了一个应用高层次的可视化结构。

01

这是我见过最有用的Mysql面试题，面试了无数公司总结的（内附答案）

1.什么是数据库？数据库是组织形式的信息的集合，用于替换，更好地访问，存储和操纵。也可以将其定义为表，架构，视图和其他数据库对象的集合。 2.什么是数据仓库？数据仓库是指来自多个信息源的中央数据存储库。这些数据经过整合，转换，可用于采矿和在线处理。 3.什么是数据库中的表？表是一种数据库对象，用于以保留数据的列和行的形式将记录存储在并行中。 4.什么是数据库中的细分？数据库表中的分区是分配用于在表中存储特定记录的空间。 5.什么是数据库中的记录？记录（也称为数据行）是表中相关数据的有序集

02

SQL优化

任何在where子句中使用is null或is not null的语句优化器是不允许使用索引的。即使索引有多列这样的情况下，只要这些列中有一列含有null，该列就会从索引中排除。也就是说如果某列存在空值，即使对该列建索引也不会提高性能。

02

【TypeScript 演化史 — 第十章】更好的空值检查和混合类

在TypeScript 2.2中，空检查得到了进一步的改进。TypeScript 现在将带有可空操作数的表达式标记为编译时错误。

01

R语言使用特征工程泰坦尼克号数据分析应用案例

特征工程对于模型的执行非常重要，即使是具有强大功能的简单模型也可以胜过复杂的算法。实际上，特征工程被认为是决定预测模型成功或失败的最重要因素。特征工程真正归结为机器学习中的人为因素。通过人类的直觉和创造力，您对数据的了解程度可以带来不同。

03

如何使用Node.js和Github Webhooks保持远程项目同步

在处理具有多个开发人员的项目时，当一个人推送到存储库然后另一个人开始对过时版本的代码进行更改时，这可能会令人沮丧。像这些花费时间的错误，这使得设置脚本以保持您的存储库同步是值得的。您还可以在生产环境中应用此方法以快速推送修补程序和其他更改。

03

B+Tree index structures in InnoDB（7.InnoDB中B+树的索引结构）

这篇文章引用的是2014年2月3日的innodb_ruby 0.8.8版本。在《学习InnoDB:核心之旅》中，我介绍了innodb_diagrams项目来描述InnoDB的内部结构，它提供了这篇文章中用到的所有图表。在对innodb_ruby的快速介绍一文中，我介绍了innodb_space命令行工具的安装和一些快速演示。在InnoDB索引页的物理结构中描述了InnoDB索引页的物理结构。现在，我们将通过一些实际示例来研究InnoDB如何在逻辑上构造索引。

01

14个实战案例带你了解Linux的‘sort’命令

云豆贴心提醒，本文阅读时间7分钟 sort是什么 Sort是用于对单个或多个文本文件内容进行排序的Linux程序。 Sort命令以空格作为字段分隔符，将一行分割为多个关键字对文件进行排序。请注意，除

04

React 面试必知必会 Day12

你只需要是用 HTTPS=true 配置。你可以编辑 package.json scripts 部分：

03

Pandas DataFrame 中的自连接和交叉连接

在 SQL 中经常会使用JOIN操作来组合两个或多个表。有很多种不同种类的 JOINS操作，并且pandas 也提供了这些方式的实现来轻松组合 Series 或 DataFrame。

02

保姆级教程：写出自己的移动应用和小程序（篇四）

本系列的上一篇文章我们主要学习了如何在自己的 iOS 或 Android 应用中引入第三方 SDK。随着引入 SDK 文章结束，关于应用开发入门系列的文章也就结束了。今天，我们开始学习小程序的开发入门，看看如何在小程序中写出属于自己的 Hello World。

03

想熟悉PostgreSQL？这篇就够了

PostgreSQL是自由的对象-关系型数据库服务器，在灵活的BSD风格许可证下发行。它在其他开放源代码数据库系统和专有系统之外，为用户又提供了一种选择。我们还是建议您使用云数据库进行搭建，省去数据迁移等麻烦操作，数据库详见：https://cloud.tencent.com/product/cdb-overview

02

《现代Typescript高级教程》泛型和类型体操

泛型和类型体操（Type Gymnastics）是 TypeScript 中高级类型系统的重要组成部分。它们提供了强大的工具和技巧，用于处理复杂的类型操作和转换。

03

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭