从Dataframe中提取一列，并根据它对所有其他列进行标准化？

从Dataframe中提取一列，并根据它对所有其他列进行标准化的步骤如下：

首先，导入所需的库和模块，例如pandas和sklearn.preprocessing。

import pandas as pd
from sklearn.preprocessing import StandardScaler

读取数据并创建Dataframe对象。

data = pd.read_csv("data.csv")  # 假设数据保存在data.csv文件中
df = pd.DataFrame(data)

提取目标列。

target_column = df['target_column_name']  # 将'target_column_name'替换为目标列的名称

标准化目标列。

scaler = StandardScaler()
normalized_column = scaler.fit_transform(target_column.values.reshape(-1, 1))

将标准化后的列添加回Dataframe。

df['normalized_column'] = normalized_column

对所有其他列进行标准化。

columns_to_normalize = df.columns[df.columns != 'target_column_name']  # 排除目标列
df[columns_to_normalize] = scaler.transform(df[columns_to_normalize])

最终，Dataframe中的目标列和所有其他列都会被标准化。

标准化的概念是将数据转换为均值为0，标准差为1的分布。它的优势在于能够消除不同特征之间的量纲差异，使得数据更易于比较和分析。

标准化在许多数据分析和机器学习任务中都有广泛的应用场景，例如聚类、分类、回归等。通过标准化，可以确保各个特征对模型的影响权重相对均衡，避免某些特征因数值范围较大而对模型产生过大的影响。

腾讯云提供了多个与云计算相关的产品，其中包括云服务器、云数据库、云存储等。您可以在腾讯云官方网站上查找相关产品和详细介绍。

参考链接：

Weka归一化列

、

我有一个包含14个数字列的ARFF文件。我想分别对每一列执行规范化，即将每列的值修改为(actual_value - min(this_column)) / (max(this_column) - min(this_column))。因此，一列中的所有值都将在[0, 1]范围内。一列中的最小值和最大值可能与另一列中的值不同。我如何使用Weka过滤器来实现这一点？谢谢

浏览 16提问于2010-02-16得票数 6

回答已采纳

4回答

我正在根据满足的另一列中的条件从一列中提取数据的子集。我可以得到正确的值，但它是在pandas.core.frame.DataFrame中。如何将其转换为list？ import pandas as pd tst = pd.read_csv('C:\\SomeCSV.csv') lookupValue = tst['SomeCol'] == "SomeValue" ID = tst[lookupValue][['SomeCol']] #How To convert ID to a list

浏览 4提问于2014-05-20得票数 188

1回答

具有部分字符串匹配的两个Pandas数据帧之间的映射/压缩

、、、、

我有两个数据帧，每个数据帧大小约为1,000,000行。两者共享一个公共的'Address‘列，我用它来连接数据帧。使用这个连接，我希望将信息从dataframe1移动到dataframe2，我称之为“details”。 df2.details = df2.Address.map(dict(zip(df1.Address,df1.details))) 然而，address列并不表现出完全的通用性。我尽了最大努力清理，但仍然只能移动大约40%的数据。有没有办法修改上面的代码以允许部分匹配？这一次我完全被难住了。数据非常简单，如所述。两个小数据帧。虚构的样本数据如下： df1 Addr

浏览 1提问于2019-04-02得票数 0

2回答

如何像JDBC中的ResultSet那样访问DataFrame中的列的值？

、、、

假设在jdbc中，我可以编写result.getString(1)来读取每一列。spark dataframe中有这样的概念吗？例如： val ex_table = sqlContext.sql("select id, name,gender,address from ex_table2 ") 我需要提取每一列并使用Cassandra Prepared语句插入到Cassandra中。有谁能帮我吗？

浏览 0提问于2017-05-25得票数 1

3回答

按日期汇总sql server中的表。

、

我有一个包含20列的表，其中一列是事务日期，另一列是销售金额列。我想提取所有列并按事务日期对其进行分组。但是如果我没有提到group by中的所有列，我会得到一个错误。有什么建议吗。

浏览 0提问于2016-07-26得票数 1

2回答

如何将日期时间格式的列转换为一年？

、、

我有一列datetime，值类似于10/10/49 20:30，但是需要修改dataframe，使其只包含格式为1949的日期。下面的代码只是给我带来了一列NA。如何提取年份？我需要使用dplyr来解决这个问题！ df %>% mutate(., year = format(as.Date(x = datetime, format="%d/%m/%y %I:%M:%S %p"),"%Y"))

浏览 5提问于2020-06-02得票数 0

4回答

R因子上的算术运算

、

我有一个R dataframe，我正在尝试从一列中减去另一列。我使用$运算符提取列，但列的类是'factor‘，R不会对factor执行算术运算。有没有特殊的函数来做这件事？

浏览 2提问于2011-08-08得票数 7

回答已采纳

3回答

熊猫-在整个dataframe中找到一个具有特定值的列。

、、、、

我有一个DataFrame，它有几个列。有一个列，其值仅在整个dataframe中出现一次。我想要编写一个函数，该函数返回具有该特定值的列的列名。我可以通过通常的数据探索手动找到哪一列，但是由于我有多个具有相同属性的数据，所以我需要能够为多个数据挖掘找到该列。所以一个广义的函数会有更好的用处。问题是，我事先不知道哪一列是我要找的列，因为在每一种数据中，具有特定值的特定列的位置是不同的。另外，在不同的dataframes中所需的列有不同的名称，因此我不能使用df‘’my_ column‘之类的东西来提取列。谢谢

浏览 7提问于2020-12-07得票数 0

回答已采纳

2回答

我希望保存不同数据帧列的平均值(按行)，并将它们存储在一个新的dataframe中

、、

为此，我有一个列表(它们是我的集群)，例如： asset_clusts=[[0,1],[3,5],[2,4, 12],...] 原始的dataframe(在我的代码中我称之为'x')如下：我希望选择原始数据的0,1列，并计算它们的平均值(按行)，并将其存储在一个新的数据want中，然后计算第3、5列的平均值，并将其添加到新的dataframe，等等. mu=pd.DataFrame() for j in range(get_number_of_elements(asset_clusts)): mu=x.iloc[:,asset_clusts[j]].mean(axi

浏览 4提问于2021-12-31得票数 0

回答已采纳

1回答

Scala如何提取URL中的子字符串并为其创建新列？

、、

在Scala dataframe中，假设其中一列是一个URL字符串，格式为：或，那么提取"t-“之后的信息(在本例中为"1858”)并为该数据创建新列的最佳方法是什么？

浏览 0提问于2020-06-23得票数 0

1回答

从Postgres jsonb中提取字段

、、

我正在尝试找到一种从Postgres jsonb列中提取特定字段的有效方法。 CREATE TABLE foo ( id integer, data jsonb ) "data“包含一行，其中包含： { "firstname": "bob", "lastname": "smith, "tags": ["tag0","tag1"] } 我想从数据列中提取大量字段。这个select语句可以工作，但是它很麻烦，有大量的字段，生成非常长的SQL语句，而且我不知道它是否为每

浏览 1提问于2020-12-01得票数 0

1回答

创建一个新的dataframe，以包含Python中多个csv文件中的1列部分

、、、

因此，我正在尝试创建一个新的dataframe，其中包括一些来自300+ csv文件的数据。每个文件包含多达200,000行数据，我只对每个文件中的一个列感兴趣(每个文件的同一列)。我试图将这些列合并为1个dataframe，其中csv 1中的第6列将位于新dataframe的第1列中，来自csv 2的第6列将位于新的dataframe的第2列中，依此类推，直到第315 csv文件。我不需要全部提取200,000行数据，但我不确定如何从数据的中间部分只提取2,000行数据(每个文件在行数上的范围，所以每个文件的确切行数都不需要，只要是2000年中期)。如果能帮助从每个文件中提取2000行

浏览 8提问于2022-11-18得票数 1

回答已采纳

1回答

从具有for循环的列表中的R对象中提取信息

我有一个对象列表，其中每个对象都是一个dataframe。 list_of_dfs<-(df1, df2, df3,....) 假设我想从每个dataframe的第一列中提取信息，假设提取列1的所有值(超过0.5 )，我如何使用for循环来实现这一点？复杂情况:在list_of_dfs中，每个dataframe可能只是一个“名称”，但是在控制台中运行名称本身，例如‘’>df1 1‘将生成数据格式信息。谢谢你的考虑和建议。

浏览 4提问于2022-05-11得票数 0

2回答

从符合特定条件的数据框中提取所有行

、

我在R中有一个数据框，其中一列包含状态缩写，如'AL'，'MD‘等。假设我想提取state = 'AL‘的数据，那么下面的条件dataframe'AL’似乎只返回一行，而这个状态有多行。有人能帮我理解一下这种方法中的错误吗？

浏览 20提问于2020-05-22得票数 0

回答已采纳

2回答

检查python dataframe中不同列的开始和结束日期

、

我有一个dataframe，它有一个date列和另外4个包含数值的列。但其他4列中的每一列在不同的时间开始和结束。在python中有没有一种方法可以让我检查每一列的开始和结束日期？下面是我的数据帧示例： df = pd.DataFrame({ 'Date': [1930, 1931, 1932, 1933,1934], 'File1': [np.nan, 72, 58, 280, 958], 'File2': [np.nan, np.nan, np.nan, 13, 89], 'File3': [np.nan, 55, 68,

浏览 18提问于2020-04-19得票数 0

回答已采纳

0回答

python数据填充？

我想把原本dataframe中某一列值为nan的值根据自己的公式进行填充，我目前做的是把dataframe中某一列为NAN的所有行提取出来，对里面的缺失值进行填充，填充结束后，把这些数据放回原本的dataframe，这样把原本的为NAN的值覆盖

浏览 64提问于2022-11-21

3回答

在dataframe中遍历Pandas字典

、、、

我有一个dataframe，它有一列，每行都包含一个字典。我想提取这些字典，并将它们转换为数据帧，这样我就可以将它们合并在一起。做这件事最好的方法是什么？类似于： for row in dataframe.column: dataframe_loop = pd.DataFrame(dataframe['column'].iloc(row), columns=['A','B']) dataframe_result = dataframe_result.append(dataframe_loop)

浏览 0提问于2017-02-10得票数 0

1回答

只允许熊猫数据中两列之间的一对一映射

、

我有两个列dataframe，每一行都是不同的，一列中的一个元素可以映射到另一列中的一个或多个元素。我想过滤掉这些元素。因此，在最后的dataframe中，一列中的一个元素只能映射到另一列中的唯一元素。我要做的是按一列分组并计数重复项，然后删除计数大于1的行，然后再对另一列执行此操作。我想知道是否有更好、更简单的方法。谢谢 edit1:我刚刚意识到我的解决方案是不正确的，删除A列中的多个映射元素可以减少B列中的映射数，请考虑以下示例： A、B [1]1 4 1 3 2 4 1映射到3,4，所以前两行应该被删除，4映射到1,2。最后的表应该是空的。但是，我的解决方案将保留最后一行。有人能

浏览 3提问于2014-05-18得票数 2

回答已采纳

1回答

如何使用scala在df中获取整行的大小

、

DataFrame有多个列。我需要为整个行的大小添加一个新列，这意味着我需要将所有列的大小加在一起。有什么简单的方法可以有效地做到这一点吗？谢谢以下是样本： val DataFrame = Seq(("Alice", "He is girl"), ("Bob", "She is girl"), ("Ben", null)).toDF("name","string") display(DataFrame) 我想在df中添加一个列，它可以将每一列的长度之和。在这个示例中只有两列，但

浏览 3提问于2022-01-27得票数 0

回答已采纳

1回答

动态规划-找到得分最大化的列

、、、

假设我正在初始化这样的随机Dataframe： df = pd.DataFrame(np.random.randint(0,100,size=(100, 10)), columns=list('ABCDEFGHIJ')) 现在，假设score(matrix)是一个函数，它接受数据帧的子集并计算分数。我想找到df的一个子集，它最大限度地提高了分数。所有行都必须包括在内，但列不需要是连续的。换句话说，我可以创建df的一个子集，仅使用df的列将其传递到score()。我最初的方法是从第一列开始，然后连接第二列，如果分数增加，则保留该列，否则，继续移动到下一列。最后，我想要顶级的x

浏览 0提问于2019-03-31得票数 0

回答已采纳

2回答

如何快速规范化pandas数据帧中的数据？

我有一个熊猫数据框架，如下所示。 import pandas as pd df = pd.DataFrame({ 'A':[1,2,3], 'B':[100,300,500], 'C':list('abc') }) print(df) A B C 0 1 100 a 1 2 300 b 2 3 500 c 我想要使整个数据帧标准化。由于列C不是编号列，我所做的如下所示(即首先删除C，

浏览 19提问于2020-06-22得票数 1

回答已采纳

1回答

如何根据其他列python中的值变化提取列的值

、、

我有两个列的dataframe，我想要根据第二列提取第一列的值，如果最后3行的列2值从0变为任意值，那么提取第1列的值。 df=pd.DataFrame({'column1':[1,5,6,7,8,11,12,14,18,20],'column2':[0,0,1,1,0,0,0,256,256,0]}) print(df) column1 column2 0 1 0 1 5 0 2 6 1 3 7 1 4 8 0 5

浏览 0提问于2019-06-12得票数 1

回答已采纳

2回答

Julia中Dataframe列的向量

、

我有一台DataFrame df = DataFrame(x = 1:3, y = 4:6) 3×2 DataFrame Row │ x y │ Int64 Int64 ─────┼────────────── 1 │ 1 4 2 │ 2 5 3 │ 3 6 如何将其中一列提取为Vector 我知道我可以做df[:,:x]或df.x，但是有没有一种方法可以用函数代替呢？我问这个问题的原因是，我正在使用Chain.jl包，我想做一些类似这样的事情 @chain df begin

浏览 26提问于2021-10-29得票数 3

回答已采纳

1回答

DataFrame如何才能从只有两列( " from“datetime和" to”datetime)变为只有一列date呢？

、、、

我有一个看起来像这样的DataFrame：它有两列，其中一列是"from“日期时间，另一列是"to”日期时间。我想要更改此DataFrame，使其具有日期的单个列或索引(例如，日期时间形式的2015-07-06 00:00:00 )，而其他列(如deep)的变量按比例划分为每个日期。如何解决这个问题？我已经插手了groupby技巧，但我不确定如何继续。

浏览 1提问于2018-02-24得票数 0

1回答

如何有效地划分Delta表？

在delta表中存储我的数据时，寻找有效的数据分区策略。我现在的dataframe 1.5000.000 rowa它需要3.5h才能将数据从dataframe移动到delta表。为了找到一种更有效的写作方法，我决定尝试我的表中的不同列作为分区列，搜索我的列的基数，并选择以下列。 column1 =有3 distinct_values column2 =有7个不同的值 column3 =有26个disctinc值 column4 =有73个distinc值 column5 =有143个distinc值 column6 =有246个不同的值 column7 =有543个disctinc值集群

浏览 4提问于2022-07-23得票数 3

回答已采纳

2回答

如何删除包含某个值的所有行，而不管它在哪个列中

、、

我需要删除所有包含值为2或-2的行，而不管它在哪一列中，第一列除外。示例dataframe： df a b c d zzz 2 2 -1 yyy 1 1 1 xxx 1 -1 -2 期望产出： df a b c d yyy 1 1 1 我试过了 df <- df[!grepl(-2 | 2, df),] df <- subset(df, !df[-1] == 2 |!df[-1] == -2) 我的实际数据集有超过300行和70个变量。我相信我需要使用某种apply函数

浏览 3提问于2017-04-27得票数 1

回答已采纳

1回答

GWT -单元格表

我有一个单元格表格，在每一列中都包含数字。有没有办法在celltable..which的末尾多加一行来显示每一列的总和？谢谢

浏览 2提问于2011-07-19得票数 0

回答已采纳

2回答

在pyspark中通过一列连接两个数据帧

、、

我有两个dataframe，我需要连接一列，如果id包含在第二个dataframe的同一列中，则只从第一个dataframe中提取行： df1： id a b 2 1 1 3 0.5 1 4 1 2 5 2 1 df2： id c d 2 fs a 5 fa f 所需输出： df: id a b 2 1 1 5 2 1 我尝试使用df1.join(df2("id")，"left"

浏览 0提问于2017-09-27得票数 1

回答已采纳

1回答

基于数据列之一的数据范围标准化

、、、

我有一个pandas.dataframe，它有一个列passengers，它的范围可能会根据创建dataframe的函数而有很大的变化。其他列通常或多或少是固定的范围(它们是经济指标)。 segments.head(2); passengers gdp gdp_per_capita inflation unemployment \ Month 2002-01-01 11688 4461.087

浏览 1提问于2017-03-13得票数 0

回答已采纳

3回答

如何使用for循环从Pandas DataFrame列中追加数据？

、、

我有一个包含一列整数的Pandas DataFrame。我正在尝试使用一个for循环来仅提取'Artist‘列与'The Beatles’匹配的那个DataFrame的计数值。 tot=[] for art in df: for df['Artist'] in art: if art['Artist'] == 'The Beatles': tot.append(artist['Count']) The Dataframe format is as such

浏览 33提问于2019-09-06得票数 0

回答已采纳

1回答

在堆叠的条形图中显示每个部分的边界

、、、、

有类似于DataFrame的： data= {"A":[10,9], "B":[4,3],"C":[0,4]} df= pd.DataFrame(data=data, index= ["Jan", "Feb"]) 看上去像是： A B C Jan 10 4 0 Feb 9 3 4 我用堆叠的栏杆建造了一个地块。(图末) ax = df.plot(kind="bar",stacked=True,figsize=(16,9)) fo

浏览 3提问于2021-08-05得票数 1

回答已采纳

1回答

ASP.NET MVC站点中Linq和Entity FW数据库的访问与检索

、、、、

我正在尝试编写一个搜索函数，它将在整个表中搜索，我将获得所有列，到目前为止，我正在使用此代码，我只能从表中提取一列，如何获得所有列。代码： public ActionResult SearchIndex(string productsAll, string searchString) { var products = from m in db.Products select m; if (!String.IsNullOrEmpty(searchString))

浏览 2提问于2013-05-01得票数 0

3回答

如何从.csv文件中获取特定列的所有行

、、

在我的项目中，我有一个包含许多列的.csv文件。我只需要提取第一列的所有行。我设法读取了所有行，但在如何将行从第一列提取到另一个.csv文件上遇到了困难。 string filePath = @"C:\Users\BP185150\Desktop\OTC.csv"; string[] OTC_Output = File.ReadAllLines(@"C:\Users\BP185150\Desktop\OTC.csv"); foreach (string line in OTC_Output) { Console.Write

浏览 63提问于2019-12-04得票数 0

2回答

彩色熊猫DataFrame值如果大于1.5*中位数(列)

、、、、

假设我有一个看起来像这样的DataFrame： df= pd.DataFrame({'A': [1,-2,0,-1,17], 'B': [11,-23,1,-3,132], 'C': [121,2029,-243,17,-45]} ) 我使用一个jupyter笔记本，并希望用df.style着色每一列中的值，只有当它们超过X值时，X=1.5*median(列)。所以，我想要这样的东西：最好，我希望有一些梯度(df.style.bac

浏览 6提问于2022-05-11得票数 1

回答已采纳

1回答

如何提取大熊猫数据栏中所有列中字符串中的大写单词？

、、、

数据集附呈。在名为“转录”的列中，我希望从列中的每一行中提取大写单词，并将其作为dataframe的特性，并将大写单词后面的字符串作为该特性下的数据点的值。预期的输出将是dataframe中的另一列，名称为字符串中的大写单词，而特定的数据点将在该特性下具有一个值。尽我最大的努力解释。示例输出的链接(前2个数据点显示)

浏览 2提问于2020-02-28得票数 0

回答已采纳

1回答

使用python从同一网页中的多个链接中提取数据

、、、

我是蟒蛇和网络抓取的新手。我试图从这个链接中提取关于临床诊断测试的测试成分的信息。https://labtestsonline.org/tests-index 测试索引有用于各种临床测试的测试组件的名称列表。单击每个名称将带您到另一个页面，其中包含有关单个测试组件的详细信息。我想从这一页中提取出有共同问题的部分。最后，将包含测试组件名称的数据框架放在一列中，将常见问题中的每个问题作为其余的列(如下所示)放在一起。 Names how_its_used when_it_is_ordered what_does_test_result_mean 到目前为止，我只得到了测试组件的名

浏览 1提问于2018-01-19得票数 0

3回答

如何从dataframe中提取特定值并将它们放到另一列中？

、、、

我有一个由一列字符串组成的数据帧。我想从一列中提取位置、日期和种族号。 Dataframe： - S.no. FileName - 0. Albany17NOV19sectionalRace1.csv - 1. Albany22NOV19sectionalRace4.csv - 2. New York1NOV19sectionalRace7.csv - 3. Aquis Park Gold Coast27NOV19sectionalRace2.csv 所需数据： - S.no. Place Da

浏览 2提问于2020-11-18得票数 1

回答已采纳

2回答

使用regex或linux命令选择第一列和最后一列。

、

我有一个像这样的文本文件..。 ("oo" (set CANDRA-E-O 0) "ऊ") ("o" (set CANDRA-E-O ?ऑ) "ओ") ("oa" "ऑ") ("au" "औ") 我需要提取第一列和最后一列，例如： "oo", "ऊ" "o", "ओ" "oa", "ऑ" "au", "औ" 我成功地提取了第

浏览 8提问于2022-01-27得票数 1

回答已采纳

1回答

Python -使用groupby和条件语句

、

如何根据一列对DataFrame进行分组，检查每个组(或任何其他条件)中另一列上的最高值，并使用分组期间找到的所有值的行创建一个新的DataFrame？如果我在感兴趣的列上使用groupby，然后检查我想要的条件，我将得到的唯一结果是一个包含两列的df，但我希望返回原始df的所有列。代码： df_best = df.groupby('Type 1')['Total'].max() 我知道为什么我上面的代码在这种情况下不能工作，但我想不出一种方法来获得我想要的…… 提前感谢！

浏览 27提问于2020-04-30得票数 0

2回答

如何将一列dataframe保留为数据

、

问:如何提取一列数据并保持其结构不变？ data <- iris data[, 1] ##this will be a vector and will lose the name of the column in dataframe

浏览 4提问于2014-04-22得票数 6

回答已采纳

3回答

如何在Python中的Pandas列中使用重复模式提取字符串末尾的数字？

、

我想从数据帧的一列中提取字符串末尾的所有数字，并从中生成一个新的列。示例： import pandas as pd pd.DataFrame({'target': ['w1-d2','w1-d3','w1-d5','w1-d9']}) 预期结果： pd.DataFrame({'target': ['w1-d2','w1-d3','w1-d5','w1-d9'], 'new_column':[

浏览 16提问于2022-07-12得票数 0

回答已采纳

2回答

SQL where in子句在熊猫数据中使用列

、

我有一只熊猫数据，里面有一列ID。我需要运行另一个sql查询，其'WHERE‘子句由上述列中的所有in指定。例如： df1 = DataFrame({'IDs' : [1,2,3,4,5,6]}) query = """ Select id, SUM(revenue) AS revenue WHERE id IN (***want df1['IDs'] here***) Group by 1""" df2 = my_database.select_dataframe(query)

浏览 4提问于2015-04-20得票数 8

回答已采纳

4回答

分类编码前后的标准化？

、、、、

我正在研究一种回归算法，在这种情况下，k-NearestNeighbors可以预测某个产品的价格。所以我有一个训练集，它只有一个分类特征和4个可能的值。我已经使用了一对k分类编码方案来处理它，这意味着现在我的Pandas DataFrame中还有3列，其0/1取决于当前值。 DataFrame的其他特征主要是位置和价格的纬度-经度等距离，所有这些都是数字的。应该标准化(均值和单位方差为零的高斯分布)，并在分类编码前后进行规范化吗？我在想，在编码后进行规范化可能是有益的，这样在测量邻居之间的距离时，每个特征对估计器都一样重要，但我不太确定。

浏览 0提问于2017-11-13得票数 8

回答已采纳

2回答

如何提取列名的两个特定字符并将其附加到另一个列名？

、、

我有一个包含1000+列的数据集。大约有100列包含文本：insured。对于这些列中的每一列，在右侧的两列中有一列，其中包含字符“3%”或“4%”。我需要做的是提取子字符串'3%‘或'4%’，并将其添加到包含单词insured的列中，例如：insured 3%。到目前为止，我有以下代码： # Find all columns containing the word 'Insured' insured_cols = [col for col in df.columns if 'Insured' in col] # Get the index

浏览 25提问于2019-09-17得票数 0

2回答

如何让矩阵逐行而不是按列减除向量

我想得到每一列减去其平均值的数据。首先，我计算每一列的平均数，这是我下面的数据叫做m。 angel distance [1,] 1.3 0.43 [2,] 4.0 0.84 [3,] 2.7 0.58 [4,] 2.2 0.58 [5,] 3.6 0.70 [6,] 4.9 1.00 [7,] 0.9 0.27 [8,] 1.1 0.29 [9,] 3.1 0.63 > m

浏览 6提问于2016-09-27得票数 1

回答已采纳

1回答

熊猫-对于行中给定的列值，从名称与值匹配的列返回值。

、、

对于给定的行，如何使用来自一列的值返回另一列的值，该列的名称是第一列的值。例如。 if row['column_name'] == 'col_A': return row['col_A'] if row['column_name'] == 'col_B': return row['col_B'] 同样，当你知道numpy中的最大值时，你会想到得到最大值。例如。 import pandas as pd import numpy as np df = pd.DataF

浏览 1提问于2017-07-27得票数 1

回答已采纳

1回答

将列DataFrame Pandas向上移动到行匹配的位置

、、

我真的不知道怎么问这个问题，所以如果已经有答案的话，不要恨我。我有一个DataFrame f。它包含气象学数据，更具体地说是温度数据。温度数据的列名如下： ['tmp_m', 'tmpsfc', 'Maximum_temperature_height_above_ground_Mixed_intervals_Maximum', 'Minimum_temperature_height_above_ground_Mixed_intervals_Minimum'] 我有一个“z”列，可以指定米的高度。如果未指定高程，则该列中的值为na

浏览 3提问于2022-01-22得票数 1

回答已采纳

1回答

如何在python的文章列表中排除词频分析中的单词？

、

我有一个带有“内容”列的dataframe df，其中包含从互联网上提取的文章列表。我已经有了构建带有预期输出的数据文件的代码(两列，一列用于word，另一列用于其频率)。但是，我想在分析中排除一些词语(例如，联系者)。下面你会找到我的代码，我应该添加什么呢？为了更有效地使用代码get_stop_words('fr')是可能的吗？(因为我的文章是法文的)。源代码 import csv from collections import Counter from collections import defaultdict import pand

浏览 4提问于2022-10-25得票数 0

3回答

(极性)如何根据另一列中指定的索引从列中获取元素

、

我有一个包含2列的dataframe，其中第一列包含列表，第二列包含整数索引。如何按第二列中指定的索引从第一列中获取元素？或者更好，把这个元素放在第三列。例如，如何从这个 a = pl.DataFrame([{'lst': [1, 2, 3], 'ind': 1}, {'lst': [4, 5, 6], 'ind': 2}]) ┌───────────┬─────┐ │ lst ┆ ind │ │ --- ┆ --- │ │ list[i64] ┆ i64 │ ╞═══════════╪═════╡ │ [

浏览 22提问于2022-10-26得票数 1

回答已采纳

2回答

如何使用两个正则表达式捕获组来生成两个pandas列

、

我有一个字符串的dataframe列，我想将数字提取到另一列中： column 1 abc123 2 def456 3 ghi789jkl012 我使用过： dataframe["newColumn"] = dataframe["column"].str.extract("(\d*\.?\d+)", expand=True) 它可以工作，但只将第一个数字块捕获到一列中。我想要的输出是 column newColumn newColumn2 1 abc123 123

浏览 16提问于2020-11-09得票数 2

回答已采纳