可以通过以下步骤实现:
import pandas as pd
import numpy as np
df = pd.read_csv("your_dataset.csv")
negative_dist = pd.DataFrame(columns=['Column', 'Negative Count', 'Negative Percentage'])
for column in df.columns:
if df[column].dtype in [np.int64, np.float64]:
negative_count = df[df[column] < 0][column].count()
negative_percentage = (negative_count / len(df)) * 100
negative_dist = negative_dist.append({'Column': column, 'Negative Count': negative_count, 'Negative Percentage': negative_percentage}, ignore_index=True)
print(negative_dist)
以上代码将计算df中每个数值列的负值分布,并将结果存储在名为negative_dist的DataFrame中。每一行包含列名、负值数量和负值占比。
对于云计算领域的相关知识,以下是一些常见名词的概念、分类、优势、应用场景以及腾讯云相关产品和产品介绍链接地址:
请注意,以上只是一些常见的名词和相关产品,云计算领域非常广泛且不断发展,还有许多其他名词和产品值得深入了解。
云+社区沙龙online第6期[开源之道]
腾讯云数据湖专题直播
DB TALK 技术分享会
DBTalk
云+社区技术沙龙[第9期]
发现教育+科技新范式
Elastic Meetup
云+社区技术沙龙[第20期]
领取专属 10元无门槛券
手把手带您无忧上云