Python可以使用多种方式处理单热编码数据。下面是几种常见的方法:
import pandas as pd
data = pd.DataFrame({'category': ['A', 'B', 'C', 'A', 'B']})
one_hot_encoded = pd.get_dummies(data['category'])
print(one_hot_encoded)
输出结果:
A B C
0 1 0 0
1 0 1 0
2 0 0 1
3 1 0 0
4 0 1 0
from sklearn.preprocessing import OneHotEncoder
data = [['A'], ['B'], ['C'], ['A'], ['B']]
encoder = OneHotEncoder()
one_hot_encoded = encoder.fit_transform(data).toarray()
print(one_hot_encoded)
输出结果:
[[1. 0. 0.]
[0. 1. 0.]
[0. 0. 1.]
[1. 0. 0.]
[0. 1. 0.]]
import numpy as np
data = ['A', 'B', 'C', 'A', 'B']
unique_values = np.unique(data)
one_hot_encoded = np.eye(len(unique_values))[np.searchsorted(unique_values, data)]
print(one_hot_encoded)
输出结果:
[[1. 0. 0.]
[0. 1. 0.]
[0. 0. 1.]
[1. 0. 0.]
[0. 1. 0.]]
这些方法都可以将单热编码数据转换为独热编码,方便在机器学习等任务中使用。
领取专属 10元无门槛券
手把手带您无忧上云