我遵循了以下过程:,因为我的Dataframe的每一列都是list,但不是floats,而是选择将所有的值更改为strings。
df = [str(i) for i in df]
但这次失败了。
它只是删除了除第一行列名之外的所有数据。
然后,尝试df = [str(i) for i in df.values]导致将整个Dataframe更改为一个大列表,但这会使数据过于混乱,无法满足我的脚本的目标,即将Dataframe导出到Oracle表。
是否有一种方法可以将我的Dataframe中不是字符串的所有项转换为字符串?
我正在尝试将一个加载到一个numpy数组中。
结构如下:
THE 77534223
AND 30997177
ING 30679488
ENT 17902107
ION 17769261
HER 15277018
FOR 14686159
THA 14222073
NTH 14115952
[...]
但我没能用
import numpy as np
data = np.genfromtxt("english_trigrams.txt", dtype=(str,int), delimiter=' ')
我不明白为什么使用dtype=str创建的系列结果如下:
In [2]: pandas.Series(index=range(2), dtype=str)
Out[2]:
0 NaN
1 NaN
dtype: object
但是使用DataFrame创建的dtype=str结果如下:
In [3]: pandas.DataFrame(index=range(2), columns=[0], dtype=str)
Out[3]:
0
0 n
1 n
为什么只有字母"n“的字符串?
为什么系列赛和DataFrame有这样的区别?
这些文件在哪里?!
我正在尝试创建一个包含来自.h5文件的数据集的.dat文件。首先,我使用numpy来处理这个问题:
import numpy as np
import h5py
filename = 'VAL220408-invparms.dat'
datasetname = 'EM27_104_COCCON_VAL/220408'
dtvec = [float for i in range(149)] #My data file have 149 columns
dtvec[1] = str
dtvec[2] = str #I specify the dtype of t
我想将dataframe中的列转换为字符串,如下所示:
company department id family name start_date end_date
abc sales 38221925 Levy nali 16/05/2017 01/01/2018
我想把id从int转换成string
我试过了
data['id']=data['id'].to_string()
和
data['id']=data['id'].astype(str)
获取数据类型(‘O’)
我希望收到字符串
我正在尝试创建一个字符串数组,它们都是'<=','>=‘和'=’。
这是我写的代码:
del_str=np.zeros((Nnodes*ndofs),dtype=str)
for i in range(Nnodes*ndofs):
if dels[i]>0:
del_str[i]="<="
elif dels[i]<0:
del_str[i]=">="
else:
我有张桌子如下所示。
id name
010014 messi
092754 ronaldo
864287 benzema
K26541 xavi
当我将上面的表作为熊猫数据帧加载时,id列中的前导零将消失。我怎么才能避免。
将表加载为熊猫数据框架后的数据
id name
10014 messi
92754 ronaldo
864287 benzema
K26541 xavi
我的文件包含Company,RecordID,Sale etc..When列。加载文件到pandas dataframe后,我首先尝试找到它的数据类型,它列出了一些列的浮点型/整型。所以我将它们改为字符串,如下所示; data = pd.read_csv(filepath)
print(data.dtypes)
Company Code object
SiteCode int64
Product Name object
RECORD ID int64
Tank ID
我有一个(M x N) numpy数组,它包含字符串值、数值和nans。我想删除包含NaN值的行。我试过:
arr[~np.isnan(arr)]
然而,我得到了错误:
TypeError: ufunc 'isnan' not supported for the input types, and the inputs
could not be safely coerced to any supported types according to the casting rule ''save''
我使用的解决方案:
# get column wi
从几个 中,连接dataframe中的列的一种简单方法是使用map命令,如下例所示。map函数返回一个序列,那么为什么不能只使用一个常规系列而不是map呢?
import pandas as pd
df = pd.DataFrame({'a':[1,2,3],'b':[4,5,6]},index=['m','n','o'])
df['x'] = df.a.map(str) + "_x"
a b x
m 1 4 1_x
n 2 5 2_x
o
我目前使用它来计算表中的所有数量或行,它可以很好地满足我的需要。 SELECT COUNT(*) AS STCount
FROM (SELECT Distinct DPoint, RNum
FROM ECount
WHERE DType = 'STR' AND Month(EDate) = '07') AS rows 我唯一的问题是我必须重复这句话很多次,而每次只改变几个东西。我想联合这些选择,但将结果显示在一个单独的列中,下面的示例获得结果,但将它们都放在同一列中。你知道如何让它们在STCount和NC
当我将包含在带有前面零的整数列中的文件读取到dataframe时,零将被移除。我怎么才能阻止这一切?
示例:
文件:"test.txt“有以下内容:
one two three
a 025700 's'
b 005930 7
cc 125945 hi
ddd 000003 9.0
现在我正在把它读到一个数据文件中:
import pandas as pd
filename = "test.txt"
df = pd.read_table(filename, sep=" ")
产出如下:
print(df)
one tw