我有两个列表,一个包含肯定词的列表,另一个包含标记化单词的列表。我想要比较两个列表,如果正向词和标记化的词匹配,那么我想插入到dataframe中的正向列中,但如果不匹配,那么我想插入到负向列中。我尝试遍历tokenize单词并使用if语句: word_classify = pd.DataFrame()for word in words以下是我的标记化单词<
我想将包含单词列表的DataFrame转换为DataFrame,每个单词都在自己的行中。
如何在DataFrame中的列上分解?下面是我尝试过的一个示例,您可以取消注释每一行代码,并获得以下注释中列出的错误。我在Python2.7和Spark 1.6.1中使用PySpark。# AttributeError: 'PipelinedRDD' object has no attribute '
我正在尝试获取python方法的输出。但是输出并不是直接的。当前的python方法有一些标记和值,它遍历标记和相应的函数,并将值作为输出。我希望将输出作为list或DataFrame。但是输出是一次输出一个&每次方法运行当前方法时,它都会创建新的列表或新的数据帧。我是python的新手&对python中的高级数据处理不是很熟练。请帮助我获得所需的输出。我需要所有的输出编译成一个单独的列表或所有标记值的数据帧。d = p