我正在尝试导入一个文本文件,并将文本返回到每个单词的字符串列表中,同时还返回小写且没有标点符号。
我已经创建了以下代码,但这不会将每个单词分割成一个字符串。另外,是否可以将.lower()添加到理解中?
def read_words(words_file):
"""Turns file into a list of strings, lower case, and no punctuation"""
return [word for line in open(words_file, 'r') for word in
我已经插入我的文本文件大约10行以列表的形式。现在我想切掉每一行的第一部分。
准确地说,前5个单词应该被剪掉。
我到底要怎么做?
编辑:
我已插入我的文本文件:
with open("test.txt", "r") as file:
list = []
for line in file:
list += [line.strip()]
print(list)
如果我只有一句台词,这句话对我来说是可行的:
newlist = " ".join(list.split(" ")[5:])
print(new
我正在尝试创建一个程序,它读取一个文本文件,并找到单个单词的数量。我已经解决了大部分问题,但我仍然坚持让柜台挑选单词,而不是像现在这样挑选字母。
import collections
with open ("file.txt" ,"r") as myfile:
data=myfile.read()
[i.split(" ") for i in data]
x=collections.Counter(data)
print (x)
我的目标是通过空格滑动列表,这将导致每个单词都是列表中的一个对象。然而,这并不起作用。
结果:
Cou
我有一个很大的txt文件,我想把它分成一个列表,其中每个单词都是列表中的一个元素。我希望逗号包含在元素中,就像这个例子一样。
txt文件Hi, my name is Mick and I want to split this with commas included, like this.列表['Hi,','my','name','is','Mick' etc. ]
非常感谢你的帮助
我期待一个用户输入字符串,我需要分裂成单独的单词。用户可以输入以逗号或空格分隔的文本。
因此,例如,案文可能是:
hello world this is John。或
hello world this is John或偶数
hello world, this, is John
如何有效地将该文本解析为以下列表?
['hello', 'world', 'this', 'is', 'John']
提前谢谢。
另一个来自Python新手的问题。
我有一个数组,用户可以输入5个不同的单词/句子,在用户输入这5个文本之后,用户再次输入5个文本中的一个,程序从数组中删除这个字符串,用户添加另一个字符串,它直接附加到Index = 0。
但是,当我想运行这个数组并查找数组中的任何字符串是否至少有2个单词时,问题就开始了。
Text = []
for i in range(0, 5):
Text.append(input('Enter the text: '))
print (Text)
for i in range(0, 1):
Text.remove(input(
我正在尝试将一个文本文件读入列表中。当它读取由逗号分隔的单词列表时,列表的末尾有'‘和'\n’。我添加了strip(),但它只删除了'\n‘。 with open("tasks.txt",'r') as file:
for line in file:
word = line.strip().split(',')
if word[0] == username:
view_list.append(word) 循环可以工作,除了在
...
1947q2 -0.6
1947q3 -0.3
1947q4 6.2
1948q1 16.5
...
如何将此文本文件添加到列表中?我在年份和相应值之间的间距上遇到了问题。
这就是我到目前为止所知道的:
data = []
for line in open("file"):
if '1947' in line:
sl = line.split(' ')
data.append((sl[0]
此函数接受一个字符串文本,并返回一个包含字符串列表的列表,该列表为字符串文本中的每个句子提供一个列表。
句子由一个字符串“、"?”或“!”分隔。我们忽略了其他标点符号分隔句子的可能性。所以“X先生”将变成两个句子,而‘不要’将是两个单词。
例如,文本是
Hello, Jack. How is it going? Not bad; pretty good, actually... Very very
good, in fact.
该函数返回:
“你好”、“杰克”、“如何”、“是”、“它”、“去”、“不”、“坏”、“漂亮”、“好”、“实际上”、“非常”、“非常”、“很好”、“在”中
我使用以下函数来确定文本是否包含列表中的单词(或表达式): def is_in_text(text, lista=[]):
return any(i in text for i in lista) 我可以将我想要在文本中查找的单词和表达式的列表传递给此函数。例如,以下代码: text_a = 'There are white clouds in the sky'
print(is_in_text(text_a, ['clouds in the sky'])) 将会返回 True 如果我对提到“云”和“天空”的文本感兴趣,这是有效的。但是,如果文本稍有不
好的,这就是我想要做的。我想轻松地将文本从文本文件转换为word文档。我现在有这个……
from docx import Document
text_file = "pathToYourTextFile.txt"
#opens document to add text to
document = Document()
#adds the entire contents to a list that we will
#then use to add to the document we just created
fileContents = []
for line in o
大家好,我是python编程的新手,请帮助我创建一个函数,该函数以文本文件为参数,创建一个单词列表,从而删除所有标点符号和列表中的双空格“分割”。我的意思是,列表应该在文本文件中的每个双空格出现时创建存留。
这是我的函数:
def tokenize(document):
file = open("document.txt","r+").read()
print re.findall(r'\w+', file)
输入文本文件具有如下字符串:
What's did the little boy tell the game wa
因此,我有一个非常长的字符串从一个文本文件完全由7个字母的词组成。我需要把它们分开,然后把每一个7个字母的单词存储在一个列表中。
文本文档最初由7个字母组成,每个单词用行分隔。它的一小部分如下所示:
在删除了这个空间之后,它看起来如下所示:如何将它们直接存储在一个列表中,而不是以行分隔的形式存储它们的解决方案也适用于我。
我用这个删除了新的行:
with open(r"C:\Users\HP\Desktop\input.txt", 'r') as file:
data = file.read().replace('\n', '
如何使用PHP从MySQL/MariaDB表生成单词列表?
我有下表:
id Title
1 A brief history of time
2 philosophy of ecucation
3 introduction to education
4 philosophy and astrophysics
5 astrophysics: astrophysics for dummies
我想要完成的是让MySQL (或PHP)生成一个结果,显示一个单词的使用频率。优选地,每个标题应当仅将一个单词的计数器增加1(见ID5)。我的数据库包含大约10000个标题,所以在php中将它们都放
如果文本文件是/n/n Hello world!/n I like python./n,我如何从该文本中获取第一个单词?我试着写代码:
def word_file(file):
files = open(file, 'r')
l = files.readlines()
for i in range(len(l)):
a = l[i].rstrip("\n")
line = l[0]
word = line.strip().split(" "
我正在尝试读取一个文本文件,并使每一行都是一个子列表,该行中的每个单词都是该子列表中的一个不同条目,例如:
第一行你好,我叫鲍勃
第二行你好我的名字是tim
我希望列表是这样的:
[hello,my,name,is,bob,hello,my,name,is,tim]
results = [] fileToProcess = open("zodiac.txt", "r") for line in fileToProcess: for word in line.split(): results.append(line.strip().spli
我现在要做的是计算空格数,然后再加1
但是如果用户输入类似于"heres a big space______amazing right?"的内容呢?
这个程序会计算所有的6个空格,然后说,当它实际上是6的时候,有10个单词。
phrase = raw_input("Enter a phrase: ")
space_total = 0
for ch in phrase:
if ch == " ":
space_total += 1
words = space_total + 1
print "there are
我知道这似乎是一个愚蠢的问题,因为默认行为是不包括分隔符。然而,它包括在我的案例中,我不知道为什么。我有一个由换行符分隔的单词文本文件,如下所示:
word
other
language
name
etc
我将整个文本文件放入一个字符串中,然后尝试使用String.split方法将其拆分为一个数组,这样做效果很好。最后,我得到了一个单词数组。然而,字符串的奇怪行为使我意识到字符串中包含分隔符。每个单词的长度都比正常长度长一个,额外的字符在末尾,是换行符。
这是我的代码
wordArray = dictionary.split("\n");
有什么原因会在单词中包含换行符吗?
我想从一个.txt文件中获取所有单词,并将它们放在一个列表中,每个单词都作为该列表的一个元素。在.txt中,单词之间用换行符分隔。到目前为止我的代码是:
with open('words.txt', "r") as word_list:
words = list(word_list.read())
然而,这段代码只是将.txt的每个字母作为它自己的元素放在我的列表中。有什么想法吗?
<s> an evolutionary immune network for data clustering </s>
<s> an evolutionary immune network for data clustering </s>
<s> inet an extensible framework for simulating immune network </s>
<s> immunity based systems a survey </s>
<s> a recommender
我试图把一个文本文件分割成文字,\n被算作一个单词。
我的输入是这个文本文件:
War and Peace
by Leo Tolstoy/Tolstoi
我想要一个这样的列表输出:
['War','and','Peace','\n','\n','by','Leo','Tolstoy/Tolstoi']
使用.split(),我得到了以下内容:
['War', 'and', 'Peace\n\nby', 'Leo
我有一项家庭作业,要求我检查列表中的每个单词是否有一个特定的字母,并告诉用户列表中有多少单词包含了这封信。下面是我的代码:
letterSearch = input("Please enter a letter to search for: ")
w = ['', '', '', '']
w[0] = input("Please enter up to 4 words: ")
w[1] = input(": ")
w[2] = input(": ")
w[3] =