尝试使用word_tokenize和sent_tokenize标记带有新行的段落,但它无法识别新行。
尝试通过将其拆分到新行中来将其分成段落,但仍然不起作用。
from nltk import sent_tokenize, word_tokenize, pos_tag
para="the new line \n new char"
sent=sent_tokenize(para)
print(sent)
输出:
['the new line \n new char']
如果在python中以字符串格式指定数据,但在从docx文件中提取数据时失败,则它可以工作
对
我有一个购物网站。我想要建立一个简单的预测模型来预测用户在一次访问后购买某一产品的可能性(在每个页面上花费的时间,她来自哪里,她有多少评论等),他可能离开一个页面等。
在Ruby on Rails、Python或Java中,有哪些工具可用于此任务?典型的统计建模技术,如逻辑回归,线性回归在这种情况下有效吗?
谢谢。