我已经创建了一个程序,使用谷歌语音识别听我们的声音,然后执行程序,为这个短语编写脚本。以下是部分代码:
import speech_recognition as sr
import os
def takeCommand():
#It takes microphone input from the user and returns string output
r = sr.Recognizer()
with sr.Microphone() as source:
print("Listening...")
r.pause_
基本上,我正在编写一个Java模块,它应该接受英语文本并转换代词的性别。例如,如果你给它"She put the box on the table“,它就会返回给你"He put the box on the table”。如果你给它“他的脚受伤了”,它会返回给你“她的脚受伤”。
这非常简单,除了“她的”这个词。有时他=她,有时他=她。
我一直在研究NLP,我对它几乎一无所知,我尝试了OpenNLP,但它让我失败了(因为许可问题,我不能使用Standford NLP )。POS标记器和Chunker会与她的混淆,解析器也是如此。举个例子:
盒子是他的。
(TOP (S (NP
首先,让我解释一下我所说的“对齐”是什么意思。
假设我们必须使用字符串:例如AGBCDEF ABCDIEFK
他们的“对齐”是:
A - G - B - C - D - - E - F -
A - - B - C - D - I - E - F - K
-----------------------------------
A - ? - B - C - D - ? - E - F - ?
另一个(相当简单的)例子(因为我相信我的问题可能与NLP有关):
I give Mary a kiss
I give Ann a book
----------------------
I giv
我想对一些类似YAGO的文本进行语义分析。但我在文本中没有结构来识别实体和关系。一种方法是使用POS标记,然后在句子中识别主语和谓词。但我仍然无法确定他们之间存在着什么关系。我该怎么做?
例如:
Albert Einstein was born in 1879.
应导致:
AlbertEinstein BORNIN 1879
subject relation predicate
我的目标是寻找更好的方法,找到主题,谓词和关系的原始文本。
我有下面两个字符串,实际上意思是一样的: GLOVES: LENGTH: 32 CM MATERIAL: NEOPRENE RUBBER FREE FLOW TEXT: RESISTANT TO WIDE RANGE OF GLOVES, TYPE: CHEMICAL RESISTANT, SIZE: 7, MATERIAL: NEOPRENE RUBBER, STANDARD: BS EN 388/BS EN 374, FFT: RESISTANT TO WIDE RANGE OF CHEMICALS SUCH AS ETHYLENE OXIDE IDEAL FOR LONG TERM H
我很难弄清楚如何识别某些文本,前提是它前面有特定的内容,然后是特定的内容。其任务是识别和,或,而不是,但如果它们是一个词的一部分,则不是:
应在此予以承认:
x AND y
(x)AND(y)
NOT x
NOT(x)
但这里不行:
xANDy
abcNOTdef
如果它被空格或括号包围,则会得到识别。如果它位于输入的开头,前面有一个空格,然后是空格或括号,则NOT会被识别。
问题是,如果我将括号作为和不包含的定义的一部分,它们就会被消耗掉,并且我需要它们是单独的标记。
我是否可以使用某种前瞻性/后置语法?
编辑:
根据评论,这是一些背景。这个问题与这个问题有关:我的工作解决方案就是识别和,O
我们是一个来自客户的Q&A数据库(非常类似于StackOverflow :-P),我们正在开发一个机器人来自动识别对正在打开的票证最有可能的响应。例如:
N;Q;A
1;how to recover my password?;Please go to https://.../resetPWD
2;which are the office hours?;office is open 9-13 and 14-18
基本上,我们希望为客户护理人员提供建议,让他们找到已知的答案。
我们使用Amazon作为首选平台,我们希望将其卸载到现有的API中(而不是求助于部署专用的NPL解决方案)。
--
是否有从文本中提取个人和地名的C#算法?
例如,鉴于以下案文:
St. Mark died at Alexandria, in Egypt. He was martyred, I think.
However, that has nothing to do with my legend. About the founding of
the city of Venice--
(摘自马克吐温的“无辜者海外”)
...is有任何提取方法:
St. Mark
Alexandria (or better yet, "Alexandria, Egypt")
Venice
我意识到没有
我正在做一个学校项目,它的功能是识别评论并从注释中找到信息并将其写到文件中。何时,我如何检查输入字符串与字符串列表的信息。就像我有一个输入
input = "How many fingers do I have?"
我该如何检查其中哪一个离它最近?
fingers = "You have 10."
pigs = "yummy"
我要用手指来回应。我想将它与变量名(而不是变量的值)匹配。
我在我的应用程序中使用Google DialogFlow来识别解析简历时的文本响应。每次响应都在不断变化。一周前,我训练了一个字符串并得到了正确的响应,但今天当我检查相同的字符串时,响应不是正确的,它没有接受一些字段。同样,对于日期识别,问题是在正确训练字符串后,非常类似的对话流继续改变响应。如果我尝试相同的字符串5次,所有时间的结果都不一样,它一直在变化,就像-这是我训练的字符串- (2013-2014),合计69.20%。 下面是附加的不同响应的截图- response I am getting first time response I am getting second time