我最近做了一个基本的聊天机器人,让我的朋友测试它。她说了许多胡言乱语,路易斯的结果使我感到困惑。
例如,她将输入)(*)($*#)(!*#&$*#&$*#&)$(*)(!*)(!@*09837$)(@*#||||,LUIS将此标识为我检查数据库状态的意图之一。我唯一能想到的就是它包含了09837,一个数字,并从那里触发了特定的意图。但是,用于检查数据库状态的数字实体是复合实体( part )的一部分。这对我来说毫无意义。
为了消除number实体,我缩短了查询到)(*)($*#)(!*#&$*#&$*#&)$(*)(!*)(!@*,但它仍然触发相
我的问题是我的表中有重复的条目。然而,事情并没有那么简单。有些是有效的副本,而另一些则不是。例如,E Pearl River, NY和East Pearl River, NY是同一个城市,而Bardonia, NY和Nanuet, NY则不是。所以,如果我删除所有的副本,它将移除像巴多尼亚这样的有效城市。
我的问题是,是否有人知道(在SQL或任何编程语言中)遍历每一行并执行以下操作的方法:
检查行是否重复
检查city是否有部分匹配(即E珠江、纽约和东珠江、纽约)
删除重复行的第一
如果没有部分匹配city (即Bardonia,NY和Nanuet,NY),继续前进。
我正在尝试让用户在输入字段中输入日期和时间值。一些示例可能包括:
Tomorrow at 3pm
Now
Today at 1pm
Next tuesday 4pm
我该如何将这些可读文本解析为日期/时间字符串呢?
E.g. dd/mm/yyyy hh:mm
可以在客户端使用jquery完成,还是必须通过php通过ajax完成?
提前感谢您的任何建议或见解:)
我一直在尝试使用:
$string="The Dr. is here!!! I am glad I'm in the U.S.A. for the Dr. quality is great!!!!!!";
preg_match_all('~.*?[?.!]~s',$string,$sentences);
print_r($sentences);
但它对Dr.,U.S.A.等不起作用。
有没有更好的建议?
我已经创建了一个程序,使用谷歌语音识别听我们的声音,然后执行程序,为这个短语编写脚本。以下是部分代码:
import speech_recognition as sr
import os
def takeCommand():
#It takes microphone input from the user and returns string output
r = sr.Recognizer()
with sr.Microphone() as source:
print("Listening...")
r.pause_
我们是一个来自客户的Q&A数据库(非常类似于StackOverflow :-P),我们正在开发一个机器人来自动识别对正在打开的票证最有可能的响应。例如:
N;Q;A
1;how to recover my password?;Please go to https://.../resetPWD
2;which are the office hours?;office is open 9-13 and 14-18
基本上,我们希望为客户护理人员提供建议,让他们找到已知的答案。
我们使用Amazon作为首选平台,我们希望将其卸载到现有的API中(而不是求助于部署专用的NPL解决方案)。
--
首先,让我解释一下我所说的“对齐”是什么意思。
假设我们必须使用字符串:例如AGBCDEF ABCDIEFK
他们的“对齐”是:
A - G - B - C - D - - E - F -
A - - B - C - D - I - E - F - K
-----------------------------------
A - ? - B - C - D - ? - E - F - ?
另一个(相当简单的)例子(因为我相信我的问题可能与NLP有关):
I give Mary a kiss
I give Ann a book
----------------------
I giv