腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
Elasticserarch
如何
对
空格
和
特殊
单词
进行
标记
化
我正在研究pattern
标记
器,我想我可以用但是后来发现分析器中只能有一个记号赋予器。
如何
实现我想要的?
浏览 9
提问于2019-11-27
得票数 1
2
回答
在两个字符串之间交换
单词
但保留其他字符
、
、
假设我拿了一句话,换掉了一些
单词
。我从一个输入句子开始:然后我
对
它
进行
了
标记
化
,并交换了一些
单词
。我得到了一个新
单词
的列表,比如: ['Hey', 'I', 'felt', 'somewhat', 'dreary', 'inside', 'toda
浏览 52
提问于2019-06-13
得票数 1
3
回答
如何
在C中用符号
标记
化
句子
、
、
、
、
我试图弄清楚
如何
对
Unix命令
进行
标记
化
,但我不知道
如何
解决strtok()会拆分作为分隔符的任何字符的事实。例如,strtok(string, ". ")将删除句点
和
空格
。我尝试
对
字符串
进行
标记
化
,可能是类似于ps aux( sort ( more,并且在括号前后有
空格
。即使我使用strtok(string, "("),在
浏览 3
提问于2020-02-09
得票数 1
2
回答
Groovy Regex用于匹配
单词
(即使带有重音字母)
、
、
我正在尝试
对
任何文本中的
单词
进行
标记
化
,例如:应该
标记
为"ça,me,plaét“。为此,我希望清除所有
特殊
字符中的字符串,然后将其拆分为
空格
。
浏览 3
提问于2011-03-23
得票数 1
回答已采纳
1
回答
如何
获得相应的字符或字符串,已被
标记
为'UNK‘令牌在伯特?
、
、
、
在对字符串
进行
标记
化
之后,它返回由单独
单词
和
特殊
标记
组成的令牌列表。例如,
如何
解码哪个
单词
/字符被称为'UNK'令牌(如果有的话)?
浏览 6
提问于2021-10-27
得票数 0
回答已采纳
2
回答
正则表达式以确定
标记
后的字符串
、
、
我使用下面的正则表达式来确定在某个
标记
之后找到的下一个
单词
:
如何
对
其
进行
更新以确定
标记
后面的8个字符,包括
空格
或其他
特殊
字符(如-或/源码如下所示:no.: abc marker
浏览 0
提问于2012-07-20
得票数 0
回答已采纳
1
回答
java中用于字母表的字符串
标记
器
、
、
我有一个
特殊
的正则表达式类型的要求。Get Carter,Tigerland,Super, The,Wolf, The.这里的"Super,The“
和
"Wolf,The”是一个
单词
。我需要将其
标记
化
如下"Tigerland""Wolf, The" 我唯一要注意的是,单个
单词
中的逗号后面跟着
空格</em
浏览 2
提问于2014-02-13
得票数 1
2
回答
从字符串返回i(索引)字
、
、
在给定的字符串中,函数应返回
单词
数字i因此,如果str为"My,. name is Jeff",如果我调用getWord( 2 ),则返回的结果应该是name我尝试过计算
单词
之间的' '或'.',但当有多个
单词
相继出现时,可能会变得复杂 那么,正确的算法是什么呢?
浏览 0
提问于2017-05-29
得票数 0
1
回答
在OpenNLP中
如何
在
标记
化
句子时跳过短语?
、
、
、
我正在使用OpenNLP JAVA API
进行
句子
标记
化
,它使用
空格
字符对句子
进行
标记
化
,并拆分每个
单词
。例如,在一个句子中。OpenNLP拆分/
标记
化
句子为快的狐狸结束狗 我想跳过
单词
“敏捷的棕色狐狸”
和
“懒狗”的
标记
浏览 1
提问于2016-03-12
得票数 0
1
回答
字符串
标记
化为单个变量
、
、
、
我有一个由数字
和
单词
组成的数组,它们都放在一个字符串中,如下所示:如果用
空格
分隔的每个
单词
都像这样转到它自己的变量,我
如何
对
这样的字符串
和
类似的字符串
进行
标记
化
,以将每个
单词
分配给一个单独的变量?
浏览 0
提问于2015-08-16
得票数 0
1
回答
有没有办法告诉elasticsearch标准
标记
器不要把$,@,#当作分隔符?
、
、
我正在寻找一种不应该使用标准
标记
器将$、@、#等
特殊
字符视为分隔符的方法。它可以通过使用
空格
标记
器
和
单词
分隔符过滤器的组合来实现。但我希望使用标准分析器,因为我不确定它是
如何
生成令牌的,以及
如何
利用标准令牌
化
器的其他好处。--谢谢
浏览 0
提问于2015-07-16
得票数 2
1
回答
在fassttext监督学习中,args wordNgrams,minn
和
maxn有什么不同?
、
、
args wordNgrams、minn
和
maxn之间的区别是什么 例如,文本分类任务
和
Glove嵌入为pretrainedVectors ft.train_supervised(file_path,lr给定minn=2,maxn=3,对于
单词
[<I, I>], [<l, <lo, lo, lov,.....],整个句子被转换为[I love, love you]等,其快速文本嵌入=(emb(爱)(作为一个完整的
单词
)+emb([I love, love you](因为wordNgrams=2),这
浏览 31
提问于2020-07-10
得票数 1
回答已采纳
2
回答
strtok(null)会导致任何bug吗?
not的例子是使用
空格
对
每个
单词
进行
标记
化
,但我想不到的字符可能不是描述的一部分。这个解决方案在我的测试中有效。 是否有副作用或
特殊
情况下此操作会失败?或者,这是一个完全安全
和
可接受的方式,以获得其余的线?
浏览 0
提问于2012-06-19
得票数 1
回答已采纳
1
回答
HibernateSearch -修改StandardTokenizerFactory以连接所有
单词
、
、
、
、
我想保持StandardTokenizerFactory
对
单词
进行
标记
化
的方式,但是添加另一个规则,通过连接(特别是删除所有
空格
)字段中的所有
单词
来创建
标记
。
浏览 2
提问于2013-11-06
得票数 0
1
回答
vim中基于当前字到命令的传递模式
、
我试图让ctag很好地处理ruby类
和
方法定义。我现在已经生成了一个ctag文件,该文件的工作原理是,如果我
对
以下内容
进行
可视
化
选择:从一整行看起来如下:然后按我现在正在尝试创建一个键盘快捷键,它将自动:
浏览 2
提问于2017-04-28
得票数 0
1
回答
如何
删除组成同一
单词
的字母之间的
空格
?
、
、
、
我基本上有一个完整的文档,在某种程度上包括text = "R E S U L T",在我
对
它
进行
标记
化
之后,函数逐个字母地
对
其
进行
标记
化
,所以我想让计算机知道"RESULT“必须作为一个整体来
标记
化
。关于
如何
消除文档中由
空格
分隔的
单词
的
空格
,有什么想法吗? 我在想,
如何
让计算机知道,如果它找到了像L
浏览 0
提问于2021-07-10
得票数 0
3
回答
Java NLP:在
标记
化
文本时提取索引
、
、
、
、
在对文本字符串
进行
标记
化时,我需要提取
标记
化
后的
单词
的索引。Mary didn't kiss John"[(Mary, 0), (did, 5), (n't, 8), (kiss, 12), (John, 17)] 其中0、5、8、12
和
17
对
应于令牌开始的索引(在原始字符串中)。我不能仅仅依靠
空格
,因为有些
单词
会变成2个
标记
。此外,我不能只搜索字符串中的
浏览 1
提问于2012-09-13
得票数 0
回答已采纳
1
回答
spacy通过正则表达式或模式添加
特殊
情况
标记
化
规则
、
我想根据为
空格
中的
标记
化
添加
特殊
情况。该文档显示了
如何
将特定
单词
视为特例。我希望能够指定一种模式(例如后缀)。例如,我有一个这样的字符串其中<word-i>指定单个
单词
。我知道我可以通过下面的代码一次只处理一个
特殊
情况。但是我
如何
为它指定一个模式呢?
浏览 13
提问于2017-06-17
得票数 3
1
回答
如果
单词
中有下划线,
如何
修复Rasa Nlu置信度为0?
、
、
我正在尝试使用Rasa构建简单的聊天机器人应用程序,但如果
单词
中有下划线,我的机器人会给出置信度0。lstname - userName- usrnme- userid 如果我通过了firstname,我得到了正确的意图
和
信心
浏览 24
提问于2019-09-04
得票数 0
2
回答
解决针对亚洲文本的Android SQLite全文搜索问题
、
、
、
、
我读过很多关于安卓是否可以
进行
基于SQLite的全文搜索的帖子,所有的答案都指出安卓的内置SQLite不支持自定义
标记
器。默认
标记
器考虑用
空格
或其他符号分隔的
单词
,但亚洲
单词
(如中文)需要其
特殊
的
标记
器,但Android不允许添加自定义
标记
器。 我读到的帖子是几年前的事了。最近的Android版本有什么更新吗?在将元组插入FTS3/FTS4虚拟表
进行
索引之前,是否可以人为地在每个
单词
之间添
浏览 3
提问于2015-10-21
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
NOC编程猫创新编程热身活动第六周试题
文本数据分析(二):文本数据预处理的方法
教你用Python进行自然语言处理
Stata:正则表达式和文本分析
空格符号的打法及其重要性
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券