腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
如
何在
ANTLR4
中
对
多行
单词
进行
标记
化
、
、
、
我想
标记
化
下一个
单词
"SINGULAR OF MINIMUM QUANTIA“写在
多行
中
。如果你在一行中有完整的
单词
,那就很简单了 foo bar foo bar foo bar SINGULAR EXECUTIVE OF MINIMUM QUANTIA foo bar foo bar foofoo bar foo bar foo bar foo bar foo bar foo bar foo bar foo bar foo barfoo bar foo bar foo bar
浏览 16
提问于2019-10-02
得票数 1
回答已采纳
1
回答
如
何在
antlr4
语法
中
实现类型定义hack
、
、
、
、
我不一定需要在词法分析器
中
完成它,尽管这对我来说似乎是最干净的(或者在词法分析器和解析器之间)。根据我
对
antlr4
的了解,这是我能找到的最接近的解决方案,但它需要为每个关键字
标记
提供完整级别的非终结符。请注意,根据
Antlr4
大写的
单词
或
标记
,小写的
单词
是非末尾的。,并在本例的解析器
中
完成所有这些工作。它在我正在分析的语言中不能完全工作,因为有相当多的关键字有“正常”拼写,
如
"Set - -Alias“或
浏览 0
提问于2021-03-19
得票数 0
1
回答
solr
中
的多字停用词
、
、
如
何在
stopwords.txt文件中使用“制作过程”、“准备方法”之类的短语。我已经尝试了提到的解决方案,但不能succeed.Kindly指导我。
浏览 0
提问于2015-06-23
得票数 0
3
回答
文本处理-检测您是否在Java
中
的HTML
标记
内
、
、
我有一个程序,它在html格式的文档上
进行
文本处理,基于没有html信息的同一文档上的信息。我基本上是在未格式
化
的文档中找到一个
单词
或短语,然后在格式
化
的文档中找到相应的
单词
,并使用HTML标签更改
单词
或短语的外观,使其突出显示(例如,加粗或更改颜色)。 这就是我的问题。有时,我想
对
可能是html
标记
一部分的
单词
或短语
进行
格式
化
(例如,我可能想
对
单词
"f
浏览 2
提问于2011-04-09
得票数 0
回答已采纳
1
回答
有没有基于Java的智能
单词
标记
器,可以为句子
中
的相邻
单词
制作
标记
?
、
我想
对
包含相邻
单词
的句子
进行
标记
化
,如下所示: “这是我想要
标记
的samplestring。”在上面的例子
中
,有两种情况"samplestring“和"Iwanttotokenize”,其中出现了相邻的
单词
。你知道怎么把这些
单词
做成记号吗?对于这句话,理想的输出应该是(每行一个
标记
):这是我想
标记
化
的示例字符串
浏览 0
提问于2013-01-22
得票数 3
1
回答
街道识别,严重性推断
、
我正在尝试
对
一组短语
进行
分析,我不知道“自然语言处理”
对
我有什么帮助,也不知道是否有人能与我分享他的知识。首先是街道本身的提取。据我所知,NLP库可以帮助我
对
短语
进行
标记
化
,并执行分析,从而获得名词(例如)。我假设我需要将该分析与街道数据库
进行
比较,但我不知道哪种方法是最佳方法。 此外,我想推断严重程度
浏览 0
提问于2012-09-17
得票数 1
回答已采纳
1
回答
如何使用HighlightJS
标记
的npm
、
、
如
何在
中使用npm ?我正在尝试自动
化
我的文档以
进行
解析和样式
化
。下面是来自
标记
文档的示例:marked(markdownString, function (err, content) {如何将
标记
字符串作为文档传递(
如
形成一个名为README.md的文件),而不是手动转义字符串
浏览 23
提问于2018-02-18
得票数 6
回答已采纳
1
回答
如何找到与特定
单词
分组的主题和短语(动词/形容词)?
、
、
我有一个整齐的大型数据集,其中的列包含文本响应(即,在拨款申请
中
),行作为申请拨款的单个组织。我正在尝试查找以特定
单词
分组的主题和短语(例如,"funder"/"funding")。更具体地说,哪些形容词和动词与这些
标记
组合在一起?因此,“基金”可以与动词
如
“创建”、“雇用”和形容词短语
如
“新网站”、“人才”组合在一起。 我正在用R做这件事,有没有人有推荐这样做的包或程序?我找到了cleanNLP,但不确定这是不是最方便的包。我需要对所有
单词</e
浏览 22
提问于2019-02-21
得票数 1
1
回答
WordNetLemmatizer函数
、
初学者的问题,我有一个250个句子的文本文件,我已经
对
它们
进行
了
标记
化
,并将这些
标记
符放在一个列表
中
,如下所示现在,我想使用WordNetLemmatizer
对
每个
单词
进行
词汇
化
但是这种情况发生了,请告诉我出什么事了。
浏览 0
提问于2017-02-12
得票数 0
1
回答
如何搜索熊猫数据
中
的
多行
文本?
、
、
所以我
对
Python非常陌生,我只是想知道我是否可以使用它来搜索跨
多行
的文本。下面是我的数据截图: 更清楚的是,我想要做的是搜索包含多个
单词
的短语或表达式,例如“新泽西”,但是,每个
单词
组成一个单独的行,因此我不知道如
何在
查询
中
包含多个行。如果可能的话,我还想创建一个新的列,它将
标记
任何匹配的'M‘和没有’n‘的匹配。所有的帮助都是非常感谢的,以使这更容易为我!
浏览 2
提问于2021-05-22
得票数 1
回答已采纳
3
回答
对
字典
中
的
单词
进行
标记
化
Python
、
、
所以我有一个json文件,我把数据导入到python
中
。 我在JSON中有一个agentId字段和一个agentText字段。]varToken
浏览 21
提问于2019-07-03
得票数 0
回答已采纳
8
回答
在
多行
文本框(或任何控件)
中
呈现HTML
我在我的
多行
文本框
中
添加了一些文本。它有一些Html
标记
,例如,txtSomeMultilineTextbox.Text = HttpUtility.HtmlEncode(someText.ToString()); 此
多行
文本框用于只读条款和条件框我想要格式
化
的文本在那里,
如
粗
浏览 3
提问于2009-10-19
得票数 2
回答已采纳
1
回答
对
python
中
的多个
单词
进行
标记
化
、
、
我有一个来自twitter的大数据集,我想
对
它
进行
标记
化
。但我不知道如何才能表示这样的动词:“寻找,起飞,成长等等。”这对我来说很重要。
浏览 21
提问于2019-01-30
得票数 1
1
回答
从
Antlr4
Listener生成特定的警告/错误消息
我正在使用
Antlr4
对
遗留语言
进行
标记
化
和解析,我的最终目标是生成C#代码并在模拟执行遗留语言的物理硬件的运行时环境
中
执行此代码。 模拟器和代码生成器工作得很好。
浏览 0
提问于2015-07-18
得票数 3
2
回答
有人愿意从数据库的角度来解释一下“
标记
化
的字段”吗?
、
、
、
、
我正在阅读有关SOLR的文章,并将MySQL数据库索引到SOLR
中
。当字段被“规范
化
”时,这意味着什么?谢谢
浏览 1
提问于2010-01-22
得票数 3
回答已采纳
3
回答
Android:格式字符串到html -添加新行<br/>
、
、
、
我需要格式
化
从用户到HTML的文本,但是输入是
多行
的,我必须将字符串
中
的所有“输入”替换为HTML
标记
。String message = messageEditText.getText().toString(); 这是我想要格式
化
的信息。如何
对
字符串
进行
相应的格式
化
?
浏览 12
提问于2014-10-03
得票数 1
回答已采纳
3
回答
Java NLP:在
标记
化
文本时提取索引
、
、
、
、
在对文本字符串
进行
标记
化时,我需要提取
标记
化
后的
单词
的索引。(在原始字符串
中
)。我不能仅仅依靠空格,因为有些
单词
会变成2个
标记
。此外,我不能只搜索字符串
中
的
标记
,因为
单词
很可能会出现多次。字符串: The child some how builds a boaty c cap
浏览 1
提问于2012-09-13
得票数 0
回答已采纳
1
回答
我是否可以使用spacy
进行
标记
,然后使用fastext的预训练
单词
嵌入来提取这些
标记
的向量
、
、
、
我正在使用spacy的德语模型
对
我的德语文本语料库
进行
标记
化
。由于目前spacy只有很小的德语模型,我无法使用spacy本身提取词向量。因此,我在这里使用了fasttext的预训练
单词
嵌入: 现在,facebook在提取
单词
嵌入之前,已经使用ICU
标记
器
进行
标记
化
过程。我正在使用spacy,谁能告诉我这是不是可以?我觉得spacy和ICU
标记
器的行为可能会不同,如果是这样的话,我的文本语料库
浏览 2
提问于2018-06-18
得票数 2
5
回答
比较两个字符串数组的最快/最有效的方法Javascript
、
、
嗨,我想知道是否有人可以提供一些关于在javascript
中
压缩两个字符串数组的最快/最有效的方法的建议。我正在开发一种基于用户输入的标签云类型的东西-输入的形式是书面文本,
如
博客文章或类似的形式。删除输入字符串
中
的所有标点符号,
对
其
进行
标记
化
,将每个
单词
与排除数组
进行
比较,然后删除任何重复项。对于输入文本
中<
浏览 0
提问于2010-02-22
得票数 6
2
回答
WordPiece
标记
化
如何帮助有效地处理NLP
中
的稀有
单词
问题?
、
我已经看到,NLP模型(
如
)利用WordPiece
进行
令牌
化
。在playing
中
,我们将像play和##ing.这样的令牌拆分为有人提到,它涵盖更广泛的范围外词汇(OOV)的词汇.请有人帮我解释一下WordPiece
标记
化
是如何实现的,它是如何有效地处理稀有/OOV
单词
的?
浏览 0
提问于2019-03-27
得票数 52
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
海量智库第30期 | 基于Antlr4的SQL解析器设计介绍
Python自然语言处理:使用SpaCycle库进行标记化、词干提取和词形还原
教你用Python进行自然语言处理
文本数据分析(二):文本数据预处理的方法
绝区壹--LLM的构建模块
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券