腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Server 2008:什么是“断路器”这个
英文
单词?
、
我试图复制Server 2008生成全文索引时所做的事情,但我很难找到SQL Server 2008认为是
分词
器的字符列表。 对于
英文
的全文索引,是否有指定Server 2008将中断单词的列表?
浏览 0
提问于2011-12-09
得票数 2
2
回答
斯坦福汉语语法分析器中如何不把英语分割成单独的字母
、
、
、
、
我正在使用的斯坦福
分词
器。对于汉语
分词
者来说,每当遇到一个
英文
单词时,它就会一个一个地把这个单词分割成多个字符,但在切分完成后,我想把这些字符保持在一起。我在谷歌上搜索了这个,却没有得到答案,并试图想出一种方法(花6个小时在上面),从文本中提取
英文
字符,然后在切分完成后将它们放回去,但我意识到,要以有效的方式做到这一点非常困难。
浏览 3
提问于2015-05-24
得票数 1
回答已采纳
1
回答
在
python
中使用Stanford Corenlp进行中文
、
、
我正在尝试使用coreNLP对中文文本进行
分词
、词性和NER的能力。我正在尝试将windows 10上的与
python
3.6一起使用。impor
浏览 1
提问于2018-08-28
得票数 1
3
回答
在Rails中实现全球化
、
将要翻译的内容(现在是
英文
的)是使用
分词
呈现的,因此我有点倾向于创建不同语言的
分词
,然后根据用户的语言选择调用相关的
分词
-你会推荐这种方法吗?
浏览 3
提问于2009-11-13
得票数 2
回答已采纳
1
回答
如何在数据包含多种语言的Server 2008中进行全文搜索?
、
、
、
我有两个问题: 在目录属性中,必须为
分词
指定语言。这是目前设置为英语。如何让它对word使用多种语言,breaks?Hungarian甚至在可以为
分词
选择的语言列表中都不可用。
浏览 9
提问于2010-08-16
得票数 4
回答已采纳
3
回答
一句话语音
英文
识别返回值有问题?
、
, "RequestId": "xxxxxxx"} [附加信息]
浏览 676
提问于2018-09-20
1
回答
斯坦福自然语言处理训练文档预处理器
、
斯坦福自然语言处理是否为DocumentPreprocessor提供了一种训练方法,使其可以使用自己的语料库进行训练,并创建自己的句子分割模型?有没有办法让我这么做?
浏览 1
提问于2017-04-14
得票数 0
1
回答
用
Python
在Dataframe中计数单词
、
、
、
、
我使用熊猫将CSV文件导入
Python
。该文件由3列和498行组成。我只需要有一个字计数一列名为“描述”。我已经清理了文件,通过将列“描述”转换为小写,删除了
英文
停止词和
分词
。
浏览 1
提问于2019-05-14
得票数 1
2
回答
分词
统计法
、
、
你能告诉我一些关于这些算法在
分词
问题上的应用的信息吗? UPD:我已经使用Peter Norvig的中的一些建议在Clojure上实现了这个方法
浏览 4
提问于2012-03-12
得票数 7
回答已采纳
1
回答
ntlk:如何获得词的变化
、
、
我有一个单词列表,将近5000个英语单词,每个单词我都需要这些屈折的形式:动词:不定式,现在简单,现在简单第三人称,过去简单,现在
分词
(形式),过去
分词
副词如何通过
python
从ntlk中的给定单词(例如帮助)中提取这些信息?
浏览 1
提问于2016-05-05
得票数 2
回答已采纳
1
回答
为什么这个Lucene查询不返回hits?
、
、
很久以前,我向Lucene提交了一个bug,想要找到这个问题的答案。但是很多时候已经过去了,就连分析器的开发者似乎也不愿意回答我的问题,所以我想我会把它扔到地板上,看看其他人是否能解释这里发生了什么。import org.apache.lucene.analysis.ja.JapaneseAnalyzer;import org.apache.lucene.document.Field; import org.apac
浏览 2
提问于2016-01-05
得票数 1
回答已采纳
1
回答
使用NLTK为中文运行StanfordPOSTagger时的意外格式
、
、
、
、
我安装了
Python
3.6.0,NLTK3.2.4,并下载了Stanford标签3.8.0。#!/usr/bin/env
python
3 print(st.tag('这 是 斯坦福 中文
分词
器 测试'.split()))[('
浏览 6
提问于2017-08-07
得票数 2
回答已采纳
1
回答
python
中的逐个
分词
(
分词
术语a term en
python
)
hello all,需要定义一个函数,该函数可以按术语矩阵或在最坏的情况下,在列表数组之间划分,以便在第三个矩阵中得到结果,
浏览 2
提问于2009-11-23
得票数 3
回答已采纳
5
回答
如何避免重复加载大文件?
、
、
、
、
我正在尝试从
python
中调用一个Java程序(斯坦福中文
分词
程序)。Java程序需要加载一个大的(100M)字典文件(帮助
分词
的单词列表),这需要12+秒。我想知道是否有可能加快加载过程,更重要的是,当我需要多次调用
python
脚本时,如何避免重复加载它?
浏览 4
提问于2012-01-28
得票数 4
回答已采纳
1
回答
关键词间余弦相似度
、
、
、
、
我刚开始记录
python
中的相似之处,我对如何处理一些数据感到困惑。基本上,我想得到包含关键字的
分词
之间的余弦相似性。{'keyword': tfidf_score} 我所要做的就是得到这两个
分词
之间的余弦相似性,用tfidf分数加权。从网上看,当涉及到文档相似性时,我被所有不同的
python
库/模块淹没了。
浏览 1
提问于2018-12-13
得票数 1
回答已采纳
1
回答
神经标记器是如何工作的?
、
我一直在尝试构建一个NN标记器,其中输入将是字符和输出,令牌。我发现做类似事情的源代码要么是旧的,要么不是简单易学的。你能描述这种模型的输入和输出的形状和意义吗?如果输出是一个热的,那么它是不是太重了,因为令牌的总数大约是100到100万(可能的英语单词数)? 您是否推荐使用keras/tensorflow (希望2.0)训练令牌器的教程或示例?
浏览 0
提问于2020-10-15
得票数 -1
2
回答
Python
中的
分词
、
、
我正在尝试在
python
中使用re.split。我想删除所有像" , ; < > { } [ ] / \ ? ! .I这样的角色 re.split("[, \_!?
浏览 4
提问于2015-11-28
得票数 0
回答已采纳
1
回答
Python
3-如何删除特定行上的空段落- pythondocx
、
、
from docx import Document alphaDic = ['a','b','c','d','e','f','g','h','i','j','k','l','m','n','o','p','q','r','s','t','u','
浏览 17
提问于2017-03-16
得票数 0
1
回答
使用非
英文
字符生成变量
、
如何使用非
英文
字符创建变量。characters in inputأ = 'Something'SyntaxError: invalid syntax 注意:当我在php中使用非
英文
字符创建变量时,它可以工作,但在
Python
中它不能工作。那么如何在
python
中使用非
英文
字符来创建变量呢?
浏览 0
提问于2013-05-05
得票数 0
1
回答
斯坦福汉语
分词
器在
Python
中如何不用标点符号返回结果
、
、
、
我试图用
Python
中的斯坦福
分词
来分割一个中文句子,但是目前的结果中有标点符号。我想返回没有标点符号的结果,只返回单词。做这件事的最好方法是什么?我试着在谷歌上搜索答案,但什么也没找到。
浏览 1
提问于2015-03-06
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python R 分词处理
Python实现jieba分词
python结巴分词学习
“结巴”中文分词:做最好的 Python 中文分词组件
死磕Python(5):结巴分词
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券