腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
中文
文档的句子拆分
、
、
、
我必须将
中文
文本分成多个句子。我试过斯坦福大学的DocumentPreProcessor。它在英语上运行得很好,但在
中文
上就不行。 请你能让我知道有什么好的
中文
分句
最好是在Java或
Python
。
浏览 3
提问于2014-12-12
得票数 5
1
回答
如何在NLTK中通过标签将一个段落拆分成句子
、
、
.*>+} """因为标点符号( )是用来拆
分句
子的,所以上面的方法不能很好地适用于下面的句子。
中文
只能用,和.
分句
吗?
浏览 1
提问于2015-09-09
得票数 2
2
回答
如何按字符拆分
中文
字符串?
、
我有一个主要包含
中文
字符的字符串,如下所示:如何按字符拆
分句
子?new StreamWriter("test.txt", false, Encoding.UTF8);writer.Close();writer.Write
浏览 0
提问于2012-07-06
得票数 3
回答已采纳
5
回答
Python
:可以将句子分成两行吗?
Sentence = "the heart was made to be broken" 如何使用
Python
分句
分行显示?
浏览 3
提问于2012-05-06
得票数 0
回答已采纳
2
回答
斯坦福NLP CoreNLP不为
中文
做
分句
、
我的环境:
中文
默认属性文件:StanfordCoreNLP-chinese.properties
浏览 4
提问于2015-04-09
得票数 4
回答已采纳
1
回答
Python
中使用Regex的句子切分
、
、
、
我正在编写一个脚本,用
Python
将文本分成几个句子。然而,我不擅长编写更复杂的正则表达式。* end with "!"full stop is not followed by a number or
Python
浏览 3
提问于2013-11-08
得票数 0
回答已采纳
10
回答
如何将字符串拆分成列表?
、
、
、
我希望我的
Python
函数拆分一个句子(输入),并将每个单词存储在一个列表中。我当前的代码拆
分句
子,但没有将单词存储为列表。我该怎么做?
浏览 0
提问于2009-04-13
得票数 612
回答已采纳
1
回答
如何让stanford.nlp.process.DocumentPreprocessor变得更快?
现在我有大约700000个文件要标记和拆
分句
子,我找到了stanford.nlp.process.DocumentPreprocessor并满足了我的需求。但是我发现DocumentPreprocessor似乎不支持-ioFileList参数( PTBTokenizer支持它),所以我不得不一个一个地解决这个文件,虽然我在
python
中使用了多进程,但它太慢了
浏览 3
提问于2018-10-29
得票数 0
4
回答
如何正确显示在
Python
中调用raw_input()的
中文
字符串?
、
、
、
我当时正试图解决
中文
编码的问题。到目前为止,我面前的唯一障碍是正确显示用户输入的raw_input()。如果用户在raw_input()中键入
中文
字符,打印name_a将显示utf-8代码点,如'/xb7‘#coding: utf-8 n=raw_input一眨眼的功夫,程序就结束了(我知道在Windows环境下
python
的特性,所以我在文件末尾加上了x = input() )。后来我删除了包含第二段代码的原始测试py文件。我在Windows XP环境下使用
浏览 1
提问于2014-01-07
得票数 2
1
回答
用斯坦福coreNLP实现汉语
分句
、
、
、
edu.stanford.nlp.pipeline.StanfordCoreNLP -props StanfordCoreNLP-chinese.properties -annotators segment,ssplit -file input.txt 这在小的
中文
文本上非常有用我也可以使用ssplit注解器运行这个工具,但我不想这样做,因为我的输入是一个并行语料库,已经包含一个句子,而且ssplit可能不会完美地拆
分句
子并在并行数据中造成问题。
浏览 3
提问于2015-06-15
得票数 2
回答已采纳
2
回答
Python
-拆分点是一个单词数组
我想根据当前存储在数组中的单词来拆
分句
子。数组存储了我想要作为一个分割点的单词。我可以使用正则表达式将数组用作拆分点吗?示例:文本文件: I am new to
Python
and I need help.
浏览 3
提问于2017-05-22
得票数 0
2
回答
如何替换
Python
中的unicode汉字?
、
假设我有一根这样的绳子我想用蛋代替egg,我该怎么做呢? 看来example.replace()是无用的。
浏览 4
提问于2017-05-29
得票数 1
回答已采纳
1
回答
如何有效地找到一组术语和一组句子之间的所有模糊匹配?
、
、
、
拆
分句
子,使用FTS查找出现在术语中的单词,并按比率过滤术语,这是可行的,但速度相当慢。现在我使用的是sphinxsearch +
python
-Levelshtein,有没有更好的工具?
浏览 0
提问于2015-09-09
得票数 0
5
回答
在
python
中拆
分句
子
、
、
、
、
我正试着把句子拆分成单词。这给了我一个单词列表,比如使用下面的代码: clean_word_list = [] symbols = "~!@
浏览 3
提问于2017-01-28
得票数 4
2
回答
我怎样才能着色部分进入网页钩子信息?
、
、
我想要编写一个
python
脚本,它向配置好的空闲通道发送一条彩色格式的消息。我设法把纯文本的句子发送到松懈的频道,但我想不出如何赋予我想要的部
分句
子颜色。我在
python
中使用了松弛的used库,如下所示slack = slackweb.Slack(url = url_of_the_configured_channel)
浏览 2
提问于2017-02-15
得票数 25
1
回答
正则表达式拆分不止一次
、
、
我写了这个正则表达式(在
Python
3中):(?<![\u0410-\u042F])([.!?])(?=(\s)?(\s)?[0-9])它用西里尔语拆
分句
子。它们是由\n分隔的。
浏览 0
提问于2012-12-29
得票数 0
回答已采纳
3
回答
如何将句子分割成相关词(术语抽取)?
、
、
、
、
是否有任何NLP
python
库可以拆
分句
子或将单词连接到相关的单词对中?例如: 我找到了topia.termextract,但是它不适用于
python
3
浏览 1
提问于2018-02-21
得票数 5
2
回答
当
python
解释器加载源文件时,它会在内存中将文件内容转换为unicode吗?
、
、
比方说,我有一个用utf8编码的源文件,当
python
解释器加载该源文件时,它会在内存中将文件内容转换为unicode,然后尝试在unicode中计算源代码吗?如果我有一个包含非ASCII字符的字符串,比如 在使用
python
2运行该文件时,我发现字符串实际上仍然以原始gbk字节为单位。所以我的dboubt,
python
2解释不把源代码转换成unicode。因为如果是这样的话,字符串内容将是unicode(我听说实际上是UTF16)。 是那么回事吗?如果是的
浏览 4
提问于2017-10-14
得票数 0
3
回答
拆分器正则表达式依赖于它前面的字母
、
I have a couple of pets, e.g., cat, rat, and fish. What about you?如何向\.添加限制,使字母e,g前面的句号不会被视为拆分器?
浏览 1
提问于2013-01-29
得票数 2
回答已采纳
1
回答
如果句子以标点符号结尾,则在不插入空标记的情况下有效地拆分标点符号。
、
、
我需要在
python
的标点符号上拆
分句
子。
浏览 3
提问于2017-05-14
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python 中文编码
Python 中文编码-Python 基础教程
Python中文社区官方群组
“结巴”中文分词:做最好的 Python 中文分词组件
《Head First Python(中文版)》
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券