腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
9
回答
如何对不使用空格作为单词分隔符
的
语言(如中文)执行
Python
()?
、
、
、
、
但是我也需要处理一些不使用空格作为分隔词
的
语言句子,比如
汉语
。我如何把这样
的
句子分成一系列
的
单词呢?到目前为止,答案似乎表明,这需要自然语言处理技术,而在
汉语
中
的
词边界是模糊
的
。我不知道为什么。在我看来,
汉语
中
的
界限是非常明确
的
。每个汉字都有一个相应
的
unicode,并作为一个单独
的
单词/字符显示在屏幕上。 那么歧义从何而来呢?正如您在我
的
<e
浏览 25
提问于2010-09-26
得票数 22
回答已采纳
2
回答
Python
2.7:测试字符串中
的
字符是否都是中文字符
、
下面的代码测试字符串中
的
字符是否都是中文字符。它适用于
Python
3,但不适用于
Python
2.7。我如何在
Python
2.7中做到这一点?
浏览 1
提问于2013-05-08
得票数 8
回答已采纳
2
回答
在
Python
中使用中文构建词典
、
、
、
、
这是我第一次来这里,也是我第一次接触
Python
的
世界。我也在学习
汉语
,我想创建一个使用字典复习
汉语
词汇
的
程序。下面是我通常使用
的
代码:# -*- coding:utf-8-*- 我不断得到
的</e
浏览 1
提问于2011-08-09
得票数 5
回答已采纳
1
回答
中国人需要文字吗?
、
我想用中国
的
伯特模型。在tokenization.py中,我喜欢汉字函数( WordpieceTokenizer function,),但我认为它不需要在
汉语
中使用单词,因为
汉语
的
拟态单位是字符。WordpieceTokenizer只是用来写英文
的
,对吗?
浏览 4
提问于2019-12-19
得票数 0
回答已采纳
2
回答
Python
:用土耳其字母阅读和打印土耳其文
的
问题
、
、
、
、
在阅读和打印
python
中
的
土耳其语时,我遇到了以下问题,单词中
的
土耳其字母无法识别。但是,当我试图在其他语言上存储字符串时,例如俄语、日语和
汉语
,就不会出现这样
的
问题。我在Windows10上使用
Python
2.7.10,将命令行
的
代码页更改为28595似乎不起作用,我只是在
Python
控制台中得到了以下错误。
浏览 2
提问于2015-12-05
得票数 1
回答已采纳
1
回答
Free Pascal 3.2.0中
的
Unicode编码/解码错误
、
、
、
var Actual: string; Raw := UTF8Encode('关于
汉语
'); end 在Free Pascal 3.2.0中,它失败了: expected: <关于
汉语
> but was: <å³äºæ
浏览 21
提问于2020-09-05
得票数 1
回答已采纳
3
回答
如何将unicode编号转换为ints?
、
、
阿拉伯语和
汉语
有自己
的
数字符号。int可以正确地使用所有不同
的
数字书写方式。我无法复制这种行为(
python
3.5.0)>>> name('')>>> int('') ValueError或者这个说法是完全不正确
的
()。
浏览 7
提问于2016-09-26
得票数 7
回答已采纳
2
回答
如何统计中、韩、英文单词
的
数量
、
我有一个句子混合了
汉语
、韩语和英语单词。我在
Python
语言中使用了len()函数,但它给出了错误
的
答案。例如,我们有一个字符串正确
的
单词数(不包括标点符号)是13,但len(a) = 32非常感谢。
浏览 0
提问于2018-03-08
得票数 1
1
回答
MS Access - VBA -如何转义特殊字符
、
、
我正在从Excel表格向Access表格中插入行,excel表格中
的
某一列可以包含任何特殊字符。那么,我如何才能完全按照excel表格中
的
形式插入这些数据呢?因为我不知道数据中可以包含
的
特殊字符
的
列表,所以我不能使用Replace函数。 你好,图沙尔
浏览 3
提问于2014-07-29
得票数 0
3
回答
将
汉语
编码成特殊字符
的
python
、
、
那应该是中文,这是我
的
代码:如果没有解码'ISO-8859-1‘(只返回结果变量),它将显示如下问号: ����Ͱ�Ϊ���ṩ���
浏览 0
提问于2018-12-28
得票数 1
回答已采纳
2
回答
简体
汉语
与繁体
汉语
的
主动语言辨析
、
、
、
、
使用此……两者
的
语言代码都是zh。是否有一种很好
的
方法来查询当前
的
语言或地区是zh-HANS还是zh-HANZ,而不需要进一步区分国家(zh_TW、zh_CN等)?
浏览 6
提问于2015-05-09
得票数 2
1
回答
sqlite/php -按“输入顺序”排序-带有内爆查询
、
、
、
$where");然后是一堆回音等等--但结果按字母顺序返回--先到先得,例如:回来时 词语:隔国际音标: ke 2 词语:买国际音标: mai⁵ 词语:老国际音标: nau⁵ 词语:牛国际
浏览 10
提问于2016-12-19
得票数 1
回答已采纳
5
回答
如何通过resharper禁用评论中
的
拼写错误
由于Resharper不能很好地支持中文,我
的
所有评论都将被建议更改。但我不认为我需要这么做。问题2:我在哪里可以找到
汉语
词典?我找到了,但找不到
汉语
词典。
浏览 2
提问于2018-09-04
得票数 16
1
回答
Unicode和:alpha:
、
("
汉语
漢語", ~r/^[[:alpha:]]+$/)但这是true?:true编辑: 我认为我最初
的
例子不够清楚。
浏览 1
提问于2015-11-07
得票数 7
回答已采纳
9
回答
完整
的
,单间距
的
Unicode字体?
、
、
我正在寻找一个好
的
编程字体,允许我添加注释和字符串文字
的
Unicode,通常是日语和
汉语
,以及一些拉丁和西里尔语言。到目前为止,情况似乎是“完全
的
,单空间
的
,免费
的
,选择2”,谷歌在这方面让我失望了(也许是因为没有好
的
?) 我发现
的
最好
的
是Arial,但它不是单空间,这对我和我使用
的
编辑器来说是一个很大
的
麻烦。更别提我编写
Python
时
的
Python</e
浏览 17
提问于2009-02-25
得票数 145
1
回答
StAX - writeCharacters(),如何不转义汉字、日语字符?
“(来自)
汉语
,英语,にほんご“--->”
汉语
,英语,にほんご System.out.println("JVM default charset = " + Charset.defaultCharset()); String s = &
浏览 1
提问于2010-12-07
得票数 0
1
回答
XPath将每个父元素
的
所有子元素分组
、
我得把每本书
的
所有语言都展示出来。我对如何做到这一点感到困惑。我不想像在/books/book/translation中那样显示每种语言,但我想将它们分组到每本类似于/books/book/title
的
书中,但只有翻译必须显示。所以基本上,我把每本书
的
翻译都分类了。Greek</translation> <translation edition="3">Spanish</translation&g
浏览 7
提问于2014-03-09
得票数 0
1
回答
NSString与中文字母ios
的
比较
、
、
有没有人知道比较NSStrings和中文字母
的
效果好不好?
浏览 3
提问于2011-09-27
得票数 1
回答已采纳
2
回答
哪个NLP库有最成熟
的
汉语
模式?
、
我试图做一些关于简体中文文本
的
NLP (需要提取句子结构和做命名实体识别)。我以前在英语文本中使用过spaCy,但我看到关于中国模式
的
一点注记表明它们是一项正在进行
的
工作,对于我尝试过
的
例子来说,for提取
的
准确性很低。 哪个NLP库拥有最成熟
的
预建
汉语
模型?理想情况下,基于
Python
的
。
浏览 0
提问于2020-08-02
得票数 1
1
回答
特定于语言
的
NLP方法?
、
哪些NLP方法/算法依赖于某些语言中存在
的
特性?例如,法语有英语NLP和西班牙语NLP没有的NLP算法吗?
浏览 0
提问于2021-04-09
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
汉语转拼音工具、新华字典API——两个支持Python的中文资源
汉语太难?美国人找AI帮忙
汉语和英语优势互补才是最佳组合
R语言自然语言处理1:汉语分词
用中文讲述世界好故事:2022年“汉语桥”全球外国人汉语大会—故事会正式启动
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券