腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(493)
视频
沙龙
2
回答
用于字符和文本
处理
的资源(编码、正则表达式、NLP)
、
、
、
、
理解这些对于
处理
大量文本非常重要,无论是日志文件还是用于构建集体智能算法的文本源。我目前的知识是相当基础的:“只要我使用UTF-8,我就没事了。” 我在找一些资源(也许是书?)让我从一些子弹开始。(我在这里发现了关于堆栈溢出的正则表达式
浏览 3
提问于2010-05-01
得票数 2
回答已采纳
2
回答
亚洲语言情感分析代码示例- Python
、
、
、
、
亚洲languages (特别是
中文
、日文、韩文或阿拉伯文、希伯来文和波斯文)的情感分析是否有完整的代码示例或使用python的工作项目?
浏览 10
提问于2013-03-18
得票数 8
1
回答
有哪些类似于OpenCalais或AlchemyAPI的商业平台可用于
中文
和日语的实体提取?
、
、
、
、
特别是,我希望能够提取人物、地点、电影、音乐等实体,并在广泛使用的链接数据ID(如DBpedia、Freebase或OpenCyc )中提供这些实体。
浏览 6
提问于2010-12-18
得票数 2
1
回答
我不知道这些第三方Python包是在MacOS上安装的吗?
、
、
我目前正在使用Python进行
自然语言
处理
。我使用pip install nltk安装了NLTK包。我的Mac上有几个Pythons人,但我主要使用3.4。现在,我从斯坦福下载了一个可以进行
中文
分段()的切分器,但它可能需要我对原始的NLTK包做一些更改,即我必须编写一个名为stanford_segmenter.py的API文件,然后将它放到nltk/tokenize
浏览 1
提问于2015-12-17
得票数 0
回答已采纳
2
回答
从Perl脚本调用Java方法和类
、
我有一个非常
大
的Java类,它有几个导入的包和库(与
自然语言
处理
相关)。我想调用Java类的一些特定方法,并使用Perl脚本返回结果。我该怎么做呢?
浏览 1
提问于2012-06-26
得票数 1
回答已采纳
1
回答
我可以用Python向PostgreSQL发送一个更新,然后在等待请求完成之前继续前进吗?
、
、
、
、
我正在开发一个高吞吐量的多
处理
/集群
自然语言
预
处理
系统,我想向我的数据库发送一个UPDATE语句(这是一个非常
大
的更新请求,它用数据更新了100个行),然后继续进行下一组预
处理
,而无需等待更新完成。数据库将
处理
更新,但我想转到下一组NLP工作。我该怎么做?我正在使用psycopg2与我的数据库对话。
浏览 2
提问于2022-04-11
得票数 0
2
回答
斯坦福
自然语言
处理
-
中文
情感分析
、
、
、
我想创建一个情感分析程序,它接受一个
中文
数据集,并确定是否有更多的积极,消极或中性的陈述。按照这个例子,我为英语创建了一个情感分析(stanford-corenlp),它完全按照我想要的方式工作,但采用了
中文
。of "+ (score-2) +" rating: " + ratings[score]);目前,我不知道如何更改上述代码,使其支持
中文
我下载了
中文
praser和segmenter,并看了演示。但是经过几天的尝试,它没有任
浏览 0
提问于2014-10-26
得票数 0
1
回答
汉语情感分析工具
、
、
、
(我相信所有情绪分析tools...just都是如此,以防万一)该工具最好是开源的.
浏览 0
提问于2015-05-17
得票数 2
2
回答
iOS中的Unicode文件名
、
、
是否可以在iOS中的资产(图像)文件名中使用(比方说)
中文
?如果没有,在文件名、字符串搜索和其他文件
处理
活动中支持
大
语言的哪些部分?
浏览 1
提问于2016-10-20
得票数 10
回答已采纳
2
回答
日语的自动换行算法
、
、
、
、
显然,浏览器不能很好地
处理
日语文本的换行,可能是因为它包含的空格很少,因为每个字符组成一个完整的单词。你将如何
处理
这个问题?据你所知,有没有什么库或算法可以很好地
处理
这个问题?
浏览 2
提问于2010-01-19
得票数 7
回答已采纳
1
回答
用DocumentDB实现Azure搜索
、
、
如果DocumentDB可以进行自己的索引,Azure搜索也可以进行索引,那么我为什么要将它们一起使用呢?有用例吗?
浏览 7
提问于2017-02-28
得票数 2
回答已采纳
3
回答
触摸屏键盘上的拼音字符输入
、
我正在开发的应用程序需要在中国中部署,这意味着它需要有拼音和汉字
处理
。我听说我们的客户
处理
字符输入的方式是这样的: 输入拼音字符,就像‘zhang’在输入这些字符时,可能会输入
中文
(普通话?)
浏览 6
提问于2009-07-14
得票数 0
1
回答
在名称列表中提取名称
、
、
、
、
我已经得到了一个文本清理任务,我假设这涉及到一些
自然语言
处理
。现在我面临的挑战是从这一段中找到名字。我对NLP非常陌生,使用Python和R进行建模工作。 任何帮助都将不胜感激。
浏览 0
提问于2016-11-28
得票数 2
2
回答
分词化和模式匹配在
中文
中是如何工作的?
、
、
、
、
这个问题涉及到计算以及
中文
知识。我有
中文
查询,我有一个单独的
中文
短语列表,我需要能够找到这些查询中的任何一个。任何从计算角度、模式匹配等角度解释
中文
的链接都会非常有用。
浏览 0
提问于2011-10-02
得票数 10
回答已采纳
2
回答
是否有人为Windows Azure service Bus代理消息服务创建了FTP适配器?
、
、
、
、
假设我有一个FTP服务器,每天都会发送XML文件,并且我想将这些文件发布到Windows Azure service Bus代理消息服务。或者,有没有人实现了一个FTP服务器,可以接受文件,然后发送到服务总线上?
浏览 0
提问于2011-10-03
得票数 2
回答已采纳
2
回答
如何为
大
查询准备Google
自然语言
处理
输出(json)
、
、
、
、
我试图查询一个
自然语言
处理
(NLP)调用的输出
大
查询( BQ ),但我正在努力以正确的格式获得烧烤的输出。beginOffset": -1 } } "language": "en"有没有一种方法可以通过中的命令行直接将输出发送到
大
查询
浏览 4
提问于2016-10-25
得票数 1
回答已采纳
2
回答
将文本解析为有效句子
、
、
我对如何将任何文本解析成有效的句子有疑问。My approach: I solved this using Dynamic programmnig, formula is T[i] = 1 iff T[j] = 1 and substring(j+1, i) is a word in dictionary f
浏览 0
提问于2012-08-29
得票数 0
2
回答
从文本中提取关键句子
、
、
、
你是否知道有一种有效的方法可以从文本中提取关键句子及其频率参数等,并且还可以进行“词干分析”(也可以搜索相似的句子)?非常感谢
浏览 0
提问于2009-12-21
得票数 2
回答已采纳
3
回答
检查pdf提取的文本质量的快速且无监督的方法是什么?
、
、
、
我正在一个相当
大
的语料库上工作,语料库中有数万篇文章。我目前正在使用PDFBox进行各种成功的提取,我正在寻找一种方法来以编程方式检查每个文件,看看提取是否适度成功。我目前正在考虑对每种语言运行拼写检查,但语言可能会有所不同,我还不确定我正在
处理
的是哪种语言。有分数的
自然语言
检测也可能是一个想法。
浏览 0
提问于2009-09-21
得票数 4
回答已采纳
2
回答
具有
自然语言
上下文的字符串分块算法
、
、
我有一个来自用户的任意
大
的文本字符串,需要分割成10k块(可能是可调整的值),然后发送到另一个系统进行
处理
。 在中,文本应该与
自然语言
上下文分开。
浏览 8
提问于2010-03-22
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
中文自然语言处理入门实战
xmnlp—轻量级中文自然语言处理工具
中文自然语言处理医疗、法律等公开数据集整理分享
R语言自然语言处理3:中文语料库构建
自然语言处理之中文分词器-jieba分词器详解及python实战
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券