首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >从文档分类开始查找书籍和文章参考资料

从文档分类开始查找书籍和文章参考资料
EN

Stack Overflow用户
提问于 2011-03-09 11:59:28
回答 1查看 238关注 0票数 2

我对做一个关于文档分类的项目很感兴趣,并且一直在寻找对文本挖掘中与此相关的理论部分有用的书籍,或者描述从具有分类的文档(带子类别)的训练数据到预测文档类别的系统的过程的文章示例。似乎有一些(相当贵!)标题可用,但这些是会议记录与较小的非常具体的主题的文章。有人能推荐数据挖掘文献中的书籍,为文本挖掘项目提供良好的理论基础,特别是文档分类或概述这一过程的文章吗?

EN

回答 1

Stack Overflow用户

发布于 2011-03-09 14:33:19

克里斯托弗·D·曼宁、普拉巴卡·拉加万和欣里希·舒策拥有free information retrieval book。试试chapter 13 - Text classification & Naive Bayes

另请参阅曼宁和舒茨的nlp book,特别是links for the text categorization chapter的配套网站。

Fabrizio Sebastiani撰写了a useful tutorial about text categorization(PDF)review paper of machine learning for text categorization (PDF)

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/5245437

复制
相关文章
多个checkbox复选框触发点击事件
形如上面这种有list输出到前台的一组复选框,怎么点击其中一个可以触发jquery事件呢?
全栈程序员站长
2022/08/05
1.9K0
python for循环多个参数处理_python for循环嵌套
实际上,“使用for循环遍历数组的最简单方法”(Python类型被命名为“list”BTW)是第二种方法,即for item in somelist:
全栈程序员站长
2022/09/22
2.3K0
python循环(更新中)
---title: python循环tags: 笔记categories: 笔记author: 喵雨date: 2022-06-23 10:56:42coverImg:---while 循环'''循环:whilefor'''# 用while打印1-10之间的数字# 初始值n = 1# 结束条件while n <= 10: print(n) n += 1# 打印1-50之间能被3整除的数字m = 1while m <= 50: if m % 3 == 0: print('---
meowrain
2022/06/23
1K0
python循环(更新中)
Hive一次更新多个分区数据方案
场景 订单数据之类的业务表,因为有状态要更新,比如订单状态,物流状态之类的,需要同步很久之前的数据到Hive. 如何同步时在Hive中进行操作一次更新多个分区内的数据? Hive 操作 设置Hive动
awwewwbbb
2022/09/16
9590
多个单细胞样本数据的循环读取
上一期我们介绍了Seurat对象的构建方法,对于少数样本的数据时,我们可以采取将读取代码复制多遍以运行,如下所示。
小汪Waud
2023/02/16
2.2K0
Python中一个for循环循环多个变量
首先,熟悉一个函数zip,如下是使用help(zip)对zip的解释。 Help on built-in function zip in module __builtin__: zip(...)     zip(seq1 [, seq2 [...]]) -> [(seq1[0], seq2[0] ...), (...)]     Return a list of tuples, where each tuple contains the i-th element     from each of the argument sequences.  The returned list is truncated
卡尔曼和玻尔兹曼谁曼
2019/01/22
5.1K0
Django批量更新多个属性
有时候我们需要同时(一次性)更新某个用户的多条属性。 1. 用户model如下: class User(models.Model): UID = models.CharField('员工uid', max_length=200,) name = models.CharField('员工名字', max_length=200,) mobile = models.CharField('手机号', max_length=200,) mail = models.EmailField(u'邮箱', max_lengt
BigYoung小站
2020/05/04
2.1K0
使用复选框控制条件格式
我们可以使用条件格式来实现。选择A2:C20,单击功能区“开始”选项卡“样式”组中的“条件格式——新建规则”。在“新建格式规则”对话框中,选择“使用公式确定要设置格式的单元格”,在“为符合此公式的值设置格式”中输入:
fanjy
2022/03/09
2.4K0
使用复选框控制条件格式
for 循环中实现多个点击事件 原
(adsbygoogle = window.adsbygoogle || []).push({});
tianyawhl
2019/04/04
8780
使用VBA给复选框批量命名
如下图1所示,使用列G中单元格的内容给复选框命名,并且当选取复选框中,在列E中相应的单元格显示其状态。
fanjy
2022/03/09
1.7K0
使用VBA给复选框批量命名
django使用多个数据库
通过官方文档https://docs.djangoproject.com/zh-hans/3.1/topics/db/multi-db/和csdnhttps://blog.csdn.net/songfreeman/article/details/70229839的这两篇文章可以进行多数据库的设置。但是设置后可能会出现问题,由于我连接的数据库是通过inspactdb的方法得到的model。于是在migrate的时候出现了问题,会提示 1146, “Table xxx doesn’t exist” 。后来发现问题可能出在路由表上,按照DATABASE_APPS_MAPPING映射之后,django默认的表如果要写入可能会找不到数据库。而源代码里的映射关系并不包含新加入的app,例如grappelli等。
obaby
2023/02/22
4980
Python3中for循环多个变量详解
Python的 for 循环中,使用多个变量可以应用于列表或字典,但它不适用于一般错误。
程序新视界
2023/05/03
1.7K0
【安全更新】微软11月安全更新多个产品高危漏洞
北京时间11月11日,微软发布11月安全更新补丁,修复了112个安全问题,涉及Microsoft Windows、Microsoft Office、Microsoft Exchange Server、Visual Studio、Windows Defender等广泛使用的产品,其中包括远程代码执行和权限提升等高危漏洞类型。
绿盟科技安全情报
2020/11/16
9880
Flutter:使用复选框进行下拉多选
本文向您展示了在 Flutter 中使用复选框实现下拉多选的两种不同方法。在第一种方法中,我们将从头开始构建多选。在第二种方法中,我们将使用第三方包快速完成工作。
徐建国
2022/03/30
3.4K0
Flutter:使用复选框进行下拉多选
Laravel 使用多个数据库连接
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/105853.html原文链接:https://javaforall.cn
全栈程序员站长
2022/08/09
1.5K0
django使用多个数据库实现
  在开发 Django 项目的时候,很多时候都是使用一个数据库,即 settings 中只有 default 数据库,但是有一些项目确实也需要使用多个数据库,这样的项目,在数据库配置和使用的时候,就比较麻烦一点。
Se7eN_HOU
2023/04/28
6550
django使用多个数据库实现
【安全更新】微软5月安全更新多个产品高危漏洞通告
5月12日,微软发布5月安全更新补丁,修复了55个安全漏洞,涉及Windows、Microsoft Office、Exchange Server、Visual Studio Code、Internet Explorer等广泛使用的产品,其中包括远程代码执行和权限提升等高危漏洞类型。
绿盟科技安全情报
2021/05/14
1.3K0
【安全更新】微软4月安全更新多个产品高危漏洞通告
4月14日,微软发布4月安全更新补丁,修复了114个安全漏洞,涉及Windows、Office、Edge (Chromium-based) 、Visual Studio Code、Exchange Server、Visual Studio、Azure等广泛使用的产品,其中包括远程代码执行和权限提升等高危漏洞类型。
绿盟科技安全情报
2021/04/26
8430
【安全更新】微软4月安全更新多个产品高危漏洞通告
点击加载更多

相似问题

同步-异步阻塞,非阻塞I/O

15

非阻塞I/O问题

31

阻塞和非阻塞I/O之间的灰色地带?

10

Kotlin:用非阻塞I/O阻塞协同线

21

何时使用非阻塞I/O?

20
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文