OpenNLP doccat训练器总是产生"1种结果模式“

OpenNLP是一个开源的自然语言处理（NLP）工具包，提供了一系列的NLP任务的实现，包括文本分类、命名实体识别、句法分析等。其中，doccat训练器是OpenNLP中用于文本分类任务的组件。

文本分类是将文本按照预定义的类别进行分类的任务。OpenNLP的doccat训练器通过机器学习算法，根据已有的标注数据进行训练，从而能够对新的文本进行分类。然而，如果OpenNLP的doccat训练器总是产生"1种结果模式"，可能有以下几个原因：

数据不平衡：训练数据中各个类别的样本数量不平衡，导致模型倾向于预测数量较多的类别。解决方法可以是增加数量较少的类别的训练样本，或者使用数据增强技术生成更多的样本。
特征选择不合适：文本分类任务中，特征的选择对分类结果有很大影响。可能是选择的特征不具有区分性，导致模型无法准确分类。可以尝试使用其他特征选择方法，如信息增益、卡方检验等，或者使用更复杂的特征表示方法，如词向量。
参数设置不合理：OpenNLP的doccat训练器有一些参数可以调整，如迭代次数、正则化参数等。不合理的参数设置可能导致模型过拟合或欠拟合，影响分类结果。可以尝试调整这些参数，找到更合适的设置。
数据质量问题：训练数据中可能存在噪音或错误标注的情况，导致模型学习到了错误的模式。可以对训练数据进行清洗和校对，确保数据质量。

总之，要改善OpenNLP doccat训练器产生"1种结果模式"的问题，可以从数据平衡、特征选择、参数设置和数据质量等方面入手进行优化。具体的优化方法需要根据具体情况进行调整和尝试。

腾讯云相关产品和产品介绍链接地址：

腾讯云自然语言处理（NLP）：https://cloud.tencent.com/product/nlp
腾讯云机器学习平台（MLP）：https://cloud.tencent.com/product/mlp
腾讯云数据清洗服务：https://cloud.tencent.com/product/dcs

页面内容是否对你有帮助？

有帮助

没帮助

如何安装opennlp的两个版本？

、、、、

我想在windows上安装opennlp-1.6.0和opennlp-1.5.3，我尝试过这样做，添加了系统变量和这条路当我打开命令提示符并键入opennlp时，输出与预期的相同。 C:\>opennlp OpenNLP 1.6.0. Usage: opennlp TOOL where TOOL is one of: Doccat learnable document categorizer DoccatTrainer tr............. 但是当我输入op

浏览 5提问于2016-05-24得票数 1

回答已采纳

1回答

OpenNLP.Net inputStreamFactory :尝试加载文件时出错

、

嘿，我是OpenNLP.Net的新手，在基本步骤上有点迷茫。我查看了一些C#代码，并尝试将其转换为C#，但考虑到我没有找到任何java代码，我认为我错了现在，我正在尝试运行位于main中的代码 using System; using System.IO; using System.Collections.Generic; using System.Linq; using System.Text; using System.Threading.Tasks; using Newtonsoft.Json; using opennlp.tools.doccat; using opennlp.to

浏览 20提问于2019-05-15得票数 0

1回答

在使用random_state时是否必须设置RandomizedSearchCV？

、、

当我使用RandomizedSearchCV时，如果我将随机状态放置在相同的超视距训练器中，总是得到相同的结果。那么，使用它是强制性的吗？因为在我看来，最好总是尝试不同的超参数组合。通常，我为RandomizedSearchCV中使用的模型设置了随机状态，但没有为它设置随机状态。这是正确的吗？

浏览 0提问于2023-04-07得票数 0

2回答

带有RAND的SQL多次插入--如何更改RAND值

、、

我有一条语句，它根据随机值和另一个值将值插入到表中 INSERT INTO TRAINER_SYNC (Steps, TrainerId, SyncDate) SELECT AverageSteps * (RAND()*(1.15-0.85)+0.85), Id, GETDATE() FROM TRAINER 这很好，但是当两个“训练器”具有相同的"AverageSteps“时，插入到表中的数字总是相同的。例如，如果所有的训练器都有10000的平均步长，下面是TRAINER_SYNC表中的结果 Id TrainerId SyncDate S

浏览 0提问于2018-10-20得票数 0

回答已采纳

1回答

Python子进程区域设置

、

在python中使用subprocess.call执行opennlp POSTagger时，结果出错。但是当我把同样的命令放入我的终端时，结果是正确的。经过一些测试，我认为这是因为opennlp未能正确加载模型文件，那么问题出在哪里呢？这个模型是用中文训练的，我使用的是python2.7。 OpenNLP运行时没有任何警告或错误，但它将输入的句子标记为完全错误。它在终端中给出了正确的标签。我猜这是一个编码问题，但我不确定。下面是代码。它没什么特别的，只包含ascii字符。打印此命令并复制到终端，结果正确。现在我知道这是区域设置/编码问题(通过strace调试脚本)。但是将python l

浏览 3提问于2012-05-05得票数 1

3回答

documentBuilderFactory.setFeature("http://javax.xml.XMLConstants/feature/secure-processing"，OpenNLP: ParserConfigurationException

、、

因此，我试图在Android中使用OpenNLP，但我的应用程序总是在OpenNLP在其XmlUtil类中使用的代码体中抛出一个ParserConfigurationException，我无法修改这些代码： public static DocumentBuilder createDocumentBuilder() { try { DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory.newInstance(); documentBuilderFactory.setFe

浏览 4提问于2017-11-11得票数 4

回答已采纳

2回答

在java中使用opennlp提取名词短语

、、、

我正在试着从句子中提取名词短语。我使用的是opennlp库"en-parser-chunking.bin“。代码示例： ArrayList<opennlp.tools.parser.Parse> nounPhrases = new ArrayList<>(); searchmethod("what is the nickname of the British flag?"); for(int t =0; t<50; t++) { str= text.get(t); InputStream is = new F

浏览 2提问于2015-01-30得票数 4

1回答

在NLP中受过训练的模型是什么？

、、、

我是自然语言处理的新手。有人能告诉我在OpenNLP或斯坦福大学CoreNLP中受过训练的模特是什么吗？在使用apache openNLP包在java中进行编码时，我们总是需要包括一些经过训练的模型(在这里可以找到 )。他们是什么?

浏览 2提问于2016-12-30得票数 1

回答已采纳

1回答

Mahout分类器诉OpenNLP文档分类器

、

我正处在一个十字路口，我一直在使用Mahout对一些文档进行分类，并偶然发现了OpenNLP文档分类器。他们似乎做了非常相似的事情，我不知道是否值得转换我目前用mahout编写的内容，并提供一个OpenNLP实现。在文档分类方面，mahout是否比OpenNLP有明显的优势？我的情况是，我有几十万篇新闻文章，我只想提取其中的一个子集。Mahout做得相当好，我使用朴素的Bayes作为术语计数，然后TF-国防军来确定这些文档属于哪一类。当发现新的文章时，模型会被更新，因此模型会随着时间的推移而不断改进。 OpenNLP文档分类器似乎做了非常类似的事情(尽管我还没有测试它有多精确)。-是否有

浏览 0提问于2013-10-28得票数 3

回答已采纳

1回答

尝试使用(RJB) gem的错误“无法创建Java”

、、、、

我正在尝试实现(RJB) gem，以便与JVM对话，这样我就可以运行Open创业板。我已经在Windows 8上安装并运行了Java，所有的迹象，至少是我所知道的，都表明Java已经安装和运行。但是，试图使用RJB的尝试在消息“无法创建Java”中失败。(在其他情况下，我有时会得到“Fiddle:Module”的“未定义方法”‘`dlopen’，这也是难以理解的。) 最初，我只是按默认值安装了JDK。由于我的64位系统，这个安装了64位的Java.我不确定Ruby和RJB是否会这样做，所以我安装了32位的JRE。但是，错误是相同的。我还可以运行更多的测试来确保JVM在Ruby之外工作吗？有

浏览 1提问于2013-09-15得票数 4

回答已采纳

3回答

javax.servlet.ServletException: java.lang.OutOfMemoryError: Java堆空间

、、、

我想从我的网页上选择的文本中提取名词，并在文本为displayed.So时突出显示它们。我使用OpenNLP库来解析和获取名词列表。它在java类中运行良好，没有内存问题，虽然在显示输出之前花了6-7秒，但当我在jsp页面中运行代码时，我得到了以下错误： javax.servlet.ServletException: java.lang.OutOfMemoryError: Java heap space org.apache.jasper.runtime.PageContextImpl.doHandlePageException(PageContextImpl.java:909

浏览 52提问于2017-03-13得票数 1

1回答

Python OpenNLP包装器-托卡器停留在\n

、、

我(在OS上工作)有一个关于python的OpenNLP包装器的问题：由于某些原因，语句检测器无法工作，使用此包装器。我对此没意见，只是换了一个由NLTK提供的语句检测器。当我将输出反馈到OpenNLP托卡器时，问题就开始了。下面是一些示例代码： import opennlp import nltk token = opennlp.OpenNLP("/Users/sven/apache-opennlp-1.6.0", "TokenizerME", "en-token.bin") pos = opennlp.OpenNLP("/User

浏览 8提问于2016-05-12得票数 0

回答已采纳

2回答

OpenNLP与同义词数据库

我们有组织名称同义词的数据库(例如BT是British Telecom。我们使用OpenNLP从文本块中提取实体和关键字。有没有办法告诉OpenNLP使用我们的数据库数据(例如，如果它发现BT作为组织名称，它应该返回British Telecom)。某种hook。或者我们只需要根据OpenNLP结果手动执行该操作？

浏览 1提问于2013-11-20得票数 2

1回答

OpenNLP在使用泰国模型时会出现错误

、、、

我试图遵循的建议，但我得到了以下错误： C:\OpenNLP_models\tool\apache-opennlp-1.5.3-bin\apache-opennlp-1.5.3\bin>opennlp TokenizerME C:\OpenNLP_models\tool\apache-opennlp-1.5.3-bin\apache-opennlp-1.5.3\bin\thai.tok.bin < test.txt Loading Tokenizer model ... Exception in thread "main" java.lang.NullPointe

浏览 1提问于2018-07-23得票数 3

回答已采纳

1回答

发布安装OpenNLP 1.8.3

、、

一段时间以来，我一直在努力弄清楚如何自己安装OpenNLP。我已经安装了Maven，并将它添加到PATH中，并且能够使用预期的结果运行mvn -v。现在我找到了，尝试了相同的命令，得到了相同的错误。正如它上公认的答案指出，命令应该在/Users/[my_name]/apache-opennlp-1.5.2/opennlp文件夹中使用，所以我去寻找那个文件夹，但它不在那里。新下载的apache-opennlp-1.8.3文件夹如下所示：在此文件夹中运行mvn clean install将产生以下结果： [INFO] Scanning for projects... [INFO] --

浏览 6提问于2017-11-05得票数 1

回答已采纳

1回答

如何处理在OpenNLP中使用自定义NER模型时的“OpenNLP”？

、、、

我正在尝试执行OpenNLP模型，我已经为我的定制名称进行了培训。我执行了以下命令来创建自定义模型： opennlp TokenNameFinderTrainer -encoding UTF-8 -lang en -data c：\Users\nshah\Desktop\en Desktop. -model en-ner-personName.bin 我能够成功地创建名为en-ner-personName.bin.的模型现在，我试图执行我的程序如下： import java.io.FileInputStream; import java.io.FileNotFoundExceptio

浏览 4提问于2016-02-04得票数 2

1回答

用Java为Maxent类创建训练数据

、、、

我正在尝试为maxent分类器创建java实现。我需要把这些句子分类为n不同的类。我看了一下。但我无法理解如何创建培训数据。我需要训练数据的形式，其中训练数据包括词素标记的句子，以便分类器使用的特征将类似于前一个词，下一个单词等，。我正在寻找培训数据，其中有词性标注和句子类提到的句子。例子：我的/(POS)名称/(POS)是/(POS) XYZ/(POS)类任何帮助都将不胜感激。

浏览 4提问于2016-03-16得票数 5

回答已采纳

1回答

基于标注语料库的句子切分

、、

我有一个自定义的带注释的语料库，格式为OpenNLP。例如： <START:Person> John <END> went to <START:Location> London <END>. He visited <START:Organisation> ACME Co <END> in the afternoon. 我需要的是从这个语料库中切分句子。但由于注释的原因，它并不总是像预期的那样工作。怎样才能在不丢失实体注释的情况下做到这一点呢？我正在使用OpenNLP。

浏览 0提问于2017-09-26得票数 1

1回答

OpenNLP 1.5.3中英文NER的加载定位模型

、、

我正在使用OpenNLP 1.5.3，我想在英文文本中为位置名称执行NER。为此，我从下一个url下载了相应的模型(en-ner-location.bin)：问题是，当我尝试使用以下命令在文本中使用此模型执行NER时： ./Opennlp/bin/opennlp TokenNameFinder en-ner-location.bin < Text.txt > Text.txt.ner_en_loc 我得到以下错误： Loading Token Name Finder model ... failed IO error while loading model file '

浏览 1提问于2014-07-30得票数 0

回答已采纳

1回答

我如何在这个名词查找程序中处理这个ArrayIndexOutOfBoundException

、、

我想出了一个问题，我找不到解决这个问题的方法。请帮帮忙。我的程序试图从用户给定的句子中找出名词、动词和形容词(在这里，我只是试图找出这些名词)。如果我在程序中犯了错误，那么请指出这些错误，以便我可以纠正它。这是我的代码： enter code here import java.io.FileInputStream; import java.io.InputStream; import java.util.HashSet; import java.util.Set; import opennlp.tools.cmdline.parser.ParserTool; import opennlp.

浏览 3提问于2016-04-21得票数 0

1回答

这些词干在OpenNLP中有意义吗？

、

我刚刚安装了openNLP并测试了一些词干分析。这些词干的结果在我看来是可疑的。 people => peopl excellent => excel beautiful => beauti 我不确定这些是OpenNLP的原始输出，或者我的安装有一些问题，不能产生正确的结果。有人能帮我验证一下吗？真的谢谢你。

浏览 1提问于2017-05-20得票数 0

2回答

OpenNLP中命名实体的训练

、、、

我想训练一个印第安名字语料库： class NameTraining { public static void TrainNames() throws IOException { Charset charset = Charset.forName("UTF-8"); FileReader fileReader = new FileReader("train.txt"); ObjectStream fileStream = new PlainTextByLineStream(fil

浏览 5提问于2013-10-16得票数 0

回答已采纳

2回答

在实体框架中，添加和附加有什么区别，我如何解决问题？

、

我最近开始使用实体框架()，检查是否真的需要向数据库中添加新记录是一件很痛苦的事情。如果我需要添加到数据库中的实体已经在数据库上了，我就会知道，因为我在插入它之前做了一个查询，如果它存在，那么我保留这个实例，因为我需要在一些关系中使用它。假设我的实体名为Book。当一个实体不在数据库中时，问题就出现了，而我是这样做的： Book b = //... modelContainer.AddToBooks(b); 我可以很容易地做到： modelContainer.SaveChanges() 每次我添加一个新的实体(不管它是什么实体)，这都会很好，因为当我一次插入一种条目，并检查它是否已经在数

浏览 0提问于2011-04-20得票数 17

回答已采纳

1回答

命令行的OpenNLP POSTagger输出

、

我想使用来标记泰语单词。我下载了OpenNLP和，并运行了以下命令 ./bin/opennlp POSTagger -lang th -model thai.tok.bin < sentence.txt > output.txt 我将下载的thai.tok.bin放在我调用的目录中，然后运行以下命令。sentence.txt将此文本包含在กินอะไรยังนาย中。但是，我得到的输出只有以下文本： Usage: opennlp POSTagger model < sentences Execution time: 0.000 seconds 我是OpenNLP的新手，如果有

浏览 1提问于2017-04-28得票数 1

回答已采纳

1回答

如何从解析树中提取依赖关系三元组

如何从阿拉伯语文本的OpenNLP解析器生成的解析树中提取依赖三元组？例如，“我有一只棕色狗”中的依存关系三元组由：(have subj I)，(have obj dog)，(dog adj-mod brown)，(dog det a)组成。

浏览 0提问于2017-04-06得票数 1

1回答

如何从shell脚本运行opennlp、SentenceDetector和Tokenizer？

、

我正在运行一个shell脚本中的opennlp语句检测和标记程序，但是我不断地收到错误:无法找到或加载输入. main /或无法找到或加载主类opennlp.tools.lang.english.SentenceDetector。这是我的代码： OPENNLP_HOME=/usr/local/Cellar/apache-opennlp/1.5.3 export OPENNLP_HOME CLASSPATH=.:\ $OPENNLP_HOME/libexec/lib/opennlp-tools-1.5.3.jar:\ $OPENNLP_HOME/libexec/lib/opennlp-maxe

浏览 2提问于2016-06-23得票数 1

回答已采纳

1回答

查询结果中的AppEngine keyProperty字段一段时间后没有得到任何值

、

在应用程序引擎ndb查询的结果中，我得到了一些奇怪的行为。模式(简化)： class Trainer(polymodel.PolyModel): user = ndb.KeyProperty(kind='User') 一组完整的对象(大约。( 100-200)是通过查询收集的： trainers = Trainer.query() A在此阶段，单个训练器对象具有一个有效的用户对象，可通过以下方法获得： user = trainer.user.get() 训练器集合被分成几个中间的python列表。之后，大多数训练器对象都有一个用于None的.user值。这段代码曾经工

浏览 0提问于2017-11-15得票数 0

回答已采纳

1回答

如何处理LemmatizerTrainer 'UTFDataFormatException:编码字符串太长‘？

、、、

我正在使用Opennlp来训练德语词的柠檬化模型。因此，我使用opennlp和的培训集，可以下载。培训本身运行良好(只需要一点点内存)，但由于UTFDataFormatException: encoded string too long异常，cli无法编写模型。我使用的cli命令：opennlp LemmatizerTrainerME.conllu -params params.txt -lang de -model de-lemmatizer.bin -data UD_German-HDT/de_hdt-ud-train.conllu -encoding UTF-8 堆栈跟踪： Writ

浏览 3提问于2021-11-22得票数 1

回答已采纳

2回答

如何使用OpenNLP和stringi来检测句子边界？

、、、、

我想把next string分成几个句子： library(NLP) # NLP_0.1-7 string <- as.String("Mr. Brown comes. He says hello. i give him coffee.") 我想演示两种不同的方式。一个来自openNLP包 library(openNLP) # openNLP_0.2-5 sentence_token_annotator <- Maxent_Sent_Token_Annotator(language = "en") boundaries_sentence

浏览 1提问于2015-08-07得票数 12

1回答

错误加载NER .bin文件作为openNLP::Maxent_Entity_Annotator()的模型参数

、、、

我使用Apache的命令行工具创建了一个模型来识别命名实体。下面的代码使用文件sentences4OpenNLP.txt作为培训集创建模型。 opennlp TokenNameFinderTrainer -type maxent -model C:\Users\Documents\en-ner-org.bin -lang en -data C:\Users\Documents\apache-opennlp-1.6.0\sentences4OpenNLP.txt -encoding UTF-8 我从命令行中测试了这个模型，将它的句子传递给标签，这个模型似乎运行良好。但是，我无法成功地使用R中的模

浏览 4提问于2016-02-23得票数 0

回答已采纳

1回答

opennlp.groovy有NullPointerException

、

我正在尝试使用GitHub中的以下代码片段，以便可以在Groovy脚本中使用OpenNLP工具。 (来自的OpenNLP类) #!/usr/bin/env groovy @Grapes( @Grab( group='org.apache.opennlp', module='opennlp-tools', version='1.5.3' ) ) import opennlp.tools.tokenize.* import opennlp.tools.postag.* OpenNLP nlp

浏览 4提问于2013-04-24得票数 0

1回答

在哪里可以找到opennlp.tools.lang.dutch。*荷兰工具的包？

、、

我正在尝试在荷兰文本上使用。TextRank的实现有和类，它们导入OpenNLP类，如 import opennlp.tools.lang.english.ParserTagger; import opennlp.tools.lang.english.SentenceDetector; import opennlp.tools.lang.english.Tokenizer; 和 import opennlp.tools.lang.spanish.PosTagger; import opennlp.tools.lang.spanish.SentenceDetector; import openn

浏览 3提问于2014-11-03得票数 1

回答已采纳

1回答

OpenNLP --这个(1.5.3)版本的OpenNLP不支持1.6.0版本

、、、、

目前，我正在尝试在代码中使用经过自定义培训的OpenNLP名称查找器模型。我的项目使用OpenNLP 1.6.0，是使用Eclipse开发的。使用OpenNLP 1.6.0对模型进行了训练。然而，我得到了这个恼人的错误： java.lang.IllegalArgumentException : opennlp.tools.util.InvalidFormatException: Model version 1.6.0 is not supported by this (1.5.3) version of OpenNLP! 向提出了一个类似的问题，并回答说，问题是由于OpenNLP模型正在使用

浏览 3提问于2017-01-12得票数 0

1回答

如何使用OpenNLP从文本中获取位置？

、、、

我使用分块来标记数据并从文本中获取位置。当我们使用名词短语名称(也称为名词短语)时，我尝试从下一个文本中提取名词短语，所以它不能use.then，所以我移动到核心nlp的位置，我尝试运行以下代码 * @param args the command line arguments */ public static void main(String[] args) { // TODO code application logic here try { InputStream inputStreamTokenizer =新的FileInputStream(“D：\project\关

浏览 0提问于2018-11-07得票数 0

回答已采纳

1回答

执行Open-NLP Ruby Gem时出错

、、

我们试图基于执行的ruby代码 #gem inclusion require 'open-nlp' # Set an alternative path to look for the JAR files. # Default is gem's bin folder. OpenNLP.jar_path = '/home/USER/.rvm/gems/ruby-2.1.2/gems/open-nlp-0.1.5/bin/' # Set an alternative path to look for the model files. # Default

浏览 3提问于2014-07-09得票数 2

回答已采纳

1回答

无法在java中使用opennlp训练location.bin

、、

我正在尝试在java中使用opennlp训练en-ner-location.bin文件，我得到的训练文本文件的格式如下：<START:location> Fontana <END> <START:location> Palo Verde <END> <START:location> Picacho <END> 我使用下面的代码训练了这个文件 import java.io.BufferedOutputStream; import java.io.BufferedReader; import java.io.File;

浏览 2提问于2014-05-19得票数 1

1回答

Apache OpenNLP python包装器-服务器超时

、、

您好，我正在尝试使用带有Python包装器的Apache，但是现在当我尝试启动服务器时，它就超时了，并且我找不到我应该从哪里延长超时时间。我还需要安装任何与Apache相关的东西才能运行服务器吗？ python opennlp/opennlp.py --path /home/sandra/apache-opennlp-1.8.4 Starting OpenNLP Traceback (most recent call last): File "opennlp/opennlp.py", line 67, in <module> main() File

浏览 4提问于2018-06-08得票数 0

3回答

OpenNLP托卡器没有检测到属于一起的单词吗？

、、、

我刚开始接触NLP，我偶然发现了OpenNLP。根据我的理解，tokenization意味着将文本分割成单词和句子。单词通常被空格隔开，但并不是所有的空白都是相等的。例如，洛杉矶在一个人的思想上，不顾空白处。但是，每当我运行OpenNLP Tokenizer时，它都会为洛杉矶创建两个不同的令牌： Los & Angeles。这是我的代码(我从旧的OpenNLP站点获得了en-token.bin模型)。 InputStream inputStream = new FileInputStream("C:\\apache-opennlp-1.9.0\\Models\\en-toke

浏览 3提问于2018-07-11得票数 3

1回答

OpenNLP在NameFinderME类中的空指针异常

、

我使用从给定的文本中提取命名实体。在大数据上运行代码时，它会给出以下错误。当我在小数据上运行它时，它工作得很好。 java.lang.NullPointerException at opennlp.tools.util.Cache.put(Cache.java:134) at opennlp.tools.util.featuregen.CachedFeatureGenerator.createFeatures(CachedFeatureGenerator.java:71) at opennlp.tools.namefind.DefaultNameContextGener

浏览 1提问于2011-02-14得票数 5

1回答

用于疾病的opennlp样本训练数据

、、、

我正在使用OpenNLP进行数据分类。我找不到针对疾病的TokenNameFinderModel。我知道我可以创建自己的模型，但我想知道是否有针对疾病的大样本训练数据？

浏览 10提问于2017-02-06得票数 0

1回答

使用openNLP分块程序时出现错误

我尝试这样使用openNLP分块： Gate.getCreoleRegister().registerDirectories( new File(Gate.getGateHome().getAbsolutePath() + "/plugins/OpenNLP").toURI().toURL()); ProcessingResource chunkPr = (ProcessingResource) Factory.createResource("gate.opennlp.OpenNlpChu

浏览 2提问于2014-02-17得票数 0

3回答

opennlp chunker和postag结果

Java - opennlp 我是一个新的opennlp，我正在尝试分析句子，并有post标签和块结果，但我不能理解价值的含义。有什么表格可以解释post标签和块结果值的完整形式含义吗？ Tokens: [My, name, is, Chris, corrale, and, I, live, in, Philadelphia, USA, .] Post Tags: [PRP$, NN, VBZ, NNP, NN, CC, PRP, VBP, IN, NNP, NNP, .] chunk Result: [B-NP, I-NP, B-VP, B-NP, I-NP, O, B-NP, B-VP,

浏览 0提问于2013-02-25得票数 16

回答已采纳

1回答

获取NullPointerException的Maven Apache OpenNLP工具

、、、

我正在尝试在Maven中使用Apache OpenNLP。我在pom中添加了依赖项。 <groupId>org.example</groupId> <artifactId>nlp-fun</artifactId> <version>1.0-SNAPSHOT</version> <properties> <maven.compiler.target>1.8</maven.compiler.target> <maven.compiler.source>1.8&

浏览 15提问于2020-06-24得票数 0

回答已采纳

1回答

使用Encog进行正确的培训和验证

、、、

我觉得我对恩科做了些错事。在我看到的所有例子中，它们只是简单的训练，直到达到某个训练错误，然后打印结果。何时计算梯度和更新隐藏层的权重？这些都包含在training.iteration()函数中吗？这是没有意义的，因为尽管我的程序中的训练错误不断减少，这似乎意味着权重正在改变，但我还没有通过网络运行验证集(在开始构建数据时，我断开了验证集并与训练集分离)，以确定验证错误是否仍然随着训练错误而减少。我还将验证集加载到培训器中，并在网络中使用compute()运行验证集，但是验证错误总是类似于培训错误，因此很难从培训中判断是否存在相同的错误。同时，测试命中率低于50% (如果没有学习的话)。我

浏览 4提问于2014-06-21得票数 2

回答已采纳

1回答

安装OpenNLP时出现问题

、、、

我在安装OpenNLP时遇到问题。我希望Stack的聪明才智能在这里帮助我。我承认我不太熟悉Java扩展/插件的使用，所以如果有任何帮助，我将不胜感激。我已经安装了Maven。当我运行mvn --version时，我收到以下信息： Apache Maven 3.0.4 (r1232337; 2012-01-17 03:44:56-0500) Maven home: /Users/[my_name]/apache-maven-3.0.4 Java version: 1.6.0_33, vendor: Apple Inc. Java home: /System/Library/Java/Java

浏览 0提问于2012-07-08得票数 1

回答已采纳

1回答

0.0.0-快照不支持OpenNLP型号版本1.5.0

、、

我正在尝试OpenNLP手册中的一个示例(这是我第一次使用它)。出于某种原因，这是： import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.IOException; import java.io.InputStream; import opennlp.tools.sentdetect.SentenceDetectorME; import opennlp.tools.sentdetect.SentenceModel; public class Main { /** *

浏览 0提问于2012-10-20得票数 0

1回答

使用openNLP最大值的训练模型

、、、、

我有黄金数据，在那里我注释了来自几个文件的所有房间号。我想使用openNLP来训练一个使用这些数据并对房间号进行分类的模型。我被困在从哪里开始了。我阅读了openNLP maxent文档，查看了opennlp.tools中的示例，现在查看了opennlp.tools.ml.maxent --它似乎是我应该使用的东西，但我仍然不知道如何使用。有人能给我一些关于如何使用openNLP maxent以及从哪里开始的基本想法吗？任何帮助都将不胜感激。

浏览 5提问于2014-07-22得票数 3

1回答

solr+openNLP集成后无变化

、、

我正在使用这个维基来集成solr+openNLP。我正在尝试应用命名识别(人名)令牌，但我看不到任何更改。我的schema.xml看起来像这样： <field name="text" type="text_opennlp_pos_ner" indexed="true" stored="true" multiValued="true"/> <fieldType name="text_opennlp_pos_ner" class="solr.TextField" p

浏览 0提问于2014-06-04得票数 1

2回答

基于关联数据计算整体记录的最佳方法

、

我正在处理比赛的最终结果及其关于最佳教练的一般报告，以及教练员应该得到的位置。下面我已经准备好了关联数组。key代表教练员的身份，value代表他/她的运动员获得的某一类奖牌的数量(金、银、铜牌)。 [gold] => Array ( [777777] => 4 [333333] => 2 [555555] => 1 [999999] => 1 ) [silver] => Array ( [999999] => 3 [777777] => 3

浏览 6提问于2016-03-21得票数 0

回答已采纳

3回答

OpenNLP有词干分析器吗？

、

我正在做一个项目，我正在使用OpenNLP的一些功能。我需要的一个特性是词干分析器。我用谷歌搜索了一下，发现它应该在opennlp.tools.stemmer包中有一个Porter词干分析器，但是我的集成开发环境(IntelliJ IDEA 13.1)唯一找到的就是Stemmer接口。我使用的是OpenNLP 1.5.3。是我看错了地方，还是OpenNLP没有词干实现？

浏览 0提问于2014-09-13得票数 2