我正试图按照教程CMUSphinx的来训练一个声学模型。
因此,当我使用命令sphinxtrain run进行训练时,会遇到以下问题:
Sphinxtrain path: /usr/local/lib/sphinxtrain
Sphinxtrain binaries path: /usr/local/libexec/sphinxtrain
Running the training
Configuration (e.g. etc/sphinx_train.cfg) not defined
Compilation failed in require at /usr/local/lib/sphinx
因此,最近我一直在学习中的教程,并提出了以下问题:内部是否存在培训/验证分割?
问题是,在本教程中,主数据集被拼接到培训和测试中。在这里,训练集用于训练和评估()函数中的测试。
据我所知,在处理神经网络时,通常将数据分成3组:训练、验证和测试。然而,在本教程中,它只分为培训和测试。据我所知,通常对模型进行训练,然后进行评估,然后根据评估步骤中学到的内容更新权重。然而,我似乎找不到评估功能和培训之间的任何联系。因此,在此示例中,使用相同的数据集对模型进行评估和测试。
这里有我可能遗漏的东西吗?在培训期间是否存在训练数据集的内部分裂(分为训练和验证),而函数估价()仅仅用于测试模型的性能?
for
我试图识别和分类基于IOB/序列标签的实体类型。
我能够使用nltk.ne_chunk(),它已经被训练过使用它们的训练集来识别命名的实体。
我想知道是否有任何方法可以使用my on训练集和使用训练数据的标签来训练算法,如
(
send O
sms B-TASK
to
8714349616 B-MOB
how B-MSG
are I-MSG
you I-MSG
)
(
sms B-TASK
how B-MSG
are I-MSG
yo