在本文中,我们将探讨如何构建自定义 NER 模型以从简历数据中提取教育详细信息。
构建自定义 NER 模型
导入必要的库
就像在启动新项目之前执行仪式一样,我们必须导入必要的库。...“,{“entities”:[(0,9,”date”),(10,48,”degree”),(54,85,”school_name”),(87,95,”location”)]})]
创建模型
构建自定义模型的第一步是创建一个空白的...我们通过使用nlp.disable_pipes()方法在训练时禁用这些组件。
为了训练“ner”模型,模型必须在训练数据上循环,以获得足够的迭代次数。为此,我们使用n_iter,它被设置为100。...为了确保模型不会根据示例的顺序进行泛化,我们将在每次迭代之前使用random.shuffle()函数随机打乱训练数据。
我们使用tqdm()函数来创建进度条。示例中保存训练过程的信息。...SpaCy可以快速的训练我们的自定义模型,它的优点是:
SpaCy NER模型只需要几行注释数据就可以快速学习。