自然语言理解的中文地址匹配算法 - 腾讯云开发者社区

、、、、

我正在构建一个地址匹配算法。主要的问题是，以往的模型，如Paserator的条件随机场(CRF)模型和Libpostal的平均Perceptron模型，都不能正确匹配地址实体。我使用的免费样本来自AddressBases溢价。当我像这样解析算法的地址时，我希望： bert.parser('FLAT ABC 7-9 TEDWORTH SQUARE LOND

浏览 0提问于2021-09-30得票数 0

1回答

Levenshtein vs MATCH与其他人的最佳MySQL字符串匹配

、

我的数据库细节当前使用：SELECT title FROM my_db WHERE MATCH(`Title`) AGAINST ('my string

浏览 0提问于2015-05-12得票数 3

回答已采纳

2回答

用于字符和文本处理的资源(编码、正则表达式、NLP)

、、、、

我想学习编码，文字和文字的基础。理解这些对于处理大量文本非常重要，无论是日志文件还是用于构建集体智能算法的文本源。我目前的知识是相当基础的：“只要我使用UTF-8，我就没事了。”没有在英语中使用的字符和字母。我还需要了解数学和语料库语言学。当前和未来的web

浏览 3提问于2010-05-01得票数 2

回答已采纳

2回答

使用样本语料库训练ML算法，然后从任意文本中提取相似部分

、、、

我正在尝试从任意的、非结构化的文本(主要是网站)中提取(邮政)地址。我的想法是使用(半)监督机器学习算法来实现这一点。我有一个相当大的地址语料库，可以用来训练算法。经过训练后，我希望输入任意的文本块，并将文本中与地址相似的任何内容输出。我认为匹配部分基于结构相似性，部分基于匹配关键字(城市名称等)。我不太确定的是，现有的库已经在多大程度上涵盖了这一点，或者我自己还

浏览 0提问于2014-05-22得票数 2

1回答

有没有自然语言的web应用程序框架？

、

有没有自然语言的web应用程序框架？也许是像这样的？可能是这样的：My_homepage的主页称为mainpage主页的顶部有文字“我的主页”

浏览 2提问于2010-02-14得票数 3

1回答

Waton对话中拼写错误的单词？

如何在Watson对话API中处理拼写错误的单词。转换应用程序接口中使用的自然语言处理技术/算法计算单词排名，并根据rank.But如何处理拼写错误的单词或英文缩写来匹配训练数据。

浏览 1提问于2016-11-22得票数 0

2回答

语义搜索，寻找能够直观表达的句子。

、、

所以句子中包含的信息可以用视觉来表达。理想情况下，随着时间的推移，这个搜索引擎会变得更好。只是为了得到一个广泛的概述，我需要看什么。

浏览 2提问于2015-11-27得票数 0

回答已采纳

6回答

许多自然语言处理( Natural Language Processing，NLP)算法和库都很难处理来自web的随机文本，这通常是因为它们的前提是干净、清晰的写作。我可以理解为什么这比解析YouTube注释更容易。我的问题是:给定一段随机的文本，是否有一个过程来确定该文本是否写得很好，是否适合在NLP中使用？这些算法的通用名称是什么？我会感谢链接到文章，算法或代码库，但我会满足于好的</

浏览 2提问于2010-02-15得票数 22

回答已采纳

2回答

如何确保中文文本在网页中呈现？

、、、

我正在制作一个部分是中文的网页。我对所有文本使用UTF-8编码。这一页包含一些中文部分，与西方字母混在一起。我使用的西文字体中没有汉字，所以我希望用户电脑上可用的中文字体可以用来显示汉字(顺便说一下，中文字体是超级大的，不适合动态下载)。我是否可以将汉字放在另一个文本的中间，并期望浏览器找到一个中文字体来呈现它们(如果我不关心它是以哪种字体呈现的话)，还是应该以某种方式指定中文字体？如何为中

浏览 0提问于2017-10-16得票数 7

回答已采纳

3回答

从简历中提取信息

、、、、

它使用了自然语言处理的基本技术，如单词解析、分块、reg ex解析器。如果运行该算法，您可以轻松地从大量文档中获取诸如姓名、电子邮件id、地址、学历、经验等信息。你认为最好的方法是什么？

浏览 0提问于2019-02-26得票数 1

1回答

为什么朴素贝叶斯不能解决异或

、

最近，我开始理解与自然语言处理相关的算法，并遇到了各种站点，表明朴素贝叶斯无法捕获XOR概念。首先，我不明白异或问题到底是什么。请有人解释一下，如果可能的话，用一个简单的分类示例来解释异或问题是什么。

浏览 1提问于2017-01-16得票数 7

回答已采纳

5回答

自然语言到SQL查询

、、

我一直在开发一个“将自然语言转换为SQL查询”的系统。下面是我从关系数据库自然语言转换为SQL查询的算法获得的这样一个系统的流程图。📷是否需要培训所有可能的SQL查询？或者，一旦完成了词性标记，我就必须处理这些单词并形成SQL查询？编辑:我已经成功

浏览 0提问于2018-05-14得票数 26

回答已采纳

1回答

基于序列对齐算法的NER构建

、、、、

背景：维基百科页面上说，DNA序列比对算法也可以用于自然语言处理。如果我以上的假设是有意义的

浏览 0提问于2015-12-18得票数 0

1回答

如何测试机器学习或统计NLP算法实现包？

我正在测试几个机器学习算法的实现，检查它们是否可以像论文中描述的那样高效地工作，并确保它们可以为我们的统计NLP (自然语言处理)平台提供强大的功能。你们能告诉我一些测试算法实现的方法吗?4)当使用不同的编程语言时，我必须考虑不同的具体情况吗?5)我必须理解算法吗？我的意思是，如果我真的知道算法是什么以及它是如何工作的，它会提

浏览 3提问于2010-08-31得票数 3

2回答

将文本解析为有效句子

、、

我对如何将任何文本解析成有效的句子有疑问。但是这种方法并不完全正确，它给出了这篇文章中所有可能的单词形式，因为这不是这个问题的要求。所以，请帮助我纠正这个方法，或者建议任何其他好的方法。我还有一个疑问，我在网上搜索了很多关于后缀数组的内容，但我没有得到任何好的教程。所以让我理解这个概念，或者建议任何好的链接。提前谢谢。

浏览 0提问于2012-08-29得票数 0

1回答

基于两种数据的自然语言模型建立的逼近算法

、、、、

我想做什么泰坦尼克号:从灾难中学习机器(输入/泰坦尼克/列车。问题由于这两种自然语言，所以我可以理解，使它们成为向量是必要的，并且这个问题将是多值分类。然而，我不知道如何找到算法来训练这个数据集。

浏览 0提问于2020-11-19得票数 1

回答已采纳

1回答

输出UK地址的不同变体的Python或R函数

、、

我有一个许多英国地址的数据集，我需要解析每个地址，并输出地址的不同(可接受的)变体。首先，我想知道是否可以将问题简化为更简单的方式(也许使用已有的库)？如果不可用，我会尝试找出一种方法，使用不同的Python/R函数来解析每个地址输入，并产生可接受的输出。Road, Edinburgh EH12 7UB 代码应该能够为每个用于解析的输入地址输出不同的变

浏览 13提问于2019-03-31得票数 0

2回答

分词化和模式匹配在中文中是如何工作的？

、、、、

这个问题涉及到计算以及中文知识。我有中文查询，我有一个单独的中文短语列表，我需要能够找到这些查询中的任何一个。在英语中，这是一个非常简单的任务。我根本不懂中文，它的语义，语法规则等等，如果有人在这个论坛谁也懂中文可以帮助我一些基本的理解，以及如何进行模式匹配的中文。我有一个基本的看法，在汉语中，一个单元(中间没有任何空格)实际

浏览 0提问于2011-10-02得票数 10

回答已采纳

2回答

为什么编程最难的部分是命名？

、、

我听说程序员最难的部分是命名变量、类、对象和方法等等。那么，为什么我们要更多地关注算法和数据结构？

浏览 2提问于2015-11-03得票数 0

回答已采纳

1回答

查找2个语句之间的匹配百分比

我有下面两个字符串，实际上意思是一样的： GLOVES: LENGTH: 32 CM MATERIAL: NEOPRENE RUBBER FREE FLOW TEXT: RESISTANT TO WIDEMake: Polyco, Model: Duraprene III or Equivalent 我有1000多套这样的套装，手动做起来很恐慌，我试着这样做： package main } 但是匹配率很低，我得到了： str1 is: 197 length,

浏览 10提问于2020-10-21得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何使用BERT处理地址匹配问题？

Levenshtein vs MATCH与其他人的最佳MySQL字符串匹配

用于字符和文本处理的资源(编码、正则表达式、NLP)

使用样本语料库训练ML算法，然后从任意文本中提取相似部分

有没有自然语言的web应用程序框架？

Waton对话中拼写错误的单词？

语义搜索，寻找能够直观表达的句子。

如何自动判断文本质量？

如何确保中文文本在网页中呈现？

从简历中提取信息

为什么朴素贝叶斯不能解决异或

自然语言到SQL查询

基于序列对齐算法的NER构建

如何测试机器学习或统计NLP算法实现包？

将文本解析为有效句子

基于两种数据的自然语言模型建立的逼近算法

输出UK地址的不同变体的Python或R函数

分词化和模式匹配在中文中是如何工作的？

为什么编程最难的部分是命名？

查找2个语句之间的匹配百分比

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐