我遇到了一个问题,即在OCR识别的文本中匹配字符串并找到它的位置时,考虑到可能存在对错误、缺失或额外字符的任意容限。结果应该是一个最佳匹配位置,可能(不一定)具有匹配子字符串的长度。Substring: Tolerance is too high;Result: no match
我尝试过调整Levenstein算法,但它不能正确地用于子字符串,并且不能返回位置最好使用D
我有一个字符串S和一个字符串allItems列表,allItems包含可能具有常见“子单词”的字符串,但是一个元素永远不是另一个元素的扩展名:
//good, they both contain FuzzyallItems中的S中找到每一个字符串的匹配或近似匹配,以及它们的索引(可以是开始或结束,或者最好是两者兼而有之)。我一直在寻找一些算法来