我将tesseract用于OCR,并注意到,有时会出现分割错误,“显然”属于一起的字符会被分割成单独的字符串。根据在一个文本行中发现的字符列表及其边界框,以及初步的OCR结果表明,这些字符中的哪些属于一个单词,我可以应用哪些算法来纠正分割错误或验证结果?所以这是可用的数据:for(Word word : words){
我有一个"emy wattson是一个学生“的文本视图,我在这个文本视图中使用了marquee属性。现在,它是滑动文本。现在,我想知道被点击的单词。例如,现在我可以点击所有文本,当我想写下点击的文本时,我会看到"emy wattson is a student“。但我想知道"emy“,"wattson”,"is“..。分开看。
我在TextView中有一个ScrollView,TextView中充满了一个大文本,它的部分文本在任何时候都可以在屏幕上看到。现在,我想(以编程的方式)强制使文本的某些部分对用户可见。例如,我的案文是:
Lorem ipsum dolor坐好了,敬请光临。预告片。设施空洞。无卵黄,无独角兽。Sed不透水的食草,欧盟的菜鸟和水花等。[医]三尖杉胶。这是一个非常重要的问题。Maecenas在尼西的设施