我有一篇文章在页面上,我需要分析所有的文本。如何使用Ruby编写Regexp来分析页面上的文章并对其进行解析?例如:
我需要解析正文:ATLANTA — From the sublime emotional high provided by Matt Harvey and Zack Wheeler, the Mets我知道如何解析和获取页面内容,但我不知
我目前正在学习词法分析器和解析器是如何工作的,我对状态机有以下问题。当然,也可以从regexp自动生成相同的代码,但我真的很想知道它是如何工作的,然后再使用大量的魔术:)。接下来是问题:如果我有一个规则:(想给以美元结尾的任何一行文本着色,状态转换表不是很清楚:
current event next action