在OpenRefine中,这些类似于(例如):||I am a sectionwith a subsection with another subsection
为了能够正确地将它们划分为顶层和子部分,我想也许我可以使用replace函数将field1的值从field 2等值中移除是的,我如何在整个CSV?中使用replace函数来动态地实现这一点?
一个让我想知道:我认为正则表达式将作为DFA实现,因此非常高效(最多只需要扫描一次输入字符串)。提出了一个有趣的观点,并非所有Python正则表达式都是正则表达式。(他的示例是r"(a+)b\1",它匹配一定数量的a,a,b,然后匹配与前面相同数量的a)。这显然不能用DFA来实现。所以,重申一下: P