我使用iText从pdf中提取了以下文本,并将其放入字符串变量:
(1) A a, — al'-fah; of Hebrew origin; the first letter of the alphabet字符串中的段落以([0-9])开头,就像在(9)或(5)中一样,我希望使用pagestring.split("regex")提取以这个字符序列开头的每个段落。能帮上忙吗?
我正在尝试编写一个输出文件,它将每行的字符数限制为60个字符。我设法读入了文本文件,并将其设置为每行60个字符,但是它添加了不应该在同一行的单词。you can get yet better than在使用文本包装器方法之后can get yet, better than a dog or cat,
He’s my albuquerque tu