我有一个关于删除[]中任何字符串的问题。
我的文本数据有一个模式,总是以作者的名字、日期开始。
举个例子,“崔俊浩的报告:”韩国警告其公民“所有的~~”
这两个文本在[]是无用的,所以我想删除崔俊浩的报告:“韩国警告其公民”和文字。
发布于 2022-11-11 16:07:11
这应该可以做到:
srng <- "[Report by Jeongho Choi: 'Koreas Alarms Its Citizens'] [Text] Of all ~~"
trimws(gsub("\\[[^][]*]", "", srng))
输出:
[1] "Of all ~~"
发布于 2022-11-11 18:10:45
一个较短的备选方案如下。使用的正则表达式是\\[
(开头括号),.
(任何字符*
出现0次或多次),后面是结束括号( \\]
)和空格。
a <- c("[Report by Jeongho Choi:'Korea's Alarms Its Citizens'] [Text] Of all ~")
gsub("\\[.*\\] ", "", a)
输出
"Of all ~"
https://stackoverflow.com/questions/74405133
复制相似问题