我试图通过使用一个BufferedReader来分离一个非常大的.cvs (255列),它抓取每一行并将其存储在一个字符串中。
我希望能够通过命令和字母将其拆分。例如:
1,2,3,5,6将拆分成
1|2|3|4|5|6|7
hello,world,good day to you, Sir,test将拆分成
hello | world |您好,先生|测试
请注意,我只分隔了后面跟着字母数字的逗号。空格前面的逗号不是分开的,而是句子的一部分。
发布于 2019-02-13 02:21:12
对于每个字符串a
a.split(",(?=\\S)");
发布于 2019-05-27 18:57:50
要使用逗号后跟字母数字字符进行拆分,您可以使用
String pattern = ",(?=\\p{Alnum})";或者,如果您计划支持任何Unicode字母,则将Pattern.UNICODE_CHARACTER_CLASS
图案旁边的((?U))选项:
String pattern = "(?U),(?=\\p{Alnum})";Java演示:
String s = "hello,world,good day to you, Sir,test,1,2";
String[] result = s.split(",(?=\\p{Alnum})");
for (String r:result) {
System.out.println(r);
}输出:
hello
world
good day to you, Sir
test
1
2发布于 2019-02-13 02:55:20
在这个链接中有一个解释Lookahead and Lookbehind用法的答案。这里我留下一段代码,我相信它可以解决你所描述的问题:
private static String[] mySplit(final String line, final char separator) {
String regex = "((?<=(" + separator + "\\w)|(?=(" + separator + "\\w))))";
String[] split = line.split(regex);
List<String> list = new ArrayList<>();
for (int i = 0; i < split.length; i++) {
String token = split[i];
if (token.startsWith(String.valueOf(separator))) {
split[i + 1] = token.substring(1) + split[i + 1];
} else {
list.add(token);
}
}
return list.toArray(new String[list.size()]);
}
private static String concatenate(final String[] tokens, final char separator){
StringBuilder builder = new StringBuilder();
for (int i = 0; i < tokens.length; i++) {
builder.append(tokens[i]).append((i < tokens.length - 1) ? separator : "");
}
return builder.toString();
}
public static void main(String[] args) {
final String line = "hello,world,good day to you, Sir,test";
final String[] tokens = mySplit(line, ',');
final String newLine = concatenate(tokens, '|');
System.out.println("newLine = " + newLine);
}https://stackoverflow.com/questions/54656271
复制相似问题