guava 提供了非常强大的字符串处理操作
1 Joiner
以前肯定遇到过这样的场景,为了sql查询,把一个List<Integer>集合拼接成一个字符串,用逗号隔开,看一下Joiner如何实现的:
public static void main (String args[]) {
List<Integer> list = Lists.newArrayList(1,2,3,4,5);
Joiner joiner = Joiner.on(",").skipNulls();
System.out.println(joiner.join(list));
}
输出结果:1,2,3,4,5
是不是很方便?Joiner提供on方法,用来作为各个对象之间的连接
2 Splitter
demo:
public static void main (String[] args) {
String str = "fasdga, , fasgasd, fasdgas";
Splitter splitter = Splitter.on(",").omitEmptyStrings().trimResults();
List<String> stringList = splitter.splitToList(str);
for (String s : stringList) {
System.out.println(s + "============");
}
}
on方法指定按什么分割,omitEmptyStrings方法表示分割结果项中有空字符串则忽略, trimResults表示对分割后的结果使用trim方法
3 Charsets
类似一个枚举值,提供各种字符集,如:Charsets.UTF_8
4 CaseFormat
CaseFormat被用来方便地在各种ASCII大小写规范间转换字符串——比如,编程语言的命名规范。CaseFormat支持的格式如下:
格式 | 范例 |
LOWER_CAMEL | lowerCamel |
LOWER_HYPHEN | lower-hyphen |
LOWER_UNDERSCORE | lower_underscore |
UPPER_CAMEL | UpperCamel |
UPPER_UNDERSCORE | UPPER_UNDERSCORE |
此类一般情况下没用,当使用反射的时候可能有用,比如,你想获取一个属性的get方法,属性名称为"name",那么方法名称为getName,如果你不知道具体的属性名称, 你会怎么做呢?
@Override
public String toString () {
Field[] fields = this.getClass().getDeclaredFields();
Objects.ToStringHelper toStringHelper = Objects.toStringHelper(this.getClass());
try {
for (Field field : fields) {
//这里用到CaseFormat,把方法名转换成驼峰标示(当然这里也可以自己动手去处理字符串)
String methodName = CaseFormat.LOWER_HYPHEN.to(CaseFormat.LOWER_CAMEL, "get-" + field.getName());
Method method = this.getClass().getMethod(methodName);
toStringHelper.add(field.getName(), method.invoke(this));
}
} catch (Exception e) {
e.printStackTrace();
}
return toStringHelper.toString();
}
5 CharMatcher
(1)CharMatcher 实现了接口Predicate<Character>,可用来作为集合的过滤器,CharMatcher是一个抽象类,如果要实现自己的CharMatcher要实现方法matches方法
(2)CharMatcher 一般情况下做了两件事:
2.1 匹配字符,获取到CharMatcher
2.2 在获取到的CharMatcher上做操作
(3)CharMatcher 自己提供了很多CharMatcher的实现:
ANY: 匹配任何字符
ASCII: 匹配是否是ASCII字符
BREAKING_WHITESPACE: 匹配所有可换行的空白字符(不包括非换行空白字符,例如"\u00a0")
DIGIT: 匹配ASCII数字
INVISIBLE: 匹配所有看不见的字符
JAVA_DIGIT: 匹配UNICODE数字, 使用 Character.isDigit() 实现
JAVA_ISO_CONTROL: 匹配ISO控制字符, 使用 Charater.isISOControl() 实现
JAVA_LETTER: 匹配字母, 使用 Charater.isLetter() 实现
JAVA_LETTER_OR_DIGET: 匹配数字或字母
JAVA_LOWER_CASE: 匹配小写
JAVA_UPPER_CASE: 匹配大写
NONE: 不匹配所有字符
SINGLE_WIDTH: 匹配单字宽字符, 如中文字就是双字宽
WHITESPACE: 匹配所有空白字符
(4)CharMatcher 提供了一些静态方法来让使用者更方便的获取CharMater对象,来处理字符串:
CharMatcher is(char match): 返回匹配指定字符的Matcher
CharMatcher isNot(char match): 返回不匹配指定字符的Matcher
CharMatcher anyOf(CharSequence sequence): 返回匹配sequence中任意字符的Matcher
CharMatcher noneOf(CharSequence sequence): 返回不匹配sequence中任何一个字符的Matcher
CharMatcher inRange(char startInclusive, char endIncludesive): 返回匹配范围内任意字符的Matcher
CharMatcher forPredicate(Predicate<? super Charater> predicate): 返回使用predicate的apply()判断匹配的Matcher
CharMatcher negate(): 返回以当前Matcher判断规则相反的Matcher
CharMatcher and(CharMatcher other): 返回与other匹配条件组合做与来判断的Matcher
CharMatcher or(CharMatcher other): 返回与other匹配条件组合做或来判断的Matcher
(5)上面几条主要讲了默认实现的CharMatcher,以及如果获取CharMatcher,下面说一下,获取到了CharMatcher如何处理字符:
boolean matchesAnyOf(CharSequence sequence): 只要sequence中有任意字符能匹配Matcher,返回true
boolean matchesAllOf(CharSequence sequence): sequence中所有字符都能匹配Matcher,返回true
boolean matchesNoneOf(CharSequence sequence): sequence中所有字符都不能匹配Matcher,返回true
int indexIn(CharSequence sequence): 返回sequence中匹配到的第一个字符的坐标
int indexIn(CharSequence sequence, int start): 返回从start开始,在sequence中匹配到的第一个字符的坐标
int lastIndexIn(CharSequence sequence): 返回sequence中最后一次匹配到的字符的坐标
int countIn(CharSequence sequence): 返回sequence中匹配到的字符计数
String removeFrom(CharSequence sequence): 删除sequence中匹配到到的字符并返回
String retainFrom(CharSequence sequence): 保留sequence中匹配到的字符并返回
String replaceFrom(CharSequence sequence, char replacement): 替换sequence中匹配到的字符并返回
String trimFrom(CharSequence sequence): 删除首尾匹配到的字符并返回
String trimLeadingFrom(CharSequence sequence): 删除首部匹配到的字符
String trimTrailingFrom(CharSequence sequence): 删除尾部匹配到的字符
String collapseFrom(CharSequence sequence, char replacement): 将匹配到的组(连续匹配的字符)替换成replacement
String trimAndCollapseFrom(CharSequence sequence, char replacement): 先trim在replace
(6) 有兴趣的同学可以看一下CharMatcher的源码,可以发现CharMatcher对String的操作并没有什么高明之处,把String转化成char数组,然后根据需要做对应的操作,个人感觉CharMatcher比较好的地方在于,
作为一个工具类,提供了非常好用的api,使用内部类And和Or去实现多个CharMatcher实现与或操作,这种编码风格非常值得借鉴:
public static void main (String[] args) {
String str = "12312,agg ";
CharMatcher charMatcher1 = CharMatcher.is('1');
CharMatcher charMatcher2 = CharMatcher.is('2');
//两个CharMatcher或操作
CharMatcher charMatcher3 = charMatcher1.or(charMatcher2);
System.out.println(charMatcher3.retainFrom(str));
}
//charMatcher1.or的源码实现
public CharMatcher or(CharMatcher other) {
return new Or(this, checkNotNull(other));
}
//在CharMatcher内部定义了一个Or类,用来实现两个CharMatcher的Or操作,这是一种非常好的代码风格
private static class Or extends CharMatcher {
final CharMatcher first;
final CharMatcher second;
Or(CharMatcher a, CharMatcher b, String description) {
super(description);
first = checkNotNull(a);
second = checkNotNull(b);
}
Or(CharMatcher a, CharMatcher b) {
this(a, b, "CharMatcher.or(" + a + ", " + b + ")");
}
@GwtIncompatible("java.util.BitSet")
@Override
void setBits(BitSet table) {
first.setBits(table);
second.setBits(table);
}
@Override
public boolean matches(char c) {
return first.matches(c) || second.matches(c);
}
@Override
CharMatcher withToString(String description) {
return new Or(first, second, description);
}
}