如果我们交换字符串 X
中的两个不同位置的字母,使得它和字符串 Y
相等,那么称 X
和 Y
两个字符串相似。如果这两个字符串本身是相等的,那它们也是相似的。
例如,"tars"
和 "rats"
是相似的 (交换 0
与 2
的位置); "rats"
和 "arts"
也是相似的,但是 "star"
不与 "tars"
,"rats"
,或 "arts"
相似。
总之,它们通过相似性形成了两个关联组:{"tars", "rats", "arts"}
和 {"star"}
。注意,"tars"
和 "arts"
是在同一组中,即使它们并不相似。形式上,对每个组而言,要确定一个单词在组中,只需要这个词和该组中至少一个单词相似。
我们给出了一个不包含重复的字符串列表 A
。列表中的每个字符串都是 A
中其它所有字符串的一个字母异位词。请问 A
中有多少个相似字符串组?
示例:
输入:["tars","rats","arts","star"]
输出:2
提示:
A.length <= 2000
A[i].length <= 1000
A.length * A[i].length <= 20000
A
中的所有单词都只包含小写字母。A
中的所有单词都具有相同的长度,且是彼此的字母异位词。- 此问题的判断限制时间已经延长。
备注:
字母异位词[anagram],一种把某个字符串的字母的位置(顺序)加以改换所形成的新词。
大意:
我们判断是否相似,如果相似的话,就把他放到并查集里面,并查集对于检索分组情况相对比较快
每次放到并查集里面,肯定是有一个相似的,既然有一个相似的,总组数一定-1(初始的总组数为数组的大小)
class Solution {
//并查集
private int[] parent;
//分的组数
private int groupNum;
public int numSimilarGroups(String[] A) {
int n = A.length;
groupNum=n;
parent = new int[n];
//并查集第一步,给每一个数组都附上初始值,到时候只需要对比parent[i]==i即可了解是不是存在一个组
for (int i = 0; i < n; i++) {
parent[i] = i;
}
// 预处理输入
int len = A[0].length();
char[][] chars = new char[n][len];
//这里用char[][]是因为String相对来说会比较慢
for (int i = 0; i < n; i++) {
chars[i] = A[i].toCharArray();
}
// 枚举每一对单词,检查是否相似,若相似则合并
for (int i = 0; i < n - 1; i++) {
for (int j = i + 1; j < n; j++) {
if (similar(chars[i], chars[j])) {
//其实这里有一个小细节,这里是i永远小于j(并查集的关键)
union(i, j);
}
}
}
return groupNum;
}
// 用来判断一对单词是否相似
private boolean similar(char[] w1, char[] w2) {
int diff = 0;
int n = w1.length;
for (int i = 0; i < n; i++) {
//只要不相等得数量大于两个就说明不相似
if (w1[i] != w2[i] && ++diff > 2) {
return false;
}
}
return true;
}
//查找子集
private int find(int node) {
return parent[node] == node ? node : (parent[node] = find(parent[node]));
}
//并查集查找
//node1<<node2
private void union(int node1, int node2) {
int root1 = find(node1);
int root2 = find(node2);
if (root1 == root2) {
return;
}
//root1是相对root2来说比较小的(如果不理解,就自己调试看一下)
parent[root1] = root2;
//每当并查集连接一个组,总组数量-1
this.groupNum--;
}
}