387. 字符串中的第一个唯一字符
问题描述
给定一个字符串 s
,找到它的第一个不重复字符,并返回它的索引。如果不存在,则返回 -1
。
示例:
输入: s = "leetcode"
输出: 0
解释: 'l' 是第一个不重复字符,索引为 0
输入: s = "loveleetcode"
输出: 2
解释: 'v' 是第一个不重复字符,索引为 2
输入: s = "aabb"
输出: -1
解释: 所有字符都重复出现,没有不重复字符
算法思路
两次遍历法:
- 第一次遍历:统计每个字符的出现频次
- 第二次遍历:按顺序查找第一个频次为1的字符,返回其索引
- 如果没找到,返回-1
核心思想:
- 使用数组或哈希表记录字符频次
- 保持字符出现的原始顺序,在第二次遍历时找到第一个唯一字符
- 时间复杂度O(n),空间复杂度O(1)(固定大小数组)
代码实现
方法一:数组频次统计(推荐)
class Solution {
/**
* 找到字符串中第一个不重复字符的索引
*
* @param s 输入字符串(只包含小写字母)
* @return 第一个不重复字符的索引,不存在返回-1
* 时间复杂度: O(n)
* 空间复杂度: O(1) - 固定26大小数组
*/
public int firstUniqChar(String s) {
// 创建频次数组,假设只包含小写字母
int[] charCount = new int[26]; // a-z对应索引0-25
// 第一次遍历:统计每个字符的出现次数
for (char c : s.toCharArray()) {
charCount[c - 'a']++; // 字符转索引并增加计数
}
// 第二次遍历:找到第一个频次为1的字符
for (int i = 0; i < s.length(); i++) {
char c = s.charAt(i);
if (charCount[c - 'a'] == 1) {
return i; // 返回第一个唯一字符的索引
}
}
// 没有找到不重复字符
return -1;
}
}
方法二:HashMap频次统计(通用解法)
import java.util.*;
class Solution {
/**
* 使用HashMap的通用解法(适用于任意字符集)
*
* @param s 输入字符串
* @return 第一个不重复字符的索引,不存在返回-1
* 时间复杂度: O(n)
* 空间复杂度: O(k) - k为不同字符数
*/
public int firstUniqChar(String s) {
// 使用LinkedHashMap保持插入顺序(虽然这里不需要,因为第二次遍历用原字符串)
Map<Character, Integer> charCount = new HashMap<>();
// 第一次遍历:统计每个字符的出现次数
for (char c : s.toCharArray()) {
charCount.put(c, charCount.getOrDefault(c, 0) + 1);
}
// 第二次遍历:找到第一个频次为1的字符
for (int i = 0; i < s.length(); i++) {
char c = s.charAt(i);
if (charCount.get(c) == 1) {
return i;
}
}
return -1;
}
}
方法三:一次遍历 + 索引记录
class Solution {
/**
* 一次遍历:记录每个字符第一次出现的位置
*
* @param s 输入字符串
* @return 第一个不重复字符的索引,不存在返回-1
* 时间复杂度: O(n)
* 空间复杂度: O(1) - 固定大小数组
*/
public int firstUniqChar(String s) {
// freq[i] 存储字符 'a'+i 的出现次数
int[] freq = new int[26];
// firstIndex[i] 存储字符 'a'+i 第一次出现的索引
int[] firstIndex = new int[26];
// 初始化firstIndex为-1
Arrays.fill(firstIndex, -1);
// 一次遍历:统计频次并记录第一次出现位置
for (int i = 0; i < s.length(); i++) {
char c = s.charAt(i);
int index = c - 'a';
freq[index]++;
if (firstIndex[index] == -1) {
firstIndex[index] = i; // 只记录第一次出现的位置
}
}
// 查找最小索引的唯一字符
int minIndex = s.length(); // 初始化为字符串长度(最大可能值+1)
for (int i = 0; i < 26; i++) {
if (freq[i] == 1 && firstIndex[i] != -1) {
minIndex = Math.min(minIndex, firstIndex[i]);
}
}
// 如果minIndex未更新,说明没有唯一字符
return minIndex == s.length() ? -1 : minIndex;
}
}
算法分析
- 时间复杂度:
- 所有方法:O(N),N为字符串长度
- 方法一和二:两次遍历,2N = O(N)
- 方法三:一次遍历+N(查找最小索引),N+26 = O(N)
- 空间复杂度:
- 方法一:O(1),固定26大小数组
- 方法二:O(K),K为不同字符数
- 方法三:O(1),两个固定26大小数组
- 方法对比:
- 方法一:最简洁高效,推荐使用
- 方法二:通用性强,适用于任意字符集
- 方法三:理论上一次遍历,但实际性能提升有限
算法过程
输入:s = "loveleetcode"
执行过程(方法一):
- 统计频次:
- l: 2, o: 2, v: 1, e: 4, t: 1, c: 1, d: 1
- charCount = [0,0,1,1,4,0,0,0,0,0,0,2,0,0,2,0,0,0,0,1,0,1,0,0,0,0]
- (索引对应:c:2, d:3, e:4, l:11, o:14, t:19, v:21)
- 第二次遍历:
- i=0, ‘l’ → charCount[11]=2 ≠ 1
- i=1, ‘o’ → charCount[14]=2 ≠ 1
- i=2, ‘v’ → charCount[21]=1 → 返回2
测试用例
public static void main(String[] args) {
Solution solution = new Solution();
// 测试用例1:标准示例
System.out.println("Test 1: " + solution.firstUniqChar("leetcode"));
// 输出: 0
// 测试用例2:中间位置
System.out.println("Test 2: " + solution.firstUniqChar("loveleetcode"));
// 输出: 2
// 测试用例3:无唯一字符
System.out.println("Test 3: " + solution.firstUniqChar("aabb"));
// 输出: -1
// 测试用例4:单字符
System.out.println("Test 4: " + solution.firstUniqChar("a"));
// 输出: 0
// 测试用例5:所有字符唯一
System.out.println("Test 5: " + solution.firstUniqChar("abcdef"));
// 输出: 0
// 测试用例6:最后一个字符唯一
System.out.println("Test 6: " + solution.firstUniqChar("aabbccde"));
// 输出: 6('d'的索引)
// 测试用例7:空字符串
System.out.println("Test 7: " + solution.firstUniqChar(""));
// 输出: -1
// 测试用例8:长字符串
System.out.println("Test 8: " + solution.firstUniqChar("thequickbrownfoxjumpsoverthelazydog"));
// 输出: 3('q'的索引)
// 测试用例9:重复字符但有唯一字符
System.out.println("Test 9: " + solution.firstUniqChar("aaabbbcccdef"));
// 输出: 9('d'的索引)
// 测试用例10:只有唯一字符在末尾
System.out.println("Test 10: " + solution.firstUniqChar("aabbccd"));
// 输出: 6
}
关键点
-
唯一字符定义:
- 在整个字符串中只出现一次的字符
- 不是局部唯一,而是全局唯一
-
第一个的含义:
- 按字符串从左到右的顺序
- 即使后面有更"小"的字符,也要返回最左边的唯一字符
-
频次统计:
- 必须先完整统计所有字符频次
- 不能在第一次遍历时就判断,因为后面可能还会出现相同字符
-
字符集假设:
- 题目说明"字符串只包含小写字母",所以26大小数组足够
- 如果字符集更大,可以扩展数组大小或使用HashMap
常见问题
-
为什么不能在第一次遍历时就返回结果?
- 因为在遍历过程中无法知道后面是否还会出现相同字符。例如在"abba"中,当遍历到第一个’a’时,不能确定它是否唯一,因为后面可能还有’a’。
-
方法三相比方法一有什么优势?
- 理论上减少了一次字符串遍历,但增加了查找最小索引的步骤
- 实际性能差异很小,方法一更简洁易懂
-
如果要求返回字符而不是索引怎么办?
- 只需在找到索引后返回
s.charAt(index)
,如果没找到返回特殊字符或null
- 只需在找到索引后返回
-
如何处理大写字母或特殊字符?
- 可以使用大小为128的数组(ASCII字符集)
- 或使用HashMap支持任意字符集
- 修改索引计算方式:对于ASCII,直接使用
c
作为索引(不需要减’a’)