/* 定义:开头和结尾都是元音字母(aeiouAEIOU)的字符串为 元音字符串 ,其中混杂的非元音字母数量为其 瑕疵度 。比如: "a" 、 "aa"是元音字符串,其瑕疵度都为0 "aiur"不是元音字符串(结尾不是元音字符) "abira"是元音字符串,其瑕疵度为2 给定一个字符串str和瑕疵度flaw,请找出瑕疵度等于 flaw 的最长元音字符子串,并输出其长度,如果找不到满足条件的元音字符子串,输出0。 子串:字符串中任意个连续的字符组成的子序列称为该字符串的子串。 输入 首行输入一个整数 flaw,取值范围 [0, 65535]。 接下来一行是字符串str,仅由字符a-z和A-Z组成,字符串长度 (0, 65535]。 输出 输出为一个整数,代表满足条件的元音字符子串的长度。 样例1 复制输入: 0 "asdbuiodevauufgh" 复制输出: 3 解释: 满足条件的最长元音字符子串有两个,分别为uio和auu,长度为3。 样例2 复制输入: 2 "aeueo" 复制输出: 0 解释: 没有满足条件的元音字符子串,输出0 */ #include <string> using namespace std; class Solution { public: // 滑动窗口来做 int GetLongestFlawedVowelSubstrLen(int flaw, const string& str) { char begin = ''; char end = ''; int maxLenth = 0; int curDefectLenth = 0; string curStr = ""; for (char c : str) { // 数瑕疵度,如果到了,更新下maxLenth if (curDefectLenth == flaw) { if (curStr.lenth() > maxLenth) { maxLenth = curStr.lenth(); } } // 如果是元音 if (mVowel.find(c) != mVowel.end() && !curDefectLenth.empty()) { } else { } } return maxLenth; } private: unordered_set<char> mVowel = { 'a', 'e', 'i', 'o', 'u', 'A', 'E', 'I', 'O', 'U' } };
时间: 2025-07-24 08:19:42 浏览: 4
<think>题目要求:找出一个子串,满足开头和结尾都是元音字母,且子串中非元音字母的数量(瑕疵度)恰好等于给定的flaw。输出满足条件的最长子串的长度,找不到则输出0。
注意:子串必须是连续的,且开头和结尾都是元音字母,中间的非元音字母数量为flaw。
思路:
1. 我们要求子串的开头和结尾都是元音字母,因此我们可以考虑先找到所有元音字母的位置。
2. 然后,我们考虑使用双指针(或滑动窗口)来遍历这些元音字母之间的子串。但是注意,子串必须由两个元音字母作为边界,中间的非元音字母数量等于flaw。
3. 实际上,我们可以先记录整个字符串中每个位置是否是元音,然后计算非元音字母的数量的前缀和,这样可以在O(1)时间内得到任意子串中非元音字母的数量。
具体步骤:
步骤1:预处理前缀和数组
设一个数组vowel,标记每个位置是否是元音字母(是则为0,不是则为1)。然后计算前缀和数组prefix,其中prefix[i]表示从0到i-1的非元音字母个数(即瑕疵度)。
注意:prefix[0]=0,prefix[i] = prefix[i-1] + (如果str[i-1]不是元音则1,否则0)。但这里我们通常用prefix[i]表示前i个字符的非元音个数,那么区间[l, r]的非元音个数为:prefix[r+1]-prefix[l]。
步骤2:我们只考虑元音字母作为开头和结尾。因此,我们可以用两个指针i和j,分别指向元音字母的位置,然后计算这两个位置之间的子串(包括这两个元音字母)的非元音字母数量。注意,这个子串的开头和结尾都是元音,所以中间的非元音字母数量就是瑕疵度。
但是,如果我们遍历所有元音字母对,那么复杂度是O(n^2),而字符串长度最大为65535,最坏情况下元音字母很多,这样会超时。
因此,我们需要优化。
优化思路:使用双指针(滑动窗口)来维护一个区间,使得区间内非元音字母的数量(瑕疵度)不超过flaw,同时记录满足瑕疵度等于flaw且首尾都是元音的最长长度。
然而,由于子串必须由元音字母开头和结尾,我们可以这样:
1. 将整个字符串中所有元音字母的位置记录下来,存到数组vowels中。
2. 然后,我们遍历这个数组,对于每个元音位置作为左边界,我们试图找到一个右边界(也是元音),使得这两个元音之间的非元音字母数量等于flaw。注意,这个非元音字母的数量就是两个元音字母之间(不包括左边界元音但包括右边界元音?)不对,实际上,子串是从左边界元音到右边界元音(包含这两个元音),所以中间的非元音字母数量就是这两个元音之间的所有非元音字母(包括中间的非元音字母,但不包括这两个元音字母?不对,包括这两个元音字母吗?)注意:题目中的瑕疵度是指混杂的非元音字母数量,而元音字母本身不算瑕疵。所以,子串中非元音字母的数量就是瑕疵度。
因此,我们要求的是:从vowels[i]到vowels[j]这个子串中,非元音字母的数量等于flaw。而这个数量可以通过前缀和计算:prefix[vowels[j]+1] - prefix[vowels[i]],但是注意,这个计算包括了两个端点?实际上,我们标记了每个位置的非元音情况,所以这个区间内的非元音数量就是前缀和相减。
但是,由于两个端点都是元音字母,所以它们对应的vowel数组值为0(即非元音标记为1,元音为0?)不对,我们定义的前缀和数组是基于整个字符串的,所以区间[l, r]的非元音字母数量为:prefix[r+1]-prefix[l](因为前缀和数组是前i个的和,所以从l到r的区间和就是prefix[r+1]-prefix[l])。而在这个区间内,元音字母不贡献瑕疵度,非元音字母贡献1。
因此,对于两个元音位置i_index和j_index(在字符串中的位置),子串[i_index, j_index]的非元音字母数量为:prefix[j_index+1]-prefix[i_index](注意:这里i_index和j_index都是元音,所以它们本身在前缀和数组中的贡献为0,因为我们在计算前缀和时,元音位置我们加了0,非元音加了1)。
那么,问题转化为:在元音位置数组vowels中,对于每个左端点vowels[i],我们需要找到右端点vowels[j](j>i),使得prefix[vowels[j]+1]-prefix[vowels[i]]等于flaw,并且我们希望子串长度尽可能长(即vowels[j]-vowels[i]+1)。
注意:瑕疵度等于flaw,而flaw是给定的整数。
但是,直接遍历每个左端点,然后遍历右端点,复杂度为O(n^2),不可取。
优化:我们可以固定左端点,然后利用前缀和数组的单调性(因为非负),使用二分查找或双指针来快速找到右端点。
具体:因为前缀和数组是递增的(非负),所以对于每个左端点vowels[i],我们要求:
prefix[vowels[j]+1] = prefix[vowels[i]] + flaw
注意:这里vowels[j]是元音位置,且j>i。但是,我们是在元音位置数组上操作,所以我们需要知道在vowels数组中,从i+1开始,是否存在一个元音位置j,使得prefix[vowels[j]+1]等于某个值。
但是,由于vowels数组存储的是元音在原始字符串中的位置,所以vowels[j]+1可能不是元音位置,所以我们需要对每个元音位置,我们只关心它自己的位置。
因此,我们可以这样:
构建一个新的数组:对于每个元音位置pos,我们记录一个值:prefix[pos+1](因为子串以pos结尾,那么整个子串的非元音数量为prefix[pos+1]-prefix[begin_pos])。
然后,对于每个左端点vowels[i],我们要求:在vowels数组中,从i+1开始,找到一个j,使得:
prefix[vowels[j]+1] = prefix[vowels[i]] + flaw
这样,我们可以用一个哈希表来存储每个前缀和值对应的元音位置(注意,同一个前缀和可能对应多个元音位置,我们想要的是最远的那个?但是注意,我们希望子串尽可能长,所以对于相同的左端点,我们希望j尽可能大。但是,由于前缀和是递增的,而元音位置也是递增的(因为vowels数组是递增的),所以我们可以记录每个前缀和值对应的最大元音位置(因为越往后元音位置越大,所以对于同一个前缀和值,后面出现的元音位置更大,所以我们可以记录每个前缀和值最后出现的元音位置)。
但是,注意:我们要求j>i,所以我们需要在遍历左端点时,动态地查看后面的元音位置对应的前缀和值。我们可以先构建一个哈希表,记录每个前缀和值对应的最大元音位置(在vowels数组中,我们按顺序遍历,所以同一个前缀和值,后面出现的元音位置更大,因此我们可以在构建vowels数组的同时,用哈希表记录每个前缀和值对应的最大元音位置,但是注意,我们只记录元音位置对应的prefix[pos+1]的值)。
但是,这里有一个问题:同一个前缀和值可能出现在多个元音位置,而且我们希望对于左端点vowels[i],在它之后(即位置大于vowels[i])的元音位置中,是否存在一个位置j,使得prefix[vowels[j]+1]等于prefix[vowels[i]]+flaw。
因此,我们可以:
1. 先遍历整个字符串,计算前缀和数组prefix(长度为n+1)。
2. 记录所有元音字母的位置,得到数组vowels(按顺序存储)。
3. 然后,我们构建一个哈希表map,键为某个前缀和值,值为该前缀和值对应的最大元音位置(即字符串中的位置,注意不是vowels数组的下标)。但是,注意:我们只关心元音位置,所以我们在遍历元音位置时,将每个元音位置pos对应的prefix[pos+1]作为键,pos作为值,并且由于vowels数组是递增的,所以后面的pos会覆盖前面的,这样每个键对应的就是最大的那个pos。
4. 然后,我们遍历vowels数组(作为左端点):
对于每个左端点pos_i = vowels[i],计算目标值:target = prefix[pos_i] + flaw。
在哈希表中查找是否存在键target,如果存在,则得到一个候选长度:map[target] - pos_i + 1(因为子串是从pos_i到map[target])。
然后更新最大长度。
但是,注意:我们要求这个右端点的元音位置必须大于左端点的位置(即map[target] > pos_i)。由于我们在构建哈希表时,是从小到大遍历元音位置,所以哈希表中存储的某个前缀和值对应的元音位置是最大的那个,而且这个位置一定大于pos_i(因为pos_i是之前的元音位置,而哈希表中存储的是后面出现的元音位置)?不对,因为哈希表是最后构建的,它存储的是所有元音位置中最后出现的位置,所以这个位置一定在pos_i之后吗?不一定,因为pos_i可能出现在后面,但我们在遍历左端点时,左端点也是从小到大,所以对于左端点pos_i,哈希表中存储的元音位置都是>=pos_i的?不对,哈希表存储的是整个字符串中某个前缀和值对应的最大元音位置,这个位置可能小于pos_i吗?不可能,因为vowels数组是递增的,我们构建哈希表时,遍历元音位置是从小到大,所以最后存储的是最大的那个位置,所以这个位置一定大于等于当前的pos_i?不一定,因为前缀和值相同的情况,后面的元音位置会覆盖前面的,所以哈希表中存储的是整个字符串中该前缀和值对应的最后一个元音位置。而我们的左端点pos_i是之前的位置,所以这个位置一定大于等于pos_i?不一定,因为左端点pos_i可能比这个位置大?不对,因为vowels数组是递增的,所以每个元音位置都是递增的。我们在构建哈希表时,遍历vowels数组(从小到大),所以对于同一个前缀和值,后面遇到的元音位置更大,所以哈希表中存储的就是最大的元音位置。然后我们遍历左端点(也是从小到大),所以对于左端点pos_i,哈希表中存储的元音位置(即map[target])一定大于等于pos_i?不一定,因为target可能对应一个更小的元音位置?但是注意,我们要求的是在右端点的元音位置必须大于左端点(即>pos_i),所以如果map[target]<=pos_i,那么这个右端点就不满足。
因此,我们需要保证map[target] > pos_i。但是,由于哈希表存储的是整个字符串中该前缀和值对应的最大元音位置,如果这个位置在pos_i之前,那么就不满足。所以,我们如何保证只考虑pos_i之后的元音位置?
解决方案:我们可以在遍历左端点之前,先构建好整个哈希表(即所有元音位置对应的prefix[pos+1]和pos的映射,且同一个前缀和值我们保留最大的pos)。然后,在遍历左端点时,我们要求map[target] > pos_i,如果满足,则更新答案。
但是,这样会引入一个问题:可能这个target对应的元音位置在pos_i之前,但我们无法知道。所以我们需要避免这种情况。
另一种思路:我们倒序遍历左端点(即从大的元音位置到小的元音位置),然后构建哈希表时只考虑左端点之后的元音位置。这样,我们可以先初始化一个空的哈希表,然后从后往前遍历vowels数组:
对于当前左端点vowels[i],我们查询哈希表中是否存在键为target=prefix[vowels[i]]+flaw的项,如果存在,则用哈希表中存储的元音位置(这个位置一定在vowels[i]之后,因为我们在遍历过程中,哈希表存储的都是后面的元音位置)减去vowels[i]再加1,得到长度,更新答案。
然后,将当前元音位置vowels[i]对应的prefix[vowels[i]+1]加入到哈希表中(如果哈希表中已经存在这个键,我们不需要更新,因为我们要的是后面的元音位置,而我们是倒序遍历,所以先处理的元音位置更大?不对,倒序遍历时,先处理的是后面的元音位置,然后处理前面的。所以当我们处理到vowels[i]时,哈希表中存储的是vowels[i]之后的所有元音位置对应的prefix[pos+1]和位置。但是,同一个键,我们只需要存储一个位置,我们希望这个位置是尽可能小的(因为子串长度=右端点位置-左端点位置+1,在左端点固定的情况下,右端点位置越大,子串越长。所以,我们希望在哈希表中存储的是同一个前缀和值对应的最大元音位置(即最靠后的位置))。但是,由于我们是倒序遍历,当我们处理到vowels[i]时,我们还没有处理vowels[i]前面的元音位置,所以哈希表中存储的都是vowels[i]后面的元音位置。那么,对于同一个键,我们只需要保留第一次遇到的那个位置(即倒序遍历时,先遇到的是后面的元音位置,然后遇到前面的,所以如果遇到相同的键,后面的位置更大,所以我们应该保留最大的位置?不对,倒序遍历时,先处理的是最后一个元音位置,然后倒数第二个,所以当我们处理vowels[i]时,哈希表中已经存储了vowels[i]之后的所有元音位置(即从i+1到末尾)对应的prefix[pos+1]和位置。对于同一个键,我们只需要存储最大的位置(因为最大的位置在倒序遍历时最先被处理,所以当遇到相同的键时,我们可以保留第一次存储的那个位置(即最大的位置)),但是这样会覆盖较小的位置,而较小的位置在后面,所以我们需要存储最大的位置。
因此,我们可以这样:倒序遍历vowels数组,对于每个位置vowels[i]:
计算target = prefix[vowels[i]] + flaw;
如果哈希表中存在target,则设右端点位置为map[target](这个位置一定在vowels[i]之后),那么子串长度为map[target]-vowels[i]+1,更新最大长度。
然后,将当前元音位置vowels[i]对应的值:prefix[vowels[i]+1] 加入哈希表。但是,如果哈希表中已经存在这个键,我们比较当前的位置vowels[i]和哈希表中存储的位置,哪个大?由于我们是倒序遍历,当前的位置vowels[i]比后面已经处理的位置都要小(因为vowels数组递增,所以倒序遍历就是从大到小),所以如果哈希表中已经存在这个键,那么之前存储的位置一定比当前的位置大,所以不需要更新(因为我们希望同一个键,存储最大的位置,这样当它作为右端点时,子串长度更长?不对,这里存储的是作为右端点的候选位置。实际上,当同一个键出现多次时,我们应该存储最大的那个位置,因为对于同一个键,位置越大,当它作为右端点时,与左端点形成的子串越长(因为左端点是固定的,右端点越大,子串越长)?不对,左端点会变化。但是,在后续处理更左的左端点时,我们希望同一个键对应的位置尽可能大,这样形成的子串更长。所以,我们存储最大的位置。
所以,在倒序遍历时,我们这样更新哈希表:
当我们处理vowels[i]时,我们得到key = prefix[vowels[i]+1]。
如果哈希表中不存在key,则插入(key, vowels[i])。
如果存在,则比较vowels[i]和哈希表中存储的位置,如果vowels[i]大于哈希表中存储的位置,则更新(但实际上,由于vowels[i]在数组中是从大到小遍历的,所以先处理的位置大,后面处理的位置小,所以如果已经存在,那么之前存储的位置一定大于当前的vowels[i],所以不需要更新)。因此,我们可以不更新,因为我们要的是最大的位置。
但是,我们也可以更新为更小的位置?为什么?因为对于同一个键,我们存储的是最大的位置,这样在后续处理更左的左端点时,用这个最大的位置形成的子串更长。所以,我们只需要存储每个键的最大位置,那么当我们第一次遇到这个键(在倒序遍历时,就是最大的位置)时,我们就存储它,后面遇到相同的键,我们不需要更新(因为位置更小,对后续的左端点没有好处)。
因此,我们可以这样:在倒序遍历时,如果遇到一个键,我们只存储第一次遇到的位置(即最大的位置),后面遇到相同的键就跳过。或者,我们存储每个键的最大位置,那么在倒序遍历时,我们只需要存储每个键的第一次出现(即最大的位置)即可。因为后面再出现相同键的位置都更小,所以不需要。
但是,这样会漏掉吗?不会,因为对于同一个键,我们只需要最大的位置。
步骤:
1. 预处理前缀和数组prefix,长度为n+1。
2. 收集所有元音字母的位置,得到数组vowels(按顺序存储)。
3. 初始化一个空哈希表map(key: 前缀和值, value: 该前缀和值对应的最大元音位置(即字符串中的位置))。
4. 初始化maxLen=0。
5. 倒序遍历vowels数组(从最后一个元音位置开始往前):
pos = vowels[i]
target = prefix[pos] + flaw // 注意:这里用prefix[pos]而不是prefix[pos+1],因为子串从pos开始,到某个位置j结束,那么非元音数量为prefix[j+1]-prefix[pos](因为prefix[j+1]表示前j+1个字符的非元音数量,而prefix[pos]表示前pos个字符的非元音数量,相减就是pos到j的非元音数量,包括j但不包括pos?不对,前缀和数组的定义:prefix[i]表示前i个字符的非元音数量,即下标0到i-1。所以,子串从下标pos到j(包含pos和j)的非元音数量为:prefix[j+1]-prefix[pos](因为子串包含的字符是从下标pos到下标j,共j-pos+1个字符,这些字符对应的是原字符串的区间[pos, j])。而prefix[j+1]表示前j+1个(下标0~j),prefix[pos]表示前pos个(下标0~pos-1),相减就是下标pos到j的非元音数量。所以,瑕疵度=prefix[j+1]-prefix[pos]。
因此,我们要求:prefix[j+1]-prefix[pos] = flaw => prefix[j+1] = prefix[pos]+flaw。
所以,目标值target = prefix[pos] + flaw。
现在,我们在哈希表中查找是否存在键target,如果存在,则设j_pos = map[target](这个位置就是满足条件的右端点的位置,注意j_pos>=pos,因为我们在倒序遍历,哈希表中存储的都是pos之后的位置),那么子串长度= j_pos - pos + 1,更新maxLen = max(maxLen, j_pos-pos+1)。
然后,将当前元音位置pos对应的值:key = prefix[pos+1] 加入哈希表。注意,这里为什么是prefix[pos+1]?因为当前元音位置pos作为右端点时,它对应的前缀和值应该是prefix[pos+1](因为子串如果以pos结尾,那么整个子串的非元音数量= prefix[pos+1]-prefix[begin_pos])。所以,我们存储的是:当这个元音位置作为右端点时,它对应的前缀和值(即prefix[pos+1])和它的位置(pos)。这样,当后面的左端点(在pos左边的元音)需要匹配时,就可以用这个值。
但是,注意:我们存储这个值是为了让更左的左端点使用。而且,我们只存储每个键的最大位置(即最靠后的位置),这样形成的子串更长。
那么,如何存储?我们检查当前key=prefix[pos+1]是否已经在哈希表中:
如果不在,则插入map[key]=pos。
如果已经存在,则比较当前的pos和哈希表中存储的位置,如果当前pos大于哈希表中的位置,则更新(因为我们要存储最大的位置);否则,不更新(因为当前pos更小,对后续的左端点没有好处,因为左端点越左,使用更大的右端点形成的子串越长)。但是,由于我们是倒序遍历,所以当前遇到的pos一定比哈希表中已有的位置小(因为倒序遍历,先处理的是后面的位置,然后处理前面的位置),所以如果已经存在,那么哈希表中存储的位置一定大于当前pos,因此不需要更新。
6. 遍历结束后,maxLen就是满足条件的最长子串长度。如果没有找到,则maxLen为0。
但是,注意:有可能存在一个子串,它只包含一个元音字母(即子串长度为1),那么此时瑕疵度=0(因为该元音字母本身,中间没有其他字符),所以如果flaw=0,那么我们可以取单个元音字母作为子串。但是,根据题目,单个元音字母(如"a")是元音字符串,瑕疵度为0。所以,我们的方法是否包含这种情况?
在我们的方法中,当左端点和右端点是同一个元音字母时,子串长度为1,非元音数量=prefix[pos+1]-prefix[pos] = 0。所以,如果flaw=0,那么这种情况会被考虑吗?
注意,在倒序遍历时,对于当前元音位置pos,我们首先在哈希表中查找target=prefix[pos]+flaw(即prefix[pos])是否存在。但是,在加入当前元音位置之前,哈希表中存储的是后面的元音位置,而当前元音位置还没有加入。所以,对于单个元音字母,我们不会在同一个位置匹配(因为我们要求右端点在左端点之后,而同一个位置不能作为右端点)。所以,我们需要考虑单个元音字母的情况吗?实际上,单个元音字母也是子串,所以我们需要考虑。
如何考虑?我们可以在遍历过程中,当flaw=0时,我们也可以将单个元音字母作为候选。但是,在我们的方法中,单个元音字母(即左右端点相同)并没有被考虑,因为我们要求右端点在左端点之后(而同一个位置不能作为右端点)。所以,我们需要单独处理吗?
实际上,我们可以这样:在初始化哈希表时,我们可以先加入一个虚拟的元音位置(比如在最后加入一个无穷远的位置?)或者,我们在倒序遍历时,对于每个元音位置,我们不仅要检查它作为左端点,还要考虑它自身作为右端点的情况?但是,单个元音字母的情况,实际上就是瑕疵度0,且长度1。所以,我们可以这样处理:在遍历过程中,当我们处理当前元音位置pos时,我们检查瑕疵度0的情况:即如果flaw==0,那么单个元音字母也是合法的,所以我们可以将maxLen至少更新为1(如果有元音字母的话)。但是,注意,题目要求的是最长,所以如果后面有更长的,就会被覆盖。
但是,我们的方法在flaw=0时,会匹配到这样的子串:两个相同的元音字母(即左端点和右端点是同一个元音字母)?不会,因为我们在哈希表中查找的时候,要求右端点的位置>=pos+1(因为同一个位置不能作为右端点,而且我们加入哈希表是在查找之后)。所以,单个元音字母不会被考虑。
因此,我们需要单独处理单个元音字母的情况:如果flaw=0,那么每个元音字母本身就是一个合法子串,长度为1。所以,我们可以在最后,如果maxLen为0且flaw=0,那么我们就检查是否存在元音字母,如果存在,则maxLen=1。但是,注意,有可能存在多个连续的元音字母,那么它们形成的子串长度可能大于1(比如"ae",如果flaw=0,那么"a"和"e"都是,但"ae"也是:因为开头'a'结尾'e'都是元音,中间没有非元音?不对,中间没有非元音,所以瑕疵度为0。所以,连续元音字母组成的子串,只要首尾是元音(中间都是元音),那么瑕疵度就是0。所以,这种情况我们也要考虑,而且长度大于1。
但是,我们的方法在flaw=0时,会匹配到连续元音字母组成的子串吗?会。因为连续元音字母:比如字符串"ae",元音位置0和1。前缀和数组:假设字符串"ae",则:
prefix[0]=0
prefix[1]=0(因为位置0是元音,所以前1个字符的非元音数量为0)
prefix[2]=0(前2个字符都是元音,所以非元音数量为0)
那么,对于左端点0(即第一个元音):
target = prefix[0] + 0 = 0
然后我们在哈希表中查找0,此时哈希表中存储了位置1对应的prefix[1+1]=prefix[2]=0(因为我们在倒序遍历,先处理位置1,再处理位置0。处理位置1时,将key=prefix[2]=0,位置1加入哈希表)。然后处理位置0时,查找0,找到位置1,那么子串长度=1-0+1=2。
所以,连续元音字母会被考虑,并且长度大于1。
那么,单个元音字母呢?比如字符串"ab",元音位置0。我们在处理位置0时:
target = prefix[0]+0=0
哈希表中是否有0?在处理位置0之前,我们先处理了哪些位置?在这个例子中,只有一个元音位置0,所以倒序遍历时,先处理位置0(最后一个元音)。此时,哈希表为空(因为还没有加入任何后面的元音位置),所以找不到。然后,我们将当前元音位置0对应的key=prefix[0+1]=prefix[1]加入哈希表。那么,prefix[1]是多少?在字符串"ab"中,位置0是元音,位置1是'b'(非元音),所以prefix[1]=0(前1个字符的非元音数量:0个?不对,前1个字符是'a',是元音,所以非元音数量0,所以prefix[1]=0;然后第二个字符'b'是非元音,所以prefix[2]=1)。所以,当前加入的key=prefix[1]=0,位置0。
那么,这个位置0加入后,对于更左的元音位置(没有更左的了),所以单个元音字母不会被匹配到。
因此,我们需要在最后,如果maxLen为0且flaw=0,那么我们就检查是否存在元音字母,如果存在,则maxLen=1。但是,注意,有可能存在多个元音字母,但都不连续?那么单个元音字母就是合法子串。所以,我们可以在最后添加:
if (maxLen == 0 && flaw == 0) {
// 只要存在一个元音字母,那么就可以取长度为1的子串
if (!vowels.empty()) {
maxLen = 1;
}
}
但是,这样对吗?考虑样例2:输入flaw=2,字符串"aeueo",输出0。所以,如果flaw不为0,那么单个元音字母不满足(因为瑕疵度0不等于2)。所以,我们只需要在flaw=0且没有找到更长的子串时,使用单个元音字母。
但是,还有一种情况:连续元音字母组成的子串(长度>=2)的瑕疵度也是0(因为中间没有非元音字母),所以我们在flaw=0时,会找到这些子串(长度>=2),所以maxLen至少为2,因此不会进入这个if条件。只有整个字符串中元音字母都不连续(即每个元音字母都是孤立的),那么maxLen=0,然后我们设置maxLen=1。
所以,这个处理是合理的。
但是,注意:题目要求最长,所以如果存在长度为2的连续元音子串,那么maxLen至少为2,不会设置为1。
步骤总结:
1. 处理特殊情况:如果字符串为空,返回0。
2. 定义元音集合(10个元音字母)。
3. 计算前缀和数组prefix,长度为n+1,其中:
prefix[0]=0
for i in range(1, n+1):
if str[i-1]是元音: prefix[i] = prefix[i-1]
else: prefix[i] = prefix[i-1]+1
4. 遍历字符串,记录所有元音字母的位置(在字符串中的下标),存入vowels数组。
5. 如果flaw==0且vowels为空,则直接返回0(因为一个元音字母都没有)。
6. 初始化哈希表map(key: int, value: int,存储前缀和值->最大的元音位置(字符串中的位置))。
7. 初始化maxLen=0。
8. 倒序遍历vowels数组(下标从vowels.size()-1到0):
pos = vowels[i]
target = prefix[pos] + flaw // 注意:这里用prefix[pos],因为子串从pos开始,到j结束,非元音数量=prefix[j+1]-prefix[pos]
if 哈希表中存在target:
j_pos = map[target] // 这个j_pos是之前存储的某个元音位置(在pos之后)
length = j_pos - pos + 1
if (length > maxLen) maxLen = length
// 然后,将当前元音位置pos对应的key=prefix[pos+1]加入哈希表
key = prefix[pos+1]
// 如果哈希表中没有key,则插入map[key]=pos
// 如果已经有key,则比较当前pos和哈希表中存储的位置,如果当前pos更大,则更新。但由于倒序遍历,当前pos一定小于哈希表中已有的位置(因为倒序遍历先处理后面的位置),所以不更新。
// 所以,我们只插入新的键值对,如果已经存在则不更新(因为已有的位置更大)。
// 但是,为了确保哈希表中存储的是最大的位置,我们可以在插入时,只保留最大的位置。所以,如果当前pos大于哈希表中已有的位置,才更新。但是,由于倒序遍历,当前pos一定小于之前存储的位置(因为之前存储的是后面的位置),所以不需要更新。因此,我们只插入新的键(即当哈希表中不存在key时才插入)。
// 但是,这样会漏掉一些情况吗?比如,同一个键,可能后面有多个元音位置,但最大的位置我们已经存储了,所以不需要存储更小的位置。所以,如果哈希表中已经存在key,我们就不存储当前这个更小的位置。因为对于后续更左的左端点,我们希望用更大的右端点位置,这样形成的子串更长。
所以,我们只插入新的键值对:如果key不存在,则插入;如果存在,跳过。
9. 如果maxLen还是0,并且flaw==0,则说明存在元音字母,但是都是孤立的(没有连续的两个元音字母形成子串),那么maxLen=1(因为单个元音字母是合法的)。
10. 返回maxLen。
但是,注意:有可能存在多个相同的键,而不同的位置,我们只存储最大的位置(因为倒序遍历时,最大的位置最先被处理,所以插入后,后面相同的键就不插入了)。这样,对于同一个键,我们存储的是最后出现的那个元音位置(即最大的位置),这样对于左端点来说,形成的子串最长。
但是,我们是否可能漏掉更长的子串?不会,因为对于同一个键,我们只需要最大的位置。
但是,考虑:同一个键,可能有多个位置,而最大的位置一定形成最长的子串(因为左端点固定,右端点越大,子串越长)。
因此,代码实现如下:
注意:前缀和数组的索引范围是0~n,其中n是字符串长度。
边界情况:字符串长度为0。
我们用一个例子验证:样例1
输入:flaw=0, str="asdbuiodevauufgh"
输出:3("uio"和"auu")
元音位置:我们只考虑小写?题目中大小写都考虑。所以元音字母包括:a,u,i,o,d,e,v,a,u,u。注意,题目中的字符串是"asdbuiodevauufgh",元音字母位置:
0: 'a' -> 元音
3: 'u' -> 元音
4: 'i' -> 元音
5: 'o' -> 元音
8: 'e' -> 元音
9: 'v' -> 非元音?注意,v不是元音
10: 'a' -> 元音
11: 'u' -> 元音
12: 'u' -> 元音
所以元音位置:0,3,4,5,8,10,11,12。
前缀和数组(非元音数量):
0: prefix[0]=0
1: 前1个字符:'a'(元音)-> prefix[1]=0
2: 前2个字符:'a','s'(s非元音)-> prefix[2]=1
3: 前3个字符:'a','s','d'(d非元音)-> prefix[3]=2
4: 前4个字符:'a','s','d','b'(b非元音)-> prefix[4]=3
5: 前5个字符:加上'u'(元音)-> prefix[5]=3
6: 加上'i'(元音)-> prefix[6]=3
7: 加上'o'(元音)-> prefix[7]=3
8: 加上'd'(非元音)-> prefix[8]=4
9: 加上'e'(元音)-> prefix[9]=4
10: 加上'v'(非元音)-> prefix[10]=5
11: 加上'a'(元音)-> prefix[11]=5
12: 加上'u'(元音)-> prefix[12]=5
13: 加上'u'(元音)-> prefix[13]=5
14: 加上'f'(非元音)-> prefix[14]=6
15: 加上'g'(非元音)-> prefix[15]=7
16: 加上'h'(非元音)-> prefix[16]=8
现在,我们要找瑕疵度0的子串,即非元音数量=0,所以flaw=0。
倒序遍历元音位置:12,11,10,8,5,4,3,0
i=7(位置0):target=prefix[0]+0=0,哈希表中有0吗?目前没有(因为后面位置加入的key分别是:位置12: prefix[13]=5, 位置11: prefix[12]=5, 位置10: prefix[11]=5, 位置8: prefix[9]=4, 位置5: prefix[6]=3, 位置4: prefix[5]=3, 位置3: prefix[4]=3,然后位置0: prefix[1]=0。注意,在位置0加入之前,哈希表中没有0。所以,然后加入key=prefix[1]=0,位置0。
i=6(位置3):target=prefix[3]+0=2,哈希表中没有2。
i=5(位置4):target=prefix[4]+0=3,哈希表中有3(之前位置5,4,3加入的key都是3?不对,我们只加入新的键。位置5: prefix[6]=3,加入(因为之前没有3);位置4: prefix[5]=3,因为哈希表中已经有3,所以跳过;位置3: prefix[4]=3,跳过。所以,哈希表中3对应的位置是5(因为位置5最先被处理,即倒序遍历时位置5先于位置4和3被处理,所以位置5被加入,位置4和3被跳过)。所以,对于位置4:target=3,在哈希表中找到3,对应的位置是5,那么子串长度=5-4+1=2(子串为"io"?不对,位置4到5:子串是str[4]到str[5]:'i'和'o',都是元音,瑕疵度0,长度2。但最大长度应该是3("uio"或"auu")?所以这里我们只得到2,但后面会得到3。
i=4(位置5):target=prefix[5]+0=3,在哈希表中找到3(位置5),但是位置5作为右端点,子串长度=5-5+1=1(单个元音字母'o')。然后,将位置5对应的key=prefix[6]=3加入哈希表(但是已经存在,跳过)。
i=3(位置8):target=prefix[8]+0=4,哈希表中没有4(因为位置8之前,我们处理了位置12,11,10,它们对应的key都是5,位置5,4,3对应的key都是3,位置0对应的key是0)。然后,将位置8对应的key=prefix[9]=4加入哈希表。
i=2(位置10):target=prefix[10]+0=5,哈希表中有5吗?之前位置12,11,10加入:位置12: prefix[13]=5,加入;位置11: prefix[12]=5,跳过;位置10: prefix[11]=5,跳过。所以哈希表中有5,对应的位置是12(因为位置12先被处理,加入5)。所以,子串长度=12-10+1=3(子串为"auu",即位置10,11,12:'a','u','u',瑕疵度0(因为都是元音))。所以,maxLen=3。
i=1(位置11):target=prefix[11]+0=5,哈希表中存在5(位置12),子串长度=12-11+1=2("uu"),小于maxLen=3,不更新。
i=0(位置12):target=prefix[12]+0=5,哈希表中存在5(位置12),但是位置12和位置12相同?不行,因为要求右端点在左端点之后?这里我们存储的位置12,但是当前左端点也是12,那么右端点位置12>=12+1?不满足。所以,实际上,我们要求右端点的位置>当前左端点位置?不对,我们要求右端点位置在左端点之后(即>=左端点位置+1?)。但是,我们的子串可以是同一个位置吗?不可以,因为子串至少要包含一个字符,而同一个位置作为左右端点,子串长度为1,但是我们在计算时,右端点位置必须大于左端点位置(因为同一个位置不能既作为左端点又作为右端点?)。所以,我们存储的右端点位置必须大于当前左端点位置。但是,在倒序遍历时,我们是在处理完右端点之后才处理左端点,所以哈希表中存储的右端点位置都是大于当前左端点位置的(因为倒序遍历,先处理后面的位置)。所以,位置12作为左端点时,哈希表中存储的位置12就是它自己,但是我们在加入哈希表的时候,是在处理位置12时加入的,然后处理位置11,然后处理位置10。所以,当处理位置12时,哈希表中还没有位置12(因为我们是先查找后加入)。所以,不会匹配到自己。
因此,在位置10,我们得到长度3。然后,位置11和位置12不会更新。
另外,位置3,4,5我们得到长度2(位置4到5)和1(位置5),但最大长度是3。
所以,最后maxLen=3。然后,flaw=0,且maxLen不为0,所以返回3。
但是,我们还有一个子串"uio"(位置3,4,5)没有找到?为什么?
位置3(下标3): 'u'
位置4(下标4): 'i'
位置5(下标5): 'o'
子串长度3,瑕疵度0。
那么,在倒序遍历时:
位置5:target=prefix[5]+0=3,哈希表中此时有:位置5之后的位置(8,10,11,12)对应的key:4,5,5,5。没有3?不对,位置4和3还没有处理(因为倒序遍历,位置5之后处理位置4,再处理位置3)。所以,当处理位置5时,哈希表中还没有位置4和3。所以,不会匹配到位置4和3。
然后,处理位置4:target=prefix[4]+0=3,哈希表中有位置5对应的key=3(因为位置5已经被处理,并且加入了key=prefix[6]=3?位置5对应的key=prefix[5+1]=prefix[6]=3。而位置5在位置4之前被处理(倒序遍历先处理位置5,再处理位置4),所以当处理位置4时,哈希表中已经有3(位置5)。所以,位置4匹配到位置5,得到长度2。
然后处理位置3:target=prefix[3]+0=2,哈希表中没有2。
为什么没有匹配到位置5?因为位置3的target=2,而位置5对应的key=3,所以匹配不上。
那么,位置3,4,5这个子串:左端点是位置3,右端点是位置5,那么非元音数量=prefix[5+1]-prefix[3]=prefix[6]-prefix[3]=3-2=1?不对,我们需要计算子串[3,5]的非元音数量:这个子串是"uio",全部是元音,所以非元音数量=0。所以,target=prefix[3]+0=2,而右端点位置5对应的key=prefix[5+1]=prefix[6]=3,所以2+0=2,而我们需要的是prefix[6]=3等于2?不相等。所以匹配不上。
问题出在哪里?我们要求:子串[3,5]的非元音数量=prefix[6]-prefix[3]=3-2=1,但实际应该是0。错误!
前缀和数组计算:
prefix[0]=0
prefix[1]=0 # 'a'(元音)
prefix[2]=1 # 'as'(s非元音)
prefix[3]=2 # 'asd'(d非元音)
prefix[4]=3 # 'asdb'(b非元音)
prefix[5]=3 # 'asdbu'(u元音,所以非元音数量不变)
prefix[6]=3 # 'asdbui'(i元音)
prefix[7]=3 # 'asdbuio'(o元音)
所以,子串[3,5]:从下标3到5,对应字符'd','b','u'?不对,字符串下标从0开始:
下标0:'a', 1:'s', 2:'d', 3:'b', 4:'u', 5:'i'
所以,位置3是'b'(非元音),位置4是'u'(元音),位置5是'i'(元音)。所以,子串[3,5]是"bui",其中'b'是非元音,所以瑕疵度=1。所以,这个子串的瑕疵度是1,不是0。
而"uio"是从位置4到5?不对,位置4是'u',位置5是'i',位置6是'o'?但是位置6是下标6,对应字符是'o'(元音)。所以,子串[4,6]是"uio",位置4,5,6。
所以,元音位置4,5,6(下标)是连续的。
所以,我们应该在元音位置4(下标4)作为左端点,位置6(下标6)作为右端点:
非元音数量=prefix[7]-prefix[4]=3-3=0,所以瑕疵度0。
target = prefix[4]+0=3
右端点位置6对应的key=prefix[6+1]=prefix[7]=3,所以匹配:位置4和位置6,长度=6-4+1=3。
那么,在倒序遍历时,位置6(下标6)在位置4之前被处理(因为倒序遍历,先处理位置6,然后位置5,然后位置4)。处理位置6时,加入key=prefix[7]=3,位置6。
处理位置5时,target=prefix[5]+0=3,哈希表中有3(位置6),所以得到长度=6-5+1=2(子串"io")。
处理位置4时,target=prefix[4]+0=3,哈希表中有3(位置6),得到长度=6-4+1=3。
所以,位置4匹配到位置6,得到3。
因此,我们需要记录位置6(下标6)是元音位置。在元音位置数组中,位置6是存在的(字符'o')。
所以,元音位置数组应该是:0,3,4,5,6,8,10,11,12?不对,字符串"asdbuiodevauufgh":
a:0 -> 元音
s:1 -> 非元音
d:2 -> 非元音
b:3 -> 非元音
u:4 -> 元音
i:5 -> 元音
o:6 -> 元音
d:7 -> 非元音
e:8 -> 元音
v:9 -> 非元音
a:10 -> 元音
u:11 -> 元音
u:12 -> 元音
...
所以,元音位置:0,4,5,6,8,10,11,12。
所以,位置6是元音。
因此,我们之前记录的元音位置漏了6?因为字符串中第7个字符(下标6)是'o',是元音。
所以,在收集元音位置时,要包括所有元音字母。
因此,样例1中,有两个长度为3的子串:位置4,5,6("uio")和位置10,11,12("auu")。
所以,在位置4,我们匹配到位置6,得到3;在位置10,匹配到位置12,得到3。
最后,maxLen=3。
因此,代码实现时,注意元音位置的收集不要漏掉。
另一个样例:样例2
输入:flaw=2, str="aeueo"
输出:0
元音位置:0,1,3,4(因为字符串"aeueo":a,e,u,e,o)
0:'a', 1:'e', 3:'e', 4:'o'(注意,位置2是'u',是元音吗?题目中元音包括u,所以位置2也是元音?字符串"aeueo":a,e,u,e,o -> 所以元音位置:0,1,2,3,4)
所以,元音位置:0,1,2,3,4。
前缀和数组(非元音数量):
prefix[0]=0
prefix[1]=0 -> 'a'(元音)
prefix[2]=0 -> 'ae'(都是元音)
prefix[3]=0 -> 'aeu'(都是元音)
prefix[4]=0 -> 'aeue'(都是元音)
prefix[5]=0 -> 'aeueo'(都是元音)
我们要找瑕疵度=2的子串。
倒序遍历元音位置:4,3,2,1,0
位置4:target=prefix[4]+2=0+2=2,哈希表中没有2,然后加入key=prefix[5]=0。
位置3:target=prefix[3]+2=0+2=2,没有,加入key=prefix[4]=0(因为prefix[4]=0,已经存在?所以跳过)
位置2:target=prefix[2]+2=0+2=2,没有,加入key=prefix[3]=0(跳过)
位置1:target=prefix[1]+2=0+2=2,没有,加入key=prefix[2]=0(跳过)
位置0:target=prefix[0]+2=0+2=2,没有,加入key=prefix[1]=0(跳过)
所以,maxLen=0。然后,flaw=2不等于0,所以返回0。
符合样例2。
但是,注意:有可能存在瑕疵度=2的子串?比如,取子串"aeue",开头'a'(元音),结尾'e'(元音),中间的非元音字母数量=0?不对,因为都是元音。所以,整个字符串中都没有非元音字母,所以不可能有瑕疵度=2的子串。
因此,输出0。
代码实现:
注意:前缀和数组的索引范围是0..n,其中n是字符串长度。
步骤:
1. 定义元音字符串(大小写)。
2. 计算前缀和数组,并记录元音位置。
3. 如果flaw==0且没有元音字母,则返回0。
4. 初始化哈希表(unordered_map)用于存储(前缀和值,位置)。
5. 倒序遍历元音位置数组(从最后一个元素开始):
pos = 当前元音位置
target = prefix[pos] + flaw
如果哈希表中存在target,则取出对应的位置j_pos,计算长度=j_pos-pos+1,更新maxLen
然后,将当前元音位置pos对应的key=prefix[pos+1]加入哈希表:如果哈希表中没有这个key,则插入;如果已经有了,则跳过(因为我们要的是最大的位置,而当前pos一定比已有的位置小,所以不更新)。
6. 如果maxLen为0且flaw==0,则maxLen=1(因为单个元音字母)。
7. 返回maxLen。
但是,还有一种情况:如果flaw很大,可能没有子串满足,那么返回0。
注意:前缀和数组的值可能很大,但flaw在[0,65535],字符串长度最大65535,所以前缀和最大65535,所以target不会溢出。
但是,哈希表查找的效率:O(1),整个算法O(n),可以接受。
代码实现:
注意:字符串输入可能有双引号,如样例输入是:0\n"asdbuiodevauufgh"
但是,题目没有说明输入是否带双引号,所以我们需要处理?题目说“接下来一行是字符串str”,而样例输入是带双引号的,所以我们在读取时可能需要去除双引号。
但是,题目没有明确,我们假设函数输入的字符串str是去除了双引号的。
在函数中,我们直接使用str。
实现:
由于题目要求写一个类,函数名为GetLongestFlawedVowelSubstrLen,参数为(int flaw, const string& str)。
我们按照上述思路实现。
注意:前缀和数组的大小为n+1。
另外,元音字母的判断:使用一个集合(unordered_set)来存储10个元音字母。
代码:
注意:我们只存储新的键(即哈希表中没有该键时才插入),因为同一个键,我们只需要最大的位置(而倒序遍历时,先遇到的位置更大,所以后面遇到的不需要插入)。
但是,如果同一个键,我们可能遇到多个位置,而我们只存储第一个(最大的位置),那么对于更左的左端点,使用这个最大的位置形成的子串更长。所以,这样正确。
开始写代码:</think>### 问题分析
题目要求找出给定字符串中满足以下条件的最长子串:
1. 子串开头和结尾都是元音字母(aeiouAEIOU)
2. 子串中非元音字母的数量(瑕疵度)恰好等于给定值flaw
3. 若不存在满足条件的子串,返回0
### 解决方案
使用前缀和+哈希表+双指针优化:
1. **前缀和预处理**:计算每个位置前的非元音字母数量,实现O(1)时间获取任意子串的非元音数量
2. **元音位置记录**:收集字符串中所有元音字母的位置
3. **哈希表优化**:倒序遍历元音位置,用哈希表存储每个前缀和值对应的最大元音位置
4. **滑动窗口匹配**:对每个元音位置作为左端点,计算目标前缀和值,在哈希表中查找匹配的右端点
5. **特殊处理**:当flaw=0时,若未找到连续元音子串,则返回单个元音字母的长度1
```cpp
#include <string>
#include <unordered_set>
#include <vector>
#include <unordered_map>
using namespace std;
class Solution {
public:
int GetLongestFlawedVowelSubstrLen(int flaw, const string& str) {
int n = str.size();
if (n == 0) return 0;
// 元音字母集合(大小写)
unordered_set<char> vowels = {'a','e','i','o','u','A','E','I','O','U'};
// 前缀和数组:prefix[i]表示前i个字符中非元音字母的数量
vector<int> prefix(n+1, 0);
for (int i = 0; i < n; ++i) {
prefix[i+1] = prefix[i] + (vowels.count(str[i]) ? 0 : 1);
}
// 收集所有元音字母的位置
vector<int> vowelPositions;
for (int i = 0; i < n; ++i) {
if (vowels.count(str[i])) {
vowelPositions.push_back(i);
}
}
// 如果没有元音字母,直接返回0
if (vowelPositions.empty()) {
return 0;
}
// 处理flaw=0且无连续元音的情况
int maxLen = 0;
unordered_map<int, int> prefixMap; // 存储前缀和值->最大元音位置
// 倒序遍历元音位置
for (int i = vowelPositions.size() - 1; i >= 0; --i) {
int pos = vowelPositions[i];
int target = prefix[pos] + flaw; // 目标前缀和值
// 在哈希表中查找匹配的右端点
if (prefixMap.find(target) != prefixMap.end()) {
int jPos = prefixMap[target];
int length = jPos - pos + 1;
if (length > maxLen) {
maxLen = length;
}
}
// 将当前位置加入哈希表(仅当新key时插入)
int key = prefix[pos+1];
if (prefixMap.find(key) == prefixMap.end()) {
prefixMap[key] = pos;
}
}
// 特殊处理:flaw=0时单个元音字母作为备选
if (maxLen == 0 && flaw == 0) {
maxLen = 1;
}
return maxLen;
}
};
```
### 算法说明
1. **前缀和数组**:`prefix[i]`表示字符串前`i`个字符中非元音字母的数量
- 例如:`str = "abc"`,`prefix = [0,0,1,1]`(a元音,b非元音,c非元音)
2. **元音位置记录**:直接遍历字符串记录所有元音字母的下标
3. **哈希表优化**:
- 键:`prefix[pos+1]`(以pos结尾的子串的累计非元音数)
- 值:pos(元音位置)
- 倒序遍历确保存储的是最大位置
4. **匹配过程**:
- 对每个元音位置`pos`计算`target = prefix[pos] + flaw`
- 在哈希表中查找`target`,若存在则计算子串长度
5. **时间复杂度**:O(n),只需遍历字符串两次(前缀和+元音位置收集),哈希操作O(1)
6. **空间复杂度**:O(n),存储前缀和数组和元音位置
### 示例验证
**样例1**:flaw=0, str="asdbuiodevauufgh"
- 元音位置:[0,4,5,6,8,10,11,12]
- 前缀和:[0,0,1,2,3,3,3,3,4,4,5,5,5,5]
- 匹配过程:
- 位置4('u')匹配位置6('o'),长度=3("uio")
- 位置10('a')匹配位置12('u'),长度=3("auu")
- 输出:3
**样例2**:flaw=2, str="aeueo"
- 全部字符为元音,前缀和全0
- 无满足`target=0+2=2`的子串
- 输出:0
阅读全文
相关推荐


















