``` #include <bits/stdc++.h> using namespace std; const int N = 100005; string s,tmp; int n; int nxt[N][26],length[N],fail[N],sk[N],tp,sz; queue <int> q; int pos(string s,int len) { int p = 0; for (int i = 0;i < len;i++) { if (!nxt[p][s[i]-'a']) return 0; p = nxt[p][s[i]-'a']; } return p; } void insert(string s,int len) { int p = 0; for (int i = 0;i < len;i++) { if (!nxt[p][s[i]-'a']) nxt[p][s[i]-'a'] = ++sz; p = nxt[p][s[i]-'a']; } length[p] = len; } void kmp() { memset(fail,0,sizeof(fail)); for (int i = 0;i < 26;i++) if (nxt[0][i]) q.push(nxt[0][i]); while (!q.empty()) { int i = q.front(); q.pop(); for (int j = 0;j < 26;j++) if (nxt[i][j]) { int p = fail[i]; while (p && !nxt[p][j]) p = fail[p]; if (nxt[p][j]) p = nxt[p][j]; fail[nxt[i][j]] = p,q.push(nxt[i][j]); } } } string erase(string s,int len) { string ret = ""; for (int i = 0;i < len;i++) ret += ' '; int p = 0,l = 0; tp = 0; for (int i = 0;i < len;i++) { while (!nxt[p][s[i]-'a'] && p>0) p = fail[p]; if (!nxt[p][s[i]-'a']) { sk[++tp] = p,ret[++l] = s[i]; continue; } p = nxt[p][s[i]-'a'],sk[++tp] = p,ret[++l] = s[i]; if (length[p] > 0) tp -= length[p],l -= length[p],p = sk[tp]; } return ret.substr(1,l); } int main() { cin >> s >> n; while (n--) cin >> tmp,insert(tmp,tmp.length()); kmp(),cout << erase(s,s.length()); return 0; }```题目描述 FJ 把杂志上所有的文章摘抄了下来并把它变成了一个长度不超过 105 的字符串 s。他有一个包含 n 个单词的列表，列表里的 n 个单词记为 t1⋯tn。他希望从 s 中删除这些单词。 FJ 每次在 s 中找到最早出现的列表中的单词（最早出现指该单词的开始位置最小），然后从 s 中删除这个单词。他重复这个操作直到 s 中没有列表里的单词为止。注意删除一个单词后可能会导致 s 中出现另一个列表中的单词。 FJ 注意到列表中的单词不会出现一个单词是另一个单词子串的情况，这意味着每个列表中的单词在 s 中出现的开始位置是互不相同的。请帮助 FJ 完成这些操作并输出最后的 s。输入格式第一行是一个字符串，表示文章 s。第二行有一个整数，表示单词列表的单词个数 n。第 3 到第 (n+2) 行，每行一个字符串，第 (i+2) 行的字符串 ti 表示第 i 个单词。输出格式输出一行一个字符串，表示操作结束后的 s。数据规模与约定对于全部的测试点，保证： 1≤∣s∣,i=1∑n∣ti∣,n≤105。字符串均只含小写字母。操作结束后 s 不会被删成空串。对于所有的 i=j，ti 不是 tj 的子串。其中对于一个字符串 x，约定 ∣x∣ 表示 x 的长度。提示操作过程中 s 有可能某一个前缀子串被完全删除，请格外注意这一点。时间限制：1.00s 空间限制：256.00MB 当测试以下样例时会TLE，请分析原因：输入第一行：50000个a接着50000个b 输入第二行：1个2 输入第三行：50001个a 输入第四行：1个b

时间: 2025-07-06 13:35:49 浏览: 10

<think>嗯，我现在需要分析用户提供的这个C++代码，并解决在特定测试样例下出现的时间超限问题。首先，我得理解代码的逻辑。题目要求从字符串s中反复删除所有出现的列表中的单词，直到无法再删除为止。每次删除最早出现的单词，也就是位置最靠左的那个。用户给出的代码可能在某些情况下效率不高，导致超时。比如，当输入是大量重复字符时，例如给出的测试样例：50000个a后接50000个b，然后有一个50001个a的单词和一个b。这时候程序可能会遇到性能问题。首先，我需要理解代码的结构。看起来代码使用了AC自动机（Aho-Corasick Automaton）的结构。AC自动机通常用于多模式匹配，可以高效地在文本中查找多个模式串。代码中的insert函数构建了Trie树，kmp函数构建了失败指针（fail指针），而erase函数则用于处理删除操作。让我仔细看一下代码的各个部分： 1. **数据结构**： - `nxt[N][26]`：Trie树的节点，每个节点有26个子节点（对应a-z）。 - `length[N]`：记录每个节点是否为某个单词的结尾，并存储该单词的长度。 - `fail[N]`：AC自动机的失败指针。 - `sk`和`tp`：可能用于模拟栈的结构，记录处理过程中的状态。 2. **函数分析**： - **insert**：将每个单词插入到Trie树中，记录每个节点的长度。 - **kmp**：构建失败指针，采用广度优先搜索的方式，类似于AC自动机的构建过程。 - **erase**：核心函数，处理字符串s，删除所有出现的单词。这里使用了一个栈结构（`sk`数组和`tp`作为栈顶指针）。在遍历字符串s的每个字符时，沿着Trie树移动，并处理可能的失败转移。当遇到一个单词的结束节点（`length[p] > 0`）时，将栈回退该单词的长度，模拟删除操作。问题可能出在erase函数的实现上。例如，在删除一个单词后，需要回溯到之前的状态，这里用栈来保存状态。但如果在处理过程中，每次删除都需要多次回溯，可能导致时间复杂度变高，尤其是在处理大量连续需要删除的情况时。现在来看测试样例的情况：输入的s是50000个a加上50000个b。单词列表有一个50001个a的单词和一个b。由于50001个a比s中的a部分长，所以不会被匹配。但另一个单词是单个b。当处理到s中的第一个b时，会被删除。但此时可能需要处理后面的每个b，每次删除都需要调整栈结构，导致时间复杂度很高。例如，如果有50000个b，每个都要被单独删除，每次删除后都要重新处理后面的字符。这可能让时间复杂度达到O(n^2)，导致超时。那为什么代码会超时？可能的瓶颈在于erase函数的处理逻辑。比如，当删除一个单词后，程序可能需要重新扫描之前已经处理过的部分，或者每次删除操作导致大量的栈调整，使得时间复杂度无法承受。例如，假设每次删除一个字符b，那么对于每个b，都要进行一次栈的回退，并且可能需要重新处理后续的字符。如果有50000个b，每个都触发一次删除，并且每次删除都要处理一个字符，那么总时间会是O(n^2)，即50000次操作，每次O(1)，但可能在某些情况下不是这样。或者，可能在处理每个字符时，虽然使用了AC自动机，但存在某些循环，比如在失败指针的跳转中，导致时间增加。另外，代码中的erase函数在处理每个字符时，可能需要进行失败指针的回溯。例如，当在某个节点无法继续匹配时，会循环跳转fail指针，直到找到可以继续的节点或者回到根节点。这可能导致每个字符的处理时间不是常数，而是与fail链的长度相关。如果fail链很长，那么每次处理的时间会增加。例如，假设在构建fail指针时，某些节点的fail链非常长，比如当处理类似全是a的字符串时，每个节点的fail指针可能逐层回退，导致每个字符的处理时间变长。那这个测试样例中的情况如何呢？输入是50000a+50000b。单词列表中有两个单词：50001a（无法匹配）和b。当处理到每个b时，需要匹配到单词b。每次匹配到b时，会触发删除操作，将栈回退1个长度（因为length[p]是1）。这将导致每个b都被单独删除。在这种情况下，erase函数处理每个b时，会执行以下步骤： 1. 当前字符是b。 2. 在Trie中，根节点的子节点b是否存在？假设插入过程中，单词b被插入，所以根节点的b子节点存在，并且length[p]设为1。 3. 当处理到b时，进入该节点，检查length[p]>0，是，于是tp减去1，栈顶回到之前的状态，同时l减去1，即从结果字符串中移除该b。 4. 这样，每个b都会被逐一处理，并且每次处理的时间是O(1)。但是，对于50000个b来说，总时间是O(n)，这似乎不会导致超时。那为什么用户提供的测试样例会导致超时呢？哦，可能我理解错了测试样例的情况。用户给出的测试样例的输入可能有问题。例如，输入的第一行是50000a后接50000b。第二行输入n是2？或者用户给出的测试样例输入可能有误。根据用户提供的描述：输入第一行：50000个a接着50000个b 输入第二行：1个2？或者可能输入第二行是n=2，然后第三行是50001个a，第四行是1个b？或者可能用户给出的测试样例输入的结构是：第一行：50000a+50000b 第二行：n=2 第三行：一个50001长度的a字符串第四行：一个b 在这种情况下，第一个单词无法匹配（因为50001a比s中的a部分长），而第二个单词是b。当处理s中的每个b时，都会被逐个删除。这种情况下，erase函数需要处理每个b，每次删除一个字符。这将导致总共50000次删除操作，每次操作可能需要栈的回退。这种情况下，erase函数的时间复杂度应该是O(m)，其中m是s的长度。那为什么会超时呢？或者，问题出在构建AC自动机时的某些步骤，或者erase函数中的某些操作存在低效的地方。比如，在erase函数中的循环： while (!nxt[p][s[i]-'a'] && p>0) p = fail[p]; 这可能是一个循环，当当前节点p没有对应的字符子节点时，沿着fail指针回退。这可能导致每次处理字符时的时间不是常数，而是与fail链的长度相关。比如，当某个字符在Trie树中的路径需要多次回退fail指针，而fail链的长度很长，那么每次处理这个字符的时间就会很高。例如，假设有一个模式是aaa，那么在构建fail指针时，每个节点的fail链可能较长。比如，对于字符串aaaa...，每个节点的fail指针可能指向前一个节点。这样，当匹配失败时，需要回退多次。但在用户提供的测试样例中，单词只有b。Trie树的结构中，根节点的b子节点被插入。因此，当处理到字符b时，直接匹配到该节点，无需回退。这样，上述的while循环在此时不会执行，因为nxt[p][s[i]-'a']存在。因此，这种情况下处理每个b的时间是O(1)，总时间是线性的，不会导致超时。那问题可能出在另一个情况，比如当单词列表中存在大量模式，导致Trie树的结构复杂，或者erase函数中某些操作的时间复杂度高。或者，可能是在处理删除操作时，erase函数中的栈操作导致大量的字符串拼接，例如ret.substr(1,l)这一步可能需要复制字符串，当l很大时，导致时间增加。但代码中的erase函数返回的是通过逐个字符添加到ret中的，ret初始化为一个足够长的空格字符串，之后在最后返回时取子串。这可能不会导致过多的复制。或者，可能问题出在每次删除操作后的处理。例如，当删除一个单词时，可能需要多次调整栈指针，而这种情况在极端情况下会导致栈操作次数剧增。例如，假设每次删除一个字符，那么对于50000个b来说，每个字符处理时，会将p设置为sk[tp - length[p]]，即tp减少1。这样，栈操作的时间应该是线性的。因此，总时间应该是可接受的。那为什么用户提供的测试样例会导致超时呢？或许问题出在AC自动机的构建方式上。例如，当处理每个字符时，即使单词列表中只有一个单词，但插入时的某些操作导致Trie节点过多，或者构建fail指针时的某些步骤效率低下。或者，可能代码中存在错误，导致在某些情况下进入死循环，或者执行次数超过预期。另一个可能性是，在处理大量连续删除操作时，栈的调整导致时间复杂度升高。例如，在用户提供的样例中，每个b都会被删除，而每次删除一个b会导致后续的字符需要重新处理。或者，当删除一个字符后，可能导致前面的字符形成新的模式。比如，假设有一个模式是ab，而原字符串是aab，那么删除中间的a可能导致剩下的ab被匹配。但题目中的条件说明列表中的单词不会互相为子串，因此这种情况应该不存在。但根据题目描述，列表中的单词互不为子串，因此删除某个单词后，不会导致另一个单词的出现。但题目中的问题描述中的操作是反复删除最早出现的单词，直到无法删除为止。所以可能需要多次扫描字符串，而用户提供的代码可能无法高效处理这种情况，导致多次处理整个字符串。但根据代码的逻辑，似乎erase函数是在单次处理中完成所有可能的删除操作。例如，代码中的erase函数使用栈结构，当遇到一个单词时，立即回退栈指针，模拟删除该单词，并继续处理后面的字符。这样，整个过程只需要一次遍历字符串，因此时间复杂度应该是线性的。这可能意味着代码是正确的，但在某些情况下，比如当删除后的字符串再次形成需要删除的模式时，如何处理？例如，假设字符串是"ababa"，而单词是"aba"。第一次删除最左边的"aba"，得到"ba"。但如果单词是"aba"和"ba"，则在删除"aba"后剩下的"ba"需要被删除。但根据题目的条件，单词之间不会互为子串，所以这种情况不会出现。因为题目数据保证每个ti都不是其他tj的子串，所以删除一个单词后不会出现另一个单词的出现。因此，在处理时，只需要找到所有可能的单词出现，并在一次处理中删除所有可能的匹配即可，无需多次扫描。但用户提供的代码可能并没有正确实现这一逻辑。例如，在栈结构的处理中，是否能够正确捕获所有可能的删除？例如，当删除一个单词后，前面的字符可能组合成新的单词，此时是否需要再次处理？例如，假设字符串是"abc"，而单词是"ab"和"bc"。但根据题目条件，单词之间不能互为子串，所以这种情况不会出现。因此，在这种情况下，用户代码的正确性应该没问题。回到测试样例的问题：当输入的s是大量a后接大量b，而单词列表中有50001a和b。其中，50001a无法匹配，而b会被逐个删除。因此，代码应该如何处理？当处理每个b时，会立即删除，因此，在erase函数中，每个b都会被匹配到，导致删除。此时，栈的调整应该是线性的，时间复杂度应该是O(n)，所以不应该超时。那为什么会超时呢？或许问题出在构建AC自动机的kmp函数中。例如，在构建失败指针时，当存在大量节点，可能导致kmp函数的时间变长。例如，假设插入了一个长度为5e4的a字符串，那么Trie树的节点数会是5e4，这可能导致构建失败指针时的时间很高。但用户提供的测试样例中的第一个单词是50001a，但输入的s中的a只有5e4个，所以该单词不会被插入到Trie中？或者用户输入的n是2？或者用户提供的测试样例中的n是1，输入的第三行是50001a，第四行是另一个单词？用户提供的测试样例输入描述可能存在错误。例如：输入第二行是1个2？这可能表示n=2，然后第三行是50001a，第四行是1个b。但这样的话，n的值是2，意味着需要插入两个单词。但是，用户给出的测试样例输入可能包含两个单词，其中第一个单词是50001a，无法在s中匹配，第二个单词是b。这将导致所有b被删除。这时，代码的insert函数会将这两个单词插入到Trie树中。对于第一个单词（50001a），需要插入50001个节点。这可能占用大量的内存和时间。例如，当插入50001个a时，每次循环生成新节点，导致sz变量增加到50001。这会使得kmp函数中的队列处理变得非常耗时，因为每个节点都需要处理其子节点。例如，对于每个节点i，循环26个子节点，而这里每个节点只有一个子节点a，所以每个节点的处理时间还是O(1)。总共有50001个节点，因此构建失败指针的时间是O(26 * 50001)，这可能在时间上是可行的，因为总的操作次数是1e5左右，这在1秒的时间限制内（1e8操作）应该没问题。那为什么用户提供的测试样例会导致超时呢？或者，问题可能出在erase函数的实现中，当处理每个字符时，虽然大部分情况下是O(1)，但当某个字符需要沿fail链回溯多次时，导致总时间增加。例如，假设某个字符需要多次跳转fail指针才能找到可用的路径，而这样的跳转次数与当前字符串长度成正比，那么总时间会变成O(n^2)。例如，在用户提供的测试样例中，当处理50000个a的时候，每个a需要跳转多次fail指针，导致时间增加。或者，代码中的某些数组访问导致缓存不友好，例如二维数组nxt[N][26]，当N很大时（比如5e4），访问可能较慢。或者，在测试样例中，当插入的单词是50001a时，导致Trie树的高度很高，而在处理s中的a时，每个字符都要遍历到当前节点的a子节点，而如果该单词未被插入，那么处理每个a时，会一直沿着Trie树的路径前进，直到没有对应的子节点。例如，当处理s中的a时，Trie树中的节点在插入50001a时已经被创建到50001层。假设s中的a有5e4个，那么在处理每个a时，会遍历到第5e4层，然后发现下一个a没有对应的子节点，此时会沿着fail指针回溯。这可能是一个问题。例如，当处理到第50000个a时，当前p的值是50000，而nxt[p][a]是否存在？因为插入的单词是50001a，所以当处理到第50000个a时，nxt[p][a]应该存在，而第50001个节点才不存在。因此，在处理s中的50000a时，p会逐步增加到50000，此时每个a的处理都是直接进入下一个节点，无需跳转fail指针。这似乎不会有问题。但是，当处理到第50001个a时（假设s中有的情况下），才会发现nxt[p][a]不存在，需要跳转fail指针。但在用户提供的测试样例中，s中的a只有5e4，因此不会到达这种情况。但是，用户提供的测试样例中的第一个单词是50001a，这意味着插入到Trie中的是50001个a组成的字符串。而s中的a部分是5e4个，所以当处理到每个a时，p会逐步增加到5e4层。假设每次处理一个a，都需要访问nxt[p][a]，而这需要5e4次操作。总共有5e4次a，所以总时间是5e4 * 5e4 = 2.5e9，这明显超过时间限制，导致超时。哦，这可能就是问题的关键所在！例如，当插入一个长度为L的单词，处理一个长度为M的字符串中的前L个字符时，每个字符都需要访问Trie的节点，每次操作是O(1)，但如果L很大，那么处理每个字符的时间虽然常数，但总时间会变成O(M*L)，这在L为5e4的情况下，总时间是5e4 *5e4=2.5e9，这显然无法在1秒内完成。所以，在用户提供的测试样例中，当插入一个长度为5e4+1的a字符串，而处理s中的5e4个a时，每个a都会使p递增到下一个节点，直到p达到5e4。每个字符处理需要一次数组访问，总共有5e4次这样的操作。这部分的时间是O(5e4)，应该是可以的。那为什么会超时呢？或者，这可能不是问题所在，因为处理每个字符的循环是线性的，如insert函数中的循环次数是单词的长度，而处理s中的每个字符时，erase函数的循环次数是每个字符一次。例如，处理5e4个a时，每个a只需要一次nxt[p][a]的访问，所以总时间是5e4次操作，这没问题。那问题可能出在别处。或者，当处理每个字符时，当无法匹配到某个字符时，会沿着fail指针链回退。例如，当处理s中的每个a时，p一直递增到5e4层。但当处理到s中的b时，当前p是5e4，此时检查nxt[5e4][b-'a']是否存在。由于插入的单词中没有这样的节点，所以会进入循环： while (!nxt[p][s[i]-'a'] && p>0) p = fail[p]; 这可能要回退p到根节点，而每次回退都需要访问fail指针。例如，当p=5e4时，nxt[p][b]不存在，因此需要沿着fail指针回退。此时，fail[p]的值是多少？在AC自动机的构建过程中，每个节点的fail指针指向的是最长可能的后缀对应的节点。例如，当插入的单词是50001a，那么每个节点的fail指针应该指向更短的a前缀。例如，节点1（第一个a）的fail是0，节点2（第二个a）的fail是节点1，依此类推。因此，当处理到p=5e4时，无法找到b的子节点，那么需要回退到fail[p]，也就是p=5e4-1=49999。再次检查nxt[p][b]，同样不存在，继续回退到p=49998，直到p=0。这会导致每次处理一个b时，需要回退5e4次，这会导致处理每个b的时间是O(L)（L是当前p的深度），总时间是O(M*L)，即5e4次回退，每个b需要5e4次操作，总共有5e4个b，所以总时间是5e4 *5e4=2.5e9次操作，显然超时。哦，原来如此！这才是问题的根本原因。例如，当处理每个b时，当前p处于5e4层，而沿着fail指针回退到根节点需要5e4次循环。每个b的处理需要这样的回退操作，导致总时间变成O(M*L)的复杂度，这在M是5e4、L是5e4的情况下，总时间是无法承受的。所以，用户提供的代码在处理这种需要大量fail指针回退的情况下，时间复杂度过高，导致超时。那如何优化这个问题呢？在AC自动机中，这种情况可以通过构建转移表（即每个节点的每个字符的转移缓存）来优化。通常，在预处理时，对于每个节点p和每个字符c，计算当在p节点遇到字符c时的最终转移位置。这可以通过记忆化或者广度优先搜索时预处理得到。这种方法称为建立转移表或者建立fail树的转移优化。在用户提供的代码中，nxt数组只存储Trie树的结构，而没有缓存失败后的转移结果。因此，每次处理字符时，都需要沿着fail指针链回退，直到找到有对应字符的节点或者回到根节点。这会导致最坏情况下O(L)的时间复杂度，其中L是当前节点的深度。例如，当在p节点处理字符c时，如果nxt[p][c]不存在，则沿着fail[p]回退，直到找到一个节点q，使得nxt[q][c]存在，或者q是根节点。如果q的nxt[q][c]存在，则转移到该节点；否则，转移到根节点的nxt[0][c]（如果存在的话）。在用户提供的代码中，erase函数的这部分逻辑如下： while (!nxt[p][s[i]-'a'] && p>0) p = fail[p]; if (!nxt[p][s[i]-'a']) { sk[++tp] = p, ret[++l] = s[i]; continue; } p = nxt[p][s[i]-'a'], sk[++tp] = p, ret[++l] = s[i]; 这意味着，在每次处理字符时，如果当前节点的对应字符子节点不存在，就会不断回退fail指针，直到找到一个可用的节点或者回到根节点。如果最终还是没有找到可用的子节点，就停留在根节点，并将该字符保留下来。在这种情况下，当处理每个b时，当前p处于5e4层，每次都需要回退5e4次fail指针，导致每个b的处理时间是O(5e4)，总共有5e4个b，总时间是O(2.5e9)，这显然超过了时间限制。因此，问题的根本原因在于，用户提供的代码没有对转移进行优化，导致每次处理字符时的最坏时间复杂度较高。要解决这个问题，需要将AC自动机的转移表预处理，使得每个节点p和每个字符c都能直接得到转移后的节点，而无需每次都沿fail链回溯。这可以通过在构建fail指针后，预处理每个节点的转移数组，或者在使用时进行记忆化缓存。例如，可以修改nxt数组的定义，使得nxt[p][c]存储的是经过fail指针跳转后的最终转移节点。或者，在构建fail指针时，预处理每个节点p的所有可能的字符c的转移。具体来说，在构建AC自动机时，当处理节点i，对于每个字符c： - 如果nxt[i][c]存在，则转移后的节点是nxt[i][c]。 - 否则，转移后的节点等于从fail[i]节点出发处理c的转移节点，这可以递归地计算，但需要预处理，以避免重复计算。这类似于将nxt数组扩展为一个完整的转移表，其中每个节点的每个字符都指向正确的转移节点。这可以通过BFS的方式预处理所有可能的转移。在用户提供的代码中，kmp函数（即构建fail指针的函数）中，可以添加这部分预处理，即在处理每个节点i时，对于每个字符c，如果nxt[i][c]不存在，则设置nxt[i][c]等于nxt[fail[i]][c]。但需要注意，这可能需要在BFS过程中处理，或者使用记忆化的方法。例如，在构建fail指针后，对于每个节点p和字符c，若nxt[p][c]不存在，则将其设置为nxt[fail[p]][c]，如果fail[p]的对应字符c的转移存在的话。但这种方法可能需要递归查找，因此需要预处理。另一种方式是，在访问nxt[p][c]时，如果不存在，则动态计算，并缓存结果。这可以通过在访问时检查，如果没有缓存，则递归查找fail链，直到找到转移节点，然后缓存该结果。在用户提供的代码中，可以修改nxt数组，或者使用另一个数组trans[p][c]来存储预处理后的转移结果。例如，在kmp函数中，构建fail指针后，可以预处理每个节点p的每个字符c的转移： for each node p: for each character c in 'a' to 'z': if nxt[p][c] exists: trans[p][c] = nxt[p][c] else: trans[p][c] = trans[fail[p]][c] 其中，trans数组是预处理后的转移表。这需要递归地计算，但可以通过广度优先搜索的方式处理，因为fail指针的构建是广度优先的。通过这种方式，每个节点p的每个字符c的转移都被预处理为最终的转移节点，这样在处理字符时，可以直接访问trans[p][c]，而不需要每次都沿fail链回溯。在用户提供的代码中，没有这样的预处理步骤，因此每次处理字符时都需要沿fail链回溯，导致最坏情况的时间复杂度很高。因此，为了解决这个问题，需要将nxt数组替换为预处理后的转移表，或者在访问nxt数组时进行动态缓存。例如，在erase函数中，当处理字符c时，直接使用预处理好的转移表来获取下一个状态p，而不是沿fail链回溯。修改后的代码需要在构建AC自动机时预处理转移表。具体步骤如下： 1. 修改nxt数组的定义，使其存储预处理后的转移，或者在构建fail指针后，预处理每个节点p和字符c的转移。 2. 在kmp函数中，除了构建fail指针外，预处理每个节点的转移。或者，在访问nxt数组时，动态处理。例如，在erase函数中，当需要处理字符c时，查询nxt[p][c]，如果不存在，则递归查询fail[p]节点的nxt[fail[p]][c]，直到找到根节点或存在转移。为了加速这个过程，可以在处理时进行缓存，例如使用记忆化数组。例如，在用户提供的代码中，可以修改处理字符的循环：原代码： while (!nxt[p][s[i]-'a'] && p>0) p = fail[p]; if (!nxt[p][s[i]-'a']) { sk[++tp] = p,ret[++l] = s[i]; continue; } p = nxt[p][s[i]-'a'],sk[++tp] = p,ret[++l] = s[i]; 修改后的代码： int c = s[i] - 'a'; int q = p; while (q != 0 && nxt[q][c] == 0) { q = fail[q]; } q = nxt[q][c]; if (q == 0) { // 没有转移，保留该字符 sk[++tp] = p; ret[++l] = s[i]; p = 0; // 回到根节点？ } else { sk[++tp] = q; ret[++l] = s[i]; p = q; } 但这并不能减少时间，因为每次都要循环查询。因此，更好的方法是预处理转移表。因此，正确的解决方案应该是在构建AC自动机时预处理每个节点和每个字符的转移，避免在处理每个字符时需要沿fail链回溯。综上，用户提供的代码在处理每个字符时，需要沿fail指针链回溯，导致在处理某些特定情况下（如需要多次回溯）的时间复杂度达到O(L) per character，从而导致总时间超限。解决方法是预处理转移表，使得每个字符的处理时间为O(1)。</think>该代码使用AC自动机进行字符串多模式匹配，但在处理特定数据时会超时。根本原因在于未预处理转移表，导致每次匹配失败时需沿fail链回溯，时间复杂度退化。 ### 问题分析 1. **AC自动机缺陷**：原代码在匹配过程中未缓存转移状态，每次失败需循环查询fail指针。当处理长路径时（如插入长单词后匹配失败），导致单次字符处理时间达O(L)，总时间变为O(N*L)。 ### 优化方案预处理每个节点的所有字符转移状态，消除回溯： ```cpp #include <bits/stdc++.h> using namespace std; const int N = 100005; string s,tmp; int n, nxt[N][26], trans[N][26], length[N], fail[N], sk[N], tp, sz; int pos(string &s, int len) { int p = 0; for (int i=0; i<len; i++) p = trans[p][s[i]-'a']; return p; } void insert(string &s, int len) { int p = 0; for (int i=0; i<len; i++) { int c = s[i]-'a'; if (!nxt[p][c]) nxt[p][c] = ++sz; p = nxt[p][c]; } length[p] = len; } void build() { queue<int> q; for (int i=0; i<26; ++i) if (nxt[0][i]) q.push(nxt[0][i]); while (!q.empty()) { int u = q.front(); q.pop(); for (int c=0; c<26; ++c) { int v = nxt[u][c]; if (v) { fail[v] = trans[fail[u]][c]; // 关键优化点 length[v] = max(length[v], length[fail[v]]); q.push(v); } trans[u][c] = v ? v : trans[fail[u]][c]; } } } string erase(string &s, int len) { string res; int p = 0; for (char ch : s) { p = trans[p][ch-'a']; res += ch; if (length[p]) { res.resize(res.size() - length[p]); p = sk[res.size()]; } else sk[res.size()] = p; } return res; } int main() { ios::sync_with_stdio(0); cin.tie(0); cin >> s >> n; while (n--) { cin >> tmp; insert(tmp, tmp.size()); } memcpy(trans[0], nxt[0], sizeof(nxt[0])); build(); cout << erase(s, s.size()); return 0; } ``` ### 改进点说明 1. **预处理转移表(trans数组)**：在构建fail指针时同步计算每个节点的最终转移状态，将跳转过程压缩至O(1)。 2. **实时更新最长匹配**：在构建过程中维护length数组，确保删除最长的有效匹配。 3. **双栈优化**：使用sk数组保存状态历史，删除时直接回滚到之前状态，避免重复计算。通过预处理转移表，将字符处理时间复杂度稳定在O(1)，总时间复杂度优化至O(M + L)，其中M为s长度，L为所有模式串总长。

阅读全文

相关推荐

vc2019中 源文件<bits/stdc++.h>无法打开

c++万能头文件(包含所有其他头文件)#include<bits/stdc++.h> 注：此cpp文件包含万能头文件以及基本框架

c++中<bits/stdc++.h>的实现

向一位c++初学者教学数组+map<>图论理论实现以及具体示例

通过遗传算法求函数f(x) = x sin(10πx) + 2.0, x∈[-1,2]的最大值使用c++

新版青岛奥博软件公司营销标准手册.docx

网站安全管理制度(1).doc

基于AVR单片机的自动语音欢迎系统-本科毕业论文(1)(1).doc

本科毕设论文-—电子商务在中小企业中的应用探析(1).doc

2014阿里巴巴校园招聘软件研发工程师笔试真题及答案(1).doc

移动通信3G技术概述.doc

皮带运输机的PLC控制.ppt

英语说课SEFC-Book-2A-Unit-12-Mainly-Revision(全英文)(1).docx

综合项目管理基础手册.doc

用MATLAB求解微分方程及微分方程组(1).pptx

大家在看

FM11RF08.pdf

气压传感器BMP180驱动-基于STM32 prj_BMP180.rar

amesim培训资料（实时控制仿真）

上海GBQ4.0-2349.rar

西门子S7200系列下载器驱动

最新推荐

新版青岛奥博软件公司营销标准手册.docx

网站安全管理制度(1).doc

基于AVR单片机的自动语音欢迎系统-本科毕业论文(1)(1).doc

本科毕设论文-—电子商务在中小企业中的应用探析(1).doc

2014阿里巴巴校园招聘软件研发工程师笔试真题及答案(1).doc

500强企业管理表格模板大全

YOLOv8目标检测算法深度剖析：从零开始构建高效检测系统（10大秘诀）

mclmcrrt9_8.dll下载

林锐博士C++编程指南与心得：初学者快速提能

线性代数方程组求解全攻略：直接法vs迭代法，一文搞懂

vc2019中源文件<bits/stdc++.h>无法打开