洛谷P1540 [NOIP 2010 提高组] 机器翻译-队列

信奥源老师

于 2025-07-06 14:36:06 发布

阅读量750

点赞数 14

CC 4.0 BY-SA版权

分类专栏：信奥赛算法基础 CSP-J入门级冲刺2024CSP-J入门组第二轮一等奖(专题训练) 文章标签：机器翻译人工智能自然语言处理 c++ GESP 信奥赛算法

本文链接：https://blog.csdn.net/lan_in/article/details/149152908

信奥赛算法基础 CSP-J入门级同时被 2 个专栏收录

14 篇文章

订阅专栏

冲刺2024CSP-J入门组第二轮一等奖(专题训练)

12 篇文章

订阅专栏

P1540 [NOIP 2010 提高组] 机器翻译

题目背景

NOIP2010 提高组 T1

题目描述

小晨的电脑上安装了一个机器翻译软件，他经常用这个软件来翻译英语文章。

这个翻译软件的原理很简单，它只是从头到尾，依次将每个英文单词用对应的中文含义来替换。对于每个英文单词，软件会先在内存中查找这个单词的中文含义，如果内存中有，软件就会用它进行翻译；如果内存中没有，软件就会在外存中的词典内查找，查出单词的中文含义然后翻译，并将这个单词和译义放入内存，以备后续的查找和翻译。

假设内存中有 $M$ 个单元，每单元能存放一个单词和译义。每当软件将一个新单词存入内存前，如果当前内存中已存入的单词数不超过 $M - 1$ ，软件会将新单词存入一个未使用的内存单元；若内存中已存入 $M$ 个单词，软件会清空最早进入内存的那个单词，腾出单元来，存放新单词。

假设一篇英语文章的长度为 $N$ 个单词。给定这篇待译文章，翻译软件需要去外存查找多少次词典？假设在翻译开始前，内存中没有任何单词。

输入格式

共 $2$ 行。每行中两个数之间用一个空格隔开。

第一行为两个正整数 $M, N$ ，代表内存容量和文章的长度。

第二行为 $N$ 个非负整数，按照文章的顺序，每个数（大小不超过 $1000$ ）代表一个英文单词。文章中两个单词是同一个单词，当且仅当它们对应的非负整数相同。

输出格式

一个整数，为软件需要查词典的次数。

输入输出样例 #1

输入 #1

3 7
1 2 1 5 4 4 1

输出 #1

说明/提示

样例解释

整个查字典过程如下：每行表示一个单词的翻译，冒号前为本次翻译后的内存状况：

1：查找单词 1 并调入内存。
1 2：查找单词 2 并调入内存。
1 2：在内存中找到单词 1。
1 2 5：查找单词 5 并调入内存。
2 5 4：查找单词 4 并调入内存替代单词 1。
2 5 4：在内存中找到单词 4。
5 4 1：查找单词 1 并调入内存替代单词 2。

共计查了 $5$ 次词典。

数据范围

对于 $10%10\%$ 的数据有 $M = 1$ ， $\leq 5$ ；
对于 $100%100\%$ 的数据有 $\leq M \leq 100$ ， $\leq N \leq 1000$ 。

解题思路

本题模拟机器翻译的内存管理过程，核心是维护一个固定大小的队列（先进先出）：

遍历每个单词，若单词不在内存中：
- 查词典次数+1
- 若内存已满，移除最早进入的单词
- 将新单词加入内存
输出总查词典次数

优化后代码实现

方法1：STL队列实现（简洁高效）

#include <iostream>
#include <queue>
using namespace std;

int main() {
    int m, n, cnt = 0;  // m:内存容量 n:单词数 cnt:查词次数
    cin >> m >> n;
    
    queue<int> q;       // 内存队列
    bool inMem[1001]{}; // 标记单词是否在内存
    
    while (n--) {
        int x;          // 当前单词
        cin >> x;
        
        if (!inMem[x]) {    // 单词不在内存
            cnt++;          // 查词典
            if (q.size() == m) { // 内存已满
                inMem[q.front()] = false; // 清除标记
                q.pop();    // 移除最早单词
            }
            q.push(x);      // 加入新单词
            inMem[x] = true;// 设置标记
        }
    }
    cout << cnt << endl;
}

方法2：数组模拟循环队列（高效低开销）

#include <iostream>
using namespace std;

int main() {
    int m, n, cnt = 0;  // m:内存容量 n:单词数 cnt:查词次数
    cin >> m >> n;
    
    int mem[100];       // 内存数组
    int fr = 0, rr = -1, sz = 0; // fr:队首 rr:队尾 sz:当前大小
    bool inMem[1001]{}; // 标记单词是否在内存
    
    while (n--) {
        int x;          // 当前单词
        cin >> x;
        
        if (!inMem[x]) {    // 单词不在内存
            cnt++;          // 查词典
            if (sz == m) {  // 内存已满
                inMem[mem[fr]] = false; // 清除标记
                fr = (fr + 1) % m;     // 队首前移
                sz--;
            }
            rr = (rr + 1) % m; // 队尾后移
            mem[rr] = x;    // 存入新单词
            inMem[x] = true;// 设置标记
            sz++;
        }
    }
    cout << cnt << endl;
}