洛谷P1540 [NOIP 2010 提高组] 机器翻译-队列

P1540 [NOIP 2010 提高组] 机器翻译

题目背景

NOIP2010 提高组 T1

题目描述

小晨的电脑上安装了一个机器翻译软件,他经常用这个软件来翻译英语文章。

这个翻译软件的原理很简单,它只是从头到尾,依次将每个英文单词用对应的中文含义来替换。对于每个英文单词,软件会先在内存中查找这个单词的中文含义,如果内存中有,软件就会用它进行翻译;如果内存中没有,软件就会在外存中的词典内查找,查出单词的中文含义然后翻译,并将这个单词和译义放入内存,以备后续的查找和翻译。

假设内存中有 MMM 个单元,每单元能存放一个单词和译义。每当软件将一个新单词存入内存前,如果当前内存中已存入的单词数不超过 M−1M-1M1,软件会将新单词存入一个未使用的内存单元;若内存中已存入 MMM 个单词,软件会清空最早进入内存的那个单词,腾出单元来,存放新单词。

假设一篇英语文章的长度为 NNN 个单词。给定这篇待译文章,翻译软件需要去外存查找多少次词典?假设在翻译开始前,内存中没有任何单词。

输入格式

222 行。每行中两个数之间用一个空格隔开。

第一行为两个正整数 M,NM,NM,N,代表内存容量和文章的长度。

第二行为 NNN 个非负整数,按照文章的顺序,每个数(大小不超过 100010001000)代表一个英文单词。文章中两个单词是同一个单词,当且仅当它们对应的非负整数相同。

输出格式

一个整数,为软件需要查词典的次数。

输入输出样例 #1

输入 #1

3 7
1 2 1 5 4 4 1

输出 #1

5

说明/提示

样例解释

整个查字典过程如下:每行表示一个单词的翻译,冒号前为本次翻译后的内存状况:

  1. 1:查找单词 1 并调入内存。
  2. 1 2:查找单词 2 并调入内存。
  3. 1 2:在内存中找到单词 1。
  4. 1 2 5:查找单词 5 并调入内存。
  5. 2 5 4:查找单词 4 并调入内存替代单词 1。
  6. 2 5 4:在内存中找到单词 4。
  7. 5 4 1:查找单词 1 并调入内存替代单词 2。

共计查了 555 次词典。

数据范围

  • 对于 10%10\%10% 的数据有 M=1M=1M=1N≤5N \leq 5N5
  • 对于 100%100\%100% 的数据有 1≤M≤1001 \leq M \leq 1001M1001≤N≤10001 \leq N \leq 10001N1000

解题思路

本题模拟机器翻译的内存管理过程,核心是维护一个固定大小的队列(先进先出):

  1. 遍历每个单词,若单词不在内存中:
    • 查词典次数+1
    • 若内存已满,移除最早进入的单词
    • 将新单词加入内存
  2. 输出总查词典次数

优化后代码实现

方法1:STL队列实现(简洁高效)
#include <iostream>
#include <queue>
using namespace std;

int main() {
    int m, n, cnt = 0;  // m:内存容量 n:单词数 cnt:查词次数
    cin >> m >> n;
    
    queue<int> q;       // 内存队列
    bool inMem[1001]{}; // 标记单词是否在内存
    
    while (n--) {
        int x;          // 当前单词
        cin >> x;
        
        if (!inMem[x]) {    // 单词不在内存
            cnt++;          // 查词典
            if (q.size() == m) { // 内存已满
                inMem[q.front()] = false; // 清除标记
                q.pop();    // 移除最早单词
            }
            q.push(x);      // 加入新单词
            inMem[x] = true;// 设置标记
        }
    }
    cout << cnt << endl;
}
方法2:数组模拟循环队列(高效低开销)
#include <iostream>
using namespace std;

int main() {
    int m, n, cnt = 0;  // m:内存容量 n:单词数 cnt:查词次数
    cin >> m >> n;
    
    int mem[100];       // 内存数组
    int fr = 0, rr = -1, sz = 0; // fr:队首 rr:队尾 sz:当前大小
    bool inMem[1001]{}; // 标记单词是否在内存
    
    while (n--) {
        int x;          // 当前单词
        cin >> x;
        
        if (!inMem[x]) {    // 单词不在内存
            cnt++;          // 查词典
            if (sz == m) {  // 内存已满
                inMem[mem[fr]] = false; // 清除标记
                fr = (fr + 1) % m;     // 队首前移
                sz--;
            }
            rr = (rr + 1) % m; // 队尾后移
            mem[rr] = x;    // 存入新单词
            inMem[x] = true;// 设置标记
            sz++;
        }
    }
    cout << cnt << endl;
}
<think>根据用户需求,用户希望查找NOIP2010提高P1540机器翻译题目的题解或示例代码。题目描述:内存中有M个单元,每单元能存放一个单词。每次查找一个单词,若内存中有则无需访问外存;若没有则系统会查字典,然后将该单词存入内存。若内存已满,则删除最早进入内存的单词。求系统需要访问外存的次数。引用[2]中提供了一段C++代码,这正是该题的一个典型解法,使用队列模拟内存,用布尔数标记单词是否在内存中。解题思路:1.初始化一个队列(模拟内存)和一个标记数(记录单词是否在内存中)。2.对于每个输入的单词:-如果该单词已在内存中(标记为true),则跳过。-如果不在内存中:*访问外存次数加1;*如果内存已满(队列大小等于M),则弹出队首单词并将其标记为不在内存中;*将新单词加入队列并标记为在内存中。3.输出访问外存的总次数。引用[2]的代码实现:```cpp#include<iostream>#include<algorithm>#include<queue>usingnamespacestd;constintN=1010;intn,m;boolst[N];intmain(){cin>>m>>n;intres=0;queue<int>q;for(inti=0;i<n;i++){intx;cin>>x;if(!st[x]){res++;if(q.size()==m){st[q.front()]=false;q.pop();}q.push(x);st[x]=true;}}cout<<res<<endl;return0;}```代码说明:-`m`:内存容量-`n`:单词总数-`st`数:标记单词是否在内存中(索引为单词值,题目中单词为整数)-`q`:队列,按顺序存储内存中的单词-`res`:记录访问外存的次数注意事项:1.题目中单词为整数(范围在0~1000),所以用数标记可行。2.队列模拟了先进先出的淘汰策略。相关问题:1.如何分析该算法的时间复杂度?2.如果单词范围很大(例如10^9),如何优化标记方法?3.该问题与操作系统的页面置换算法有何关联?</think>### NOIP 2010 提高 P1540 机器翻译题解 #### 题目分析 题目要求模拟内存管理过程:内存容量为 $M$,依次处理 $N$ 个单词请求。规则如下: 1. 若单词已在内存中,不操作 2. 若单词不在内存中: - 访问外存(计数+1) - 若内存已满,删除最早进入的单词 - 将新单词加入内存 本质是**先进先出(FIFO)队列**的模拟问题,需统计访问外存的总次数。 #### 核心算法 使用队列维护内存中的单词顺序,配合标记数记录单词存在状态: ```cpp #include <iostream> #include <queue> using namespace std; const int MAX_WORD = 1000; // 单词值域[0,1000] int main() { int M, N; cin >> M >> N; // M=内存容量, N=请求总数 queue<int> memQueue; // 内存队列(按进入顺序) bool inMem[MAX_WORD]{}; // 标记数,inMem[x]=true表示x在内存 int count = 0; // 外存访问计数 for (int i = 0; i < N; i++) { int word; cin >> word; if (!inMem[word]) { // 单词不在内存 count++; if (memQueue.size() >= M) { // 内存已满 int oldest = memQueue.front(); memQueue.pop(); inMem[oldest] = false; // 移除最早单词 } memQueue.push(word); inMem[word] = true; // 添加新单词 } } cout << count << endl; return 0; } ``` #### 关键点说明 1. **时间复杂度**:$O(N)$,每个单词处理时间为 $O(1)$ 2. **空间复杂度**:$O(M + K)$($K$ 为单词值域大小) 3. **队列作用**:维护单词进入顺序,实现FIFO淘汰 4. **标记数**:$O(1)$ 时间判断单词存在性 5. **边界处理**:当 $M=0$ 时所有请求都需要访问外存 #### 算法优化方向 1. **大值域场景**:若单词值域过大(如 $10^9$),可用 `unordered_set` 替代标记数 2. **动态内存**:使用循环队列避免STL队列的动态内存分配 3. **预分配队列**:初始化队列容量为 $M$ 减少扩容开销 #### 示例测试 输入: ``` 3 7 1 2 3 4 1 2 5 ``` 处理过程: 1. 1,2,3 加入内存(访问外存3次) 2. 4 加入时淘汰1(访问+1,内存:2,3,4) 3. 1 不在内存,加入时淘汰2(访问+1,内存:3,4,1) 4. 2 不在内存,加入时淘汰3(访问+1,内存:4,1,2) 5. 5 不在内存,加入时淘汰4(访问+1) 输出: ``` 6 ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

信奥源老师

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值