【学无止境，信息学奥赛】NOI常见技术问题整理-CSDN博客

本文链接：https://blog.csdn.net/ciflame/article/details/148754348

1 系统配置情况
NOI Linux 2.0 是基于 Ubuntu 20.04 LTS 定制而成的系统，为 64 位系统。
系统内自带 g++ 编译器，版本 9.3.0（编译时如果未指明语言标准，默认采用 C++14 标准），另外有
Python 2.7 和 3.8，虽然 Python 并非竞赛语言，但可以使用 Python 编写一些辅助性程序（如数据生
成器，对拍器等）。
评测时，程序使用的内存大小按声明的内存空间计算。开过大的全局数组会导致所有测试点 MLE 而获得零分。
IDE 有 Code::Blocks，Geany。
编辑器有 VS Code（安装了 C++ 扩展，但组件不完整，另外无简体中文翻译包），Vim，Emacs，
gedit，Sublime Text 3 等。

2 NOI 技术规范摘抄
将现有的技术规范简单整理后做了份简明，方便理解的版本。后文提到的不少内容都可以在该规范中找到对应的要点。

对于一道题目，选手只应该提交一个扩展名为 .cpp 的源文件，且其大小不应超过 100 KB，不应
使用自己编写的头文件。（2022 年起全部 NOI 系列赛均只能使用 C++ 语言）
选手程序应正常结束， main 函数的返回值为 0。
选手程序不应执行如下违规操作：
试图访问网络
使用 fork、exec、system 或其它线程/进程生成函数
打开或创建题目规定的输入/输出文件之外的其它文件和目录
运行其它程序
改变文件系统的访问权限
读写文件系统的管理信息
使用除读写规定的输入/输出文件之外的其它系统调用
捕获和处理鼠标和键盘的输入消息
读写计算机的输入/输出端口
在不违反 3 的前提下，选手可以自由使用以下划线开头的宏和函数。
禁止使用内嵌汇编。
禁止更改评测时使用的编译选项。

3 我能在代码中使用…吗？
bits/stdc++.h ：可以使用。
需要注意这样会将所有头文件引入，会增大标识符冲突的风险。如何解决这一问题见后文。
#define int long long ：不推荐。一方面，标准指出，不能对关键字进行 #define 操作，否
则行为未定义；另一方面，从语义上说， int 在标准中代表 32 位整数类型，将其强行赋予 long
long 的含义会造成认识上的混淆（例如，使用 scanf 和 printf 的时候可能搞错使用 %d 还是
%lld ）。
如果觉得 long long 太长的话，可以用 using 语句或 typedef 语句给其赋予一个较短的
别名，例如 using i64 = long long ， typedef long long i64 等。
__int128 ：现在的系统是 64 位系统，因此可以使用。需要注意的是 __int128 并不能直接使用
cin/cout，scanf/printf 进行输入输出，需要手写输入输出函数（类似于快读快输）。另外使用
__int128 真的就能完全避开高精度吗？
ios::sync_with_stdio(false) ：可以使用。但需要注意：
关闭流同步后不应混用 C 风格 IO（ scanf/printf/getchar/putchar 等）和 C++ 风格
IO（ cin/cout 等）。
推荐在程序最后刷新缓冲区（原因见后文）。
fclose() ：没有必要。程序结束时的清理工作包括关闭输入输出。
如果关闭了流同步，在没有刷新缓冲区（ std::endl 等）的情况下应用 fclose() ，可能会
导致程序没有输出！
fread() ：可以使用。
__gcd() ， __builtin_clz() 等一部分下划线开头函数：可以使用（因为没有被禁止的操
作）。
标准库函数 gcd() 在 C++17 标准中被加入。
gets() ：因为存在缓冲区溢出的问题，已经于 C++11 中被弃用，C++14 中被废除。可以使用
fgets() 替代。
itoa() ：不是标准库中的函数。是否能使用取决于 NOI Linux 环境下能否正常编译。
在代码中手动开启 -O2 等优化选项：不可以。评测时只能按照 PDF 首页给出的编译选项编译程
序，擅自更改编译选项属于违例。
指令集：不可以。理由同上。
exit(0) ：与 main() 函数最后 return 0; 效果一致，因此可以使用。
标准规定，即使 main() 函数最后不显式写 return 0; ，不影响程序正常退出时返回零值。
pb_ds ：可以使用（有人发邮件询问过）。
无序关联式容器：C++11 起可以直接使用。需要注意它们的最坏复杂度是线性的。
基于范围的 for 循环：C++11 起可以使用。
auto 类型说明符：C++11 起可以使用。
std::tuple ：C++11 起可以使用。
std::array ：C++11 起可以使用。
结构化绑定：C++17 起可以使用。是否能使用取决于 NOI Linux 下环境下能否正常编译。
多线程：不能使用。
register ：C++11 起被弃用，C++17 起被移除。因此 C++11 后使用它不会造成任何优化效果。
列表初始化：C++11 起可以使用。需要注意的是 Windows 下部分编译器在使用 C++11 以前标准
编译使用列表初始化的程序时，只给出警告而无错误。更推荐的做法是使用构造函数。
随机函数：没有限制。但 random_shuffle 已经于 C++14 起被弃用，C++17 起被移除。C++11
以后可以使用 shuffle 函数替代。另外有关随机化造成的评测结果波动引发的申诉，按规定将不
被接受。
需要注意，Windows 环境下的 rand() 返回 16 位整数（0 \sim 2^{15}-1），Linux 环境下
的 rand() 返回 32 位整数（0 \sim 2^{31}-1）。

4 比赛系统的使用
考虑到有不少选手不熟悉 Linux 系统，还有不少地方仍然使用 Windows 作为比赛环境，因此特开辟一
个板块，讲解 Linux 与 Windows 的相关使用技巧。
有关 Linux 和 Windows 下命令行使用的相关技巧，OI Wiki 讲述得非常详细，这里主要是介绍命令行
使用以外的一些注意事项。
4.1 更改栈空间
一般来说，评测时的栈空间限制等于内存限制。但系统默认的栈空间往往较小，有时会出现官方评测时正常运行，而本地测试时爆栈的情况。这时候就需要对栈空间进行更改。
在 Linux 系统下，由 ulimit 对程序使用的资源进行限制。
在终端下输入 ulimit -s 可以将栈空间更改为 num KiB（如 ulimit -s 262144 可以将栈空间改为256 MiB）， ulimit -s unlimited 可以将栈空间改为无限制。 ulimit -a 可以查看各项资源的限制情况。
ulimit 还能对 CPU 时间（ -t ），内存（ -v ）等资源进行限制，调整限制的方法与调整栈空间限制的
方法相似。
需要注意的是， ulimit 对包括栈空间在内的资源限制的配置仅在当前终端下有效。
对于 Windows 系统，栈空间在程序编译时确定，准确来说，由连接器来处理栈空间的大小问题。在编
译时添加如下参数 -Wl,–stack= 可以将栈大小改为 num Byte（如 -Wl,–stack=268435456 将栈空间确定为 256 MiB）。
如果使用 Dev-C++ 编写代码的话，点击“工具”一栏下的“编译选项”，在弹出的编译选项设置对话框中选择“编译器”一栏，在“在连接器命令行加入如下命令”下的文本框添加上述编译参数（添加时记得和已有的编译参数之间用一个空格隔开），就能在编译时实现同样的效果了。
4.2 Windows 下查看样例文件
一般情况下，考场下发的样例文件是 Linux 格式的（换行为 \n ），而 Windows 下的换行为 \r\n ，
因此如果在 Windows 下用记事本打开样例文件，因为无法正确识别换行的原因，样例会无法正常显示
（可能表现为无换行，换行符被黑矩形字符代替等）。
使用 VS Code 等高级编辑器可以有效解决这一问题（还能实现换行格式的转换）。当然如果没有提供VS Code 的话，也可以用系统自带的写字板。
当然这只是解决了显示问题，如果你尝试在写字板打开文件后，将输入直接复制到命令行，你可能会发现还是不能正常读入。正确的方法是在代码中添加重定向/文件流，或者在命令行中使用管道。
5 代码编写疑难解答
5.1 数组越界的检测
C++ 的原生数组并无任何数组越界的检查机制，越界访问属于未定义行为，可能会导致信息的意外修
改，访问被保护的内存导致程序非零返回值终止等结果。
数组越界如果不引发程序 RE，将会给调试带来非常大的麻烦。如果能在运行时检查此类错误，将会有效减少 FST 的发生。
好消息是， std::array 和 std::vector 都提供了实用的越界检查功能，使用 at(pos) 成员函数，
与直接使用下标运算符（ [pos] ）相比，会先进行越界检查，如果发现越界则直接终止程序。
不可避免地，使用越界检查功能会对程序效率有一定影响，这一点也请注意。
关于原生数组的运行时越界检测，在下一节“未定义行为的检测”会详细提到。
5.2 未定义行为的检测
（关于未定义行为的定义与示例，可以参考 [洛谷日报#265]关于 C++ 未定义行为的一些事）
在编译时打开全部警告（添加参数 -Wall ）可以捕捉一部分未定义行为，不过由于该过程在编译时进
行，并不是所有的未定义行为都能被检测出来。
如果使用 Linux 系统，且编译器版本较高（NOI Linux 2.0 可以使用！），可以使用 Sanitizer 实现运行
时未定义行为及内存错误的检测。
在编译时加入参数 -fsanitize=undefined 即可开启 Undefined Behavior Sanitizer。其会在运行时检测代码中是否出现数组越界，带符号整数溢出等未定义行为，如果有，则会输出错误信息。
需要注意的是， std::vector 的越界并不会被 Undefined Behavior Sanitizer 检测到，需要用前文提到的 at 成员函数来检测。
例如，下面是一个带符号整数溢出的程序：

#include <iostream>
using namespace std;
int main() {
int x = 2147483647;
x++;
cout << x << endl;
return 0;
}

运行后会得到如下输出：

a.cpp:5:4: runtime error: signed integer overflow: 2147483647 + 1 cannot be
represented in type 'int'

对于习惯使用指针的选手，Address Sanitizer 提供了一系列内存错误检测的手段，可以检测出解引用无效指针，空间重复释放等问题。在编译时使用 -fsanitize=address 即可开启 Address Sanitizer。
下面是一个解引用无效指针的程序

#include <iostream>
using namespace std;
int main() {
int *ptr = (int*)0x12345678;
cout << *ptr << endl;
return 0;
}

运行后得到的输出如下:

AddressSanitizer:DEADLYSIGNAL
=================================================================
==2613==ERROR: AddressSanitizer: SEGV on unknown address 0x000012345678 (pc
0x55fbd6ca12d8 bp 0x7ffc42bc00a0 sp 0x7ffc42bc0090 T0)
==2613==The signal is caused by a READ memory access.
#0 0x55fbd6ca12d7 in main /home/friend/a.cpp:5
#1 0x7fa1d8c380b2 in __libc_start_main (/lib/x86_64-linuxgnu/libc.so.6+0x270b2)
#2 0x55fbd6ca11cd in _start (/home/friend/a+0x11cd)
AddressSanitizer can not provide additional info.

Sanitizer 的使用会带来额外的时间开销，因此在测试程序运行效率时请不要使用 -fsanitize 系列选项。

5.3 标识符未导入 / 标识符冲突的解决方案
（该部分内容参考了 LCA 写的如何在不提供 NOIlinux 2.0 环境的考点避免编译错误，在此表示感谢！）
由于运行环境差异，在本机正常编译的情况下，评测环境可能会出现找不到标识符或标识符冲突的问
题。
一般来说，万能头文件 bits/stdc++.h 包含了 C++ 标准库的全部头文件，只需要在代码中包含该头文件，再加上 using namespace std; ，就能避免标识符未定义的问题。然而，这么做之后，就会将标
准库的全部标识符都导入到文件中，增大了标识符冲突的风险。
为解决标识符冲突问题，只需要将所有代码均包裹在一个命名空间（ namespace ）即可。

#include <bits/stdc++.h>
using namespace std;
namespace solve {
// 定义其他变量，函数和结构体类型
void main() {
}
}
int main() {
solve::main();
return 0;
}

依据“就近原则”，在 solve 命名空间中查找一个标识符时， solve 命名空间中定义的标识符较 std
中定义的标识符更先被找到，从而避免了标识符冲突。
解决了标识符冲突后，就可以放心大胆地使用万能头文件了。如果你不能记清楚所有的头文件的话，万能头文件确实是个不错的选择。
需要注意的是，即使不使用 using namespace std; 导入整个 std 命名空间，而是只使用 using
std::xxx; 导入部分需要的标识符，也不能完全避免标识符冲突。这是因为一些继承自 C 的头文件（文
件名一般是 c 加原头文件名，并去掉 .h ），为兼容需要，其中标识符不需要加 std:: 前缀仍然能访问。