一、bug
1、pre-tokenize的时候, 会OOM
解决:在yaml文件中添加streaming参数
# tokenize
streaming: True
max_steps: 10000
streaming: bool = field(
default=False,
metadata={"help": "Enable dataset streaming."},
解决:在yaml文件中添加streaming参数
# tokenize
streaming: True
max_steps: 10000
streaming: bool = field(
default=False,
metadata={"help": "Enable dataset streaming."},
1403
1380

被折叠的 条评论
为什么被折叠?