数据集的训练集和测试集划分 留出法(hold-out) 留出法,直接将数据集DDD划分为两个互斥的集合,其中一个集合作为训练集SSS,另一个作为测试集TTT,一般做法是将2/3~4/5的样本作为训练集,其余部分作为测试集; 在使用留出法时,一般采用多次随即划分、重复进行实验评估后,取平均值作为留出法的评估结果。 交叉验证法(cross validation) 交叉验证法,或kkk折交叉验证法(k-fold cross validation),先将数据集DDD划分为大小相似的kkk