前景提要
假定我们有如下的对象: Dataset trainset; Dataset testset; // 通过随机演化的方法,可以得到一个模型 (以 score 作为筛选条件) Model model = evolve(trainset); // 一个模型可以在一个数据集上跑出一个分数 (score) int score1 = run(trainset, model); int score2 = run(testset, model);
运行时发现,score1 异常地高,而 score2 异常地低。看起来存在严重过拟合。请问需要如何调整设计来避免过拟合呢?