论文样本量太小会怎样?

会导致过度拟合。

本文中样本过少会导致过拟合,为了得到一致的假设,使假设过于复杂,称为过拟合。想象一下,一个学习算法产生了一个过拟合的分类器,它可以100%正确地对样本数据进行分类(也就是说,如果你把样本中的文档给它,它永远不会出错),但仅仅是为了正确地对样本进行分类,它的结构如此复杂,规则如此严格,以至于任何与样本数据略有不同的文档都被认为不属于这个类别。