如何标注表格中的一些缺失数据?
在表格中重新标注。
检查缺少的数据类型。有两种情况,一种是设计中可以忽略的缺失数据,一种是设计中不可忽略的缺失数据。
明确设计中不可忽视的两类缺失数据,已知情况:工艺因素导致的缺失。有限的数据披露;没有完成调查问卷;受试者在选择时犯了错误(疾病等)。).未知情况:直接由主体原因造成。例如,受试者拒绝回答一些问题。
检查数据缺失程度的统计比例,以及每个案例在所有变量中的缺失比例;每个变量数据缺失的病例比例;在所有变量中没有遗漏病例比率。
确定数据缺失程度的标准。缺失率小于10%,使用任何缺失数据处理方法差别不大,但不包括非随机缺失。对缺失项过多的情况或变量的简单处理——删除;缺失率超过15%的变量可以考虑删除,但缺失率更高(20%~30%)的变量通常会被补救。