A 不一致
B 重复
C 不完整
D 含噪声
对于未经过数据预处理的原始数据,存在的问题有
数据经过预处理,绝对无需再进行数据集成。
始业务数据来自多个数据库或数据仓库,它们的结构和规则可能是不同的,这将导致原始数据非常的杂乱、不可用,即使在同一个数据库中,也可能存在重复的和不完整的数据信息,为了使这些数据能够符合数据挖掘的要求,
经过一系列处理,在基本保持原始数据完整性的基础上,减小数据规模的是()
首页
每日一练
打赏一下
浏览记录