试题详情

在分类问题中,我们经常会遇到正负样本数据量不等的情况,比如正样本为10万条数据,负样本只有1万条数据,以下最合适的处理方法是?(难度:★★★★)

A将负样本重复10次,生成10万样本量,打乱顺序参与分类

B直接进行分类,可以最大限度利用数据

C从10万正样本中随机抽取1万参与分类

D将负样本每个权重设置为10,正样本权重为1,参与训练过程