试题详情

下列哪些是TF-IDF的缺点()。

A字词的重要性随它在文件中出现的次数成正比

B将一些生僻字误当作文档关键词

C只考虑特征词和文本之间的关系,忽略了一个特征项在不同类别间的分布情况

D没有考虑特征词的位置因素对文本的区分度