摘要:
针对χ2统计特征选择方法的两大局限:对低文档频的特征选择不合理,以及过分强调那些在指定类低频出现,而在其他类中高频出现的特征项在该类中的权重。提出基于类别比例因子与类内均分度的χ2统计特征选择的改进方法。实验结果表明,改进方法的分类效果优于传统方法。
中图分类号:
张瑜, 张德贤. 基于类别比例因子和类内均分度的χ2统计改进[J]. , 2010, 23(12): 70-72.
ZHANG Yu, ZHANG De-Xian. Improvement χ2 of Statistics Based on the Category Scale Factor and Average Distribution Inner Category[J]. , 2010, 23(12): 70-72.