摘要:
针对目前垃圾短信过滤效果有待提高的问题,提出一种新的短信特征提取方法。该方法采用了建立在深度学习理论基础上的最新成果和Word2vec工具。基于中文短信的内容和结构特点,利用该工具设计了一个短信向量化算法。该算法能有效地将每条短信与一个向量对应,在深度置信网络上利用该算法对垃圾短信进行分类实验。实验结果表明,推广性能比已有报道结果提高了约5%。
中图分类号:
王贵新,郑孝宗,张浩然,张小川. 基于Word2vec的短信向量化算法[J]. , 2016, 29(4): 49-.
WANG Guixin,ZHENG Xiaozong,ZHANG Haoran,ZHANG Xiaochuan. An Algorithm for Vectoring SMS Based on Word2vec[J]. , 2016, 29(4): 49-.