西安电子科技大学学报 ›› 2016, Vol. 43 ›› Issue (4): 51-56+62.doi: 10.3969/j.issn.1001-2400.2016.04.010

• 研究论文 • 上一篇    下一篇

微博个性化转发行为预测新算法

唐兴1;权义宁1;宋建锋1;邓凯1;朱海2;苗启广1   

  1. (1. 西安电子科技大学 计算机学院,陕西 西安  710071;
    2. 周口师范学院 计算机科学与技术学院,河南 周口  466001)
  • 收稿日期:2015-04-20 出版日期:2016-08-20 发布日期:2016-10-12
  • 作者简介:唐兴(1988-),男,西安电子科技大学博士研究生,E-mail:tangxing@stu.xidian.edu.cn.
  • 基金资助:

    国家自然科学基金资助项目(61472302,61272280,U1404620,41271447);教育部新世纪优秀人才支持计划资助项目(NCET-12-0919);中央高校基本科研业务费专项资金资助项目(K5051203020,JB150313,JB150317,K5051303018,BDY081422);陕西省自然科学基金资助项目(2010JM8027);西安市科技局资助项目(CXY1441(1));地理信息工程国家重点实验室开放研究基金资助项目(SKLGIE2014-M-4-4);NSFC-广东联合基金(第二期)超级计算科学应用研究立项和国家超级计算广州中心资助项目;模式识别国家重点实验室开放课题基金资助项目(201600031)

Novel algorithm for predicting personalized retweet behavior

TANG Xing1;QUAN Yining1;SONG Jianfeng1;DENG Kai1;ZHU Hai2;MIAO Qiguang1   

  1. (1. School of Computer Science and Technology, Xidian Univ., Xi'an  710071, China;
    2. School of Computer Science and Technology, Zhoukou Normal Univ., Zhoukou  466001, China)
  • Received:2015-04-20 Online:2016-08-20 Published:2016-10-12

摘要:

目前,对微博转发行为预测主要是对所有微博用户的历史数据进行学习,从而得到转发模型.但是这类模型需要对所有用户的转发行为进行全局预测,存在同质性且无法对具体用户进行个性化预测的缺陷.针对这些问题,提出了基于多任务学习的个性化微博转发行为预测算法.对新浪微博进行了数据抓取、分析和特征选择,根据社会学中影响力的理论,针对微博用户之间进行社交信息交流而导致相互影响的特点,引入了多任务学习方法,以逻辑回归预测模型作为基准算法,将预测模型分为全局模型与个性模型进行学习.预测模型把对每个用户转发行为的预测对应为多个任务,根据微博用户间的社交交互对这些任务进行关联.实验结果表明,所提出的模型能够有效地对单个用户的微博转发行为进行预测,并且提高了转发行为预测的准确率.

关键词: 多任务学习, 个性化, 转发行为, 社交网络, 微博, 数据挖掘

Abstract:

Recently, models for predicting the user retweet behavior are based mainly on the historical retweet data of all users. However, these models are of homogeneity and could not predict a particular user's behavior. To overcome these problems, we propose an algorithm for predicting personalized retweet behavior. Based on crawled Weibo data, we have conducted an analysis and a selection of retweet features. According to the influential theory, we introduce the multi-task learning framework to divide the tasks into common global tasks and many individual tasks. Our massive experiments show that our algorithm is effective in predicting personalized retweet behavior.

Key words: multi-task learning, personalization, retweet behavior, social networks, microblog, data mining