摘要:
结合大数据的特点,提出以标签云改进方案来快速识别网络热搜词,同时考虑到传统的数据仓库在查询、存储结构化数据方面的优势,在目前学者提出的数据仓库与Hadoop平台结合的基础上,提出了协作模式中与以往不同的数据迁移方式,即使用数据中间件,并通过相同数量记录导入Hadoop的时间比较,得出文中所提的数据迁移方法较Sqoop方法更具优势的结论。
中图分类号:
孙红,郝泽明. 大数据处理流程及存储模式的改进[J]. , 2015, 28(12): 167-.
SUN Hong,HAO Zeming. Research on Processing and Storage Mode of Big Bata[J]. , 2015, 28(12): 167-.