摘要:
针对Web数据采集技术进行了介绍,分析了Web数据采集技术在将非结构化数据转换为结构化数据方面的优势:速度快、准确性高。从HTTP协议层分析了Web数据抓取的原理,并重点介绍了如何实现基于Python的Web数据采集方案。Web数据采集系统可以分为:HTTP交互和数据解析两个模块。
中图分类号:
齐鹏,李隐峰,宋玉伟. 基于Python的Web数据采集技术[J]. , 2012, 25(11): 118-.
QI Peng,LI Yinfeng,SONG Yuwei. Research on Python-based Web Scraping Technology[J]. , 2012, 25(11): 118-.