写在开头 豆瓣上有着大量的影视剧的评论,所以说,要是想要实现对广大人民群众的观点的分析,对一部片子的理解,综合来看大家的评论是很有必要的.而短评作为短小精干的快速评论入口,是值得一谈的. 所以先要实现对其的数据的爬取. 目前来看,基本内容是可以爬取的.最大的问题在于速度.后续考虑准备运用多线程的方式处理下.以及可以尝试其他提速的方法. 下面是这个程序的构思编写过程. 构思准备 爬取的思路,及反省与思考 盲目状态 最初,并不知道豆瓣对于未登陆用户的限制,盲目的爬取,看着评论文件,发现行数太少,也就