(一)数据准备 1.爬取京东自营店kindle阅读器的评价数据,对数据进行预处理,使用机器学习算法对评价文本进行舆情分析,预测某用户对本商品的评价是好评还是差评.通过数据分析与模型分析,推测出不同型号(价格)的kindle具有的特征,并根据每种型号的特征向不同需求的顾客推荐.爬取的数据集中包括“评论”.“字数”.“评论的点赞数”.“评论的评论数”.“评论类型”五列,为了找出价值较高的数据.首先利用主成分分析的方法,将“字数”.“评论的点赞数”.“评论的评论数”作为输入变量,得到每条数据的权重,而