接下来,开始构建分类器:
生成的WordCount是一个字典.键值对的形式 这里的键是某一个单词,对应的值是该单词的个数
图像化查看一下原始数据
,这里我们取出第一个商品的评价
抽取评价数量最多的商品,这里叫做Vulli Sophie根据评分进行分组可视化
说明,我们要构建我们的情感分类器,我们可以从上图中看见,评分有1,2,3,4,5,但是3代表的是中立,即不喜欢不讨厌.这一部分我们可以把它去掉,因为我们的情感分类器只是需要判断某一评价是正面还是负面,
正面:4,5分的评价 负面:1,2分的评价 去掉3分的评价
过一会儿,我们的模型就训练好了
得到模型之后,就可以开始测试我们的模型
预测评估
根据概率列排序
查看最高评价的语句
查看最差评价;
有兴趣的小伙伴可以尝试翻译一下,看到底是不是好差评价呢