2020-04-01
数据分析
00

基于近三个月来豆瓣上官方禁言和网友发言之间的此消彼长,感觉豆瓣真的有可能忽然完蛋。豆瓣要完蛋,中文网络世界就真没啥吸引我的社交网站了。作为不太爱说话的老豆瓣儿,除了广播日记相册,很多年的书影音标记属于陪伴人生的珍贵资料,于是提早防备,用浏览器扩展「斗伴」把自己的豆瓣数据备份了一份。

获取到个人豆瓣数据,就可以搞搞分析。总共标记过的 907 部电影的评分,除去特殊原因豆瓣未给分数的6部,将其余 901 部的个人评分与豆瓣得分做了张散点图。

因为豆瓣电影评分采用十分制,而用户打分是五星制,将自评星数乘以2,得到自评分数为2、4、6、8、10不连续分数,对应图上自评分数只有五行。

标记电影的自评分数接近8分,还是相当高的。原因首先在于,找电影时会先参考豆瓣评分,低分的除非十分感兴趣或这被迫,否则不会去看。其次大概是总会找自己感兴趣的电影题材,个人喜好会对打分起到正向作用。

图中有很多点位置重合,所以分析不出不同得分段的电影数量。但很明确且有点极端的是,自评分数10的电影,全部大于等于豆瓣评分。而自评分数2的电影,全部小于豆瓣评分。也就意味着,我认为最好的就是最好的,最差的就是最差的,甭管别人怎么看。恩。。。怎么会这样。。。我以为我很中庸。

能分析出的结论就这些,有时间再搞。争取下次用 Python 做图,作为懒人,Excel 类做图真心没语言描述式做图舒适,在菜单栏找各种选项太难了。

本文作者:tsingk

本文链接:

版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!