彩票走势图

用数据全方位解读《欢乐颂2》

转帖|行业资讯|编辑:我只采一朵|2017-06-01 11:26:42.000|阅读 227 次

概述:正所谓“外行看热闹,内行看门道”,作为数据分析爱好者的笔者,自然想从数据的角度去解读这部热播剧的方方面面,包括舆情传播、网络口碑、人物社交网络分析及,以及小说内容的文本分析。

# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>

作为数据分析爱好者,本文作者将想从数据的角度去解读《欢乐颂2》这部热播剧的方方面面,包括舆情传播、网络口碑、人物社交网络分析及,以及小说内容的文本分析。

5月11日,让众多安迪粉期待已久的《欢乐颂》第二季终于播出。相比首季,《欢乐颂2》在造型和场景上显得更为精致时尚,且其中每个角色的造型却都是遵从的其身份和背景,并不突兀。

在笔者进行分析的过程中,会用到一些常用的(大)数据分析工具,以及环环相扣的数据分析讨论,虽然对于常规的数据运营并无直接的帮助,但“他山之石,可以攻玉”,分析的思路却可以作为参考,以期应用到其他实际的场景中。

1 《欢乐颂2》的大数据舆情分析

在第一部分中,笔者选取了2017.05.07~2017.05.29期间关于《欢乐颂2》的全网舆情数据作为数据分析对象,利用新浪微舆情的“信息监测”和“全网事件分析”作为数据采集、数据分析和可视化的工具。

以下分别从《欢乐颂2》的全网传播概况及传播趋势两方面进行分析。

1.1《欢乐颂2》的全网传播概况

(1)全网传播走势

上图是《欢乐颂2》在这段时间内信息传播走势图,自开播之日起,该剧的全网声量出现了明显的提升,而且里面出现了几个信息传播的“波峰”,说明当日全网关于该剧的讨论(包括媒体和网民个体)较多。尤其需要注意的是,本剧开播当日(5-11)的波峰峰值是该时间段内最大的一个,这是不是一个巧合呢?不要急,笔者会在后面为各位小伙伴解开谜底。

(2)全网正负面信息占比

从上图中可以看到,这段时间内,全网关于《欢乐颂2》的信息量有5,564,016条,其中负面信息的占比达到152,315条,占到总信息量的2.74%。

同时,在总体上,负面信息随着时间的推移又不断增长的趋势。

结合二者来看,如此这般的负面信息占比和发展情形对于该剧来说不太有利,说明全网关于该剧的负面口碑评价比较显著,需要引起制片方的重视,笔者会在接下来的分析中,探明到底出现了哪些负面口碑,以及它们出现的原因。

(3)全网关注度来源

因为在影视剧的传播声量中,微博这块占据较大的比重,所以笔者在排除微博这一信息来源后,对余下的信息来源TOP10进行了统计,如下图所示:

从上图可以看出,除开微博外,微信、今日头条这两大社会化媒体平台上关于本剧的信息量贡献最多,尤其微信在近日推出了「微信实验室」,通过新增加的“搜一搜”和“看一看”这两个入口,使用户能够主动搜索关键词,能够浏览热点资讯、好友关注的资讯以及自己感兴趣的文章,这样的动作加上数年的优质内容沉淀,使得微信在社会化媒体内容生产方面的重要性日渐突出。

(4)全网信息地域分布

 有点意外,全网关注度(关于这部剧的全网信息量)排名榜首的是江苏,竟然不是北京和上海这两大年轻白领云集的现代化的都市,尤其是上海,关于本剧的信息量分布在TOP10中垫底,难道上海的网民和媒体绝大部分都弃剧了?或者说是本剧的口碑极差?

对于此种疑问,笔者将会在第二部分进行分析。

1.2 人群画像

因为关于本剧的探讨,微博(主要是新浪微博)占据大头,所以笔者选取该平台上的人群作为分析对象。

(1)  性别分布

毫无疑问,女生是该剧的忠实拥簇,他们对该剧的狂热绝对超过男生。

(2)  年龄分布

从下图中可以看出,19-34这个年龄区间占据关注人群的70%左右,也就是说青年群体对该剧很感兴趣。

(3)  兴趣图谱

 下图给出了关注该剧的人群的兴趣标签TOP5,可以看出,这部分人群比较追星,热爱生活,都是一些极具年轻人特质的兴趣爱好。

 

(4)用户情感状态

根据关注《欢乐颂2》的微博用户给自己打的情感类别标签,可以得知此类用户的情感状态分布情况:

由此可以看到,大部分用户(80.75%)处于情感空白/开窗期(“单身”和“求交往”状态),再次是“恋爱中”,结合前面的年龄分布,说明关注人群大都是未婚青年。

(5)用户学历分布

毫无疑问,这类都市情感剧的受众以受过高等教育的人群为主,因为该剧讲述的是高学历白领在大城市工作生活和恋爱的故事。

(6)用户城市类型

有点出乎意料的是,4线及以下城市的关注人群所占比重最高,为30.26%,其次是2线和3线城市,而一线城市的关注人群则仅为14.41%,难道是一线城市的人群对本剧比较挑剔?

结合前面的信息地域分布,关注《欢乐颂2》的主体是一群热爱生活、热衷于追星的高学历青年女性,她们生活在一线城市开外,情感状态多为单身。

 

2 《欢乐颂2》的豆瓣口碑分析和小说文本分析

一般来说,对于文本的深入挖掘往往能实现“知其然并知其所以然”的效力,因为文本不像数字那般空洞和抽象,内容往往能直接揭示出原因。

这部分的数据主要有:

  • 《欢乐颂》第一季和第二季的豆瓣影评
  • 《欢乐颂》第一季和第二季对应的原著小说,《欢乐颂2》的剧集将把后两季的小说内容进行打包拍摄,所以第二、第三季的小说内容都会出现在《欢乐颂2》的剧情里

豆瓣电影是中国最大与最权威的电影分享与评论社区,收录了百万条影片和影人的资料,有2500多家电影院加盟,更汇聚了数千万热爱电影的人,因而这里关于影视剧的评论具有一定的代表性和公信力,可以在很大程度上反映一部影视剧作品的口碑状况。所以,笔者抓取豆瓣上《欢乐颂》一二季的影评作为口碑分析的依据。

2.1《欢乐颂》一、二季的总体口碑对比分析

(1)评价星级

从总评分来看,《欢乐颂》第二季要明显逊色于第一季,前者拿到了7.3的高分,而后者仅获得了5.2的评分。

从第一季和第二季的评价星级占比可以看出,出现第二季总评分低于第一季的原因在于:第二季在中高分区间“4星”和“3星”中的占比要小于第一季,而在低分区间“2星”和“1星”中的比重要高于第一季。

(2)《欢乐颂2》的豆瓣影评情感倾向分析

由于第一季的口碑要好于第二季,所以笔者接下来着重分析一下第二季的豆瓣影评的“情感倾向”。

这里的“情感倾向”是以一个介于0~1之间的“情感极性值”来表征—如果某条评论的情感极性值越接近于0,说明它的负面情感倾向越明显,越接近于1,说明它的正面情感倾向越明显,而取值在0.5左右徘徊,这说明这种情感倾向不明显,是为“中性”。笔者将情感倾向值的取值区间0~1细分为3个子区间,分别对应不同的情感倾向:

豆瓣影评具有独特的语言风格—反讽,贬义褒用,不像商品评论那般直白外露,它的语义往往含蓄且幽默。所以在分析之前,笔者找到大量有标注的豆瓣影评语料,利用机器学习进行情感语义模型训练,以期达到良好的情感正负面判断效果。初步结果如下:

经情感倾向标签映射处理,得到如下结果:

从上图可以看到,第一季和第二季的情感倾向的最大差异在于正负面情感的比重不同:第一季的评论正负面情感占比旗鼓相当,而第二季的负面情感明显占据主导地位,正面占比大幅压缩,这也是本剧豆瓣评分不高的原因之一。

再看一下情感倾向随时间发展的走势情况,笔者选取的分析时间段是3.31~5.22,也就是该剧播出前一个多月和播出后一段时间的情感倾向走势。这里采用的是情感倾向值累加的数值,越高说明口碑评价越好,这也兼顾了评论数量上的增减情况(豆油愿意参与评分,哪怕是负面评分,也说明对本剧有一定的关注度)。由此得到下图:

可以看出,在本剧播出次日,情感倾向值达到高峰,随后一路下降,结合这段时间内的总体情感倾向占比可知,豆油们对于该剧播出后的剧集的关注度和口碑评价都呈现出下降的趋势。

那么,究竟是什么原因让广大豆油们对该剧如此嫌弃呢?请接着往下看。

 

(5)“五美”人物点评词云

综合豆油们关于《欢乐颂》第一季和第二季关于剧中“五美”的评论,笔者制作出安迪、曲筱绡、樊胜美、关雎尔和邱莹莹的个性化评论关键词词云。

不消笔者多说,小伙伴们就能看出这些人物关键词词云,主要反映了豆油们对于“五美”的人物印象及其主要的关联人物。对于这五个人的性格特征,由上述关键词词云可以总结为:

  • 外冷内热、气场强大的冰山御姐——安迪
  • 古灵精怪、魅力超群的小妖精——曲筱绡
  • 虚荣拜金、独立自强的骄傲女王——樊胜美
  • 文静内敛、一团和气的优质女孩——关雎尔
  • 单纯可爱、精力充沛的元气少女——邱莹莹

原文很长,如有需要请点击阅读原文


标签:

本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@pclwef.cn


为你推荐

  • 推荐视频
  • 推荐活动
  • 推荐产品
  • 推荐文章
  • 慧都慧问
扫码咨询


添加微信 立即咨询

电话咨询

客服热线
023-68661681

TOP