此次疫情的爆发让更多数据应用场景被人们看到并重视起来。信息技术变革的重点从来不应该只在“T”(技术)上,现在是时候把聚光灯打向“I”(信息)上了。

同理,借助清博舆情系统,对全网公开的数亿量级舆情数据进行分析,我们也能挖掘到冰山下更大的价值。

 

01

借助亿量级“新冠肺炎”舆情数据,追踪政策实施效果

 

(1月1日至3月8日,全网“疫情”相关信息总数趋势图)

 

借助清博舆情系统,以“疫情”为分析关键词,我们得到了以上2020年1月1日至2020年3月8日全网信息总数及趋势图,其中总数达亿量级,覆盖了新闻媒体报道、微信、微博、论坛、短视频平台等各个平台。从图中,我们可以看到自1月20日起,全网信息总数获得明显增长。也是在这一天,国家卫健委高级别专家组组长钟南山院士在接受采访时明确表示:此次新型冠状病毒感染的肺炎,存在人传人的现象。

舆情信息与疫情发展二者之间,有着明显的相关性,这预示着通过网络舆情信息来研究疫情发展态势是可行的。

以“口罩紧缺”为分析关键词,可以看出自2月14日起,信息总数呈现逐步下降趋势。对比政策发布,2月10日起,全国各地陆续迎来复工小高潮,交通、生产、原材料的恢复,一定程度上有效缓解了口罩的紧缺现象。

(以“口罩紧缺”为关键词,得出全网舆情数据分析图)

 

(以“疫情+复工”为关键词,得出的全网舆情数据分析图)

 相关企业机构同样可以利用清博舆情系统,通过设置“政策+地区”等关键词,查看政策发布前后,全网舆情的变化情况。以验证政策带来的实际效果和及时了解民众的最新反馈。

 

02

多角度分析舆情信息,加强疫情发展趋势研判

一般而言,如果传染数量增加和传染范围扩大,预示着疫情发展越来越糟糕。相应的舆情数量会更多,也多表现为悲观情绪。反之,随着疫情减少,相关舆情数量也会逐减少,也会逐渐更多地表现为乐观情绪。

以“疫情+城市”查询为例,清博舆情系统对全网相关舆论信息自动进行了“中性”“负面”“正面”的情感属性分类,当地政务部门可及时、直观地了解当地民众的感情反应,为后续的政务服务工作提供数据指导。

(1月1日至3月8日,某地“疫情”相关信息情感占比图和趋势图)

另外,根据清博舆情系统,我们发现新型肺炎疫情和网络信息舆情的地理分布,这两者之间存在一定的相关性。同时也可以看出,舆情信息最多的地方其实并不是疫情最严重的地方,而是北京市、上海市和广东省这样的一线省市。

造成这一现象的原因可能有两方面:一是在疫情非常严重的地方,人们可能更加关注身边疫情的发展和防治措施;二是也与当地的网络媒体发展程度有关。

 

(1月1日至3月8日,“疫情”相关舆情信息发布地区及提及地区排名情况)

 

03

热门主题词可视化分析,洞悉大众潜在需求

热点事件来临时,人们习惯了只关注全网最热门、声量最高的资讯,然而热点背后潜在信息的挖掘,有时候意义更大。

以“移动办公”为关键词,在对全网1月20日至3月8日的资讯进行分析后,我们得出一张词云图:可以理解为,大家在谈到移动办公这个场景的时候,同时还提到了哪些词。从图中可以看出,除了手机、电脑、华为等一些OA场景常见的关键词,还同时有“动力”“发动机”“座椅”“车身”等与汽车息息相关的词汇。透过这些词汇,我们发现某车企上新了一款主打可移动办公与会议展示的商务巴士。当下移动办公火热的背景下,紧抓趋势在全网大规模发布了相关文章。

从移动办公到OA系统再到新车发布,从重大政策发布到小众情绪表达,充分利用好热门主题词可视化分析功能,大家都可以深度挖掘背后的隐藏机遇。

(1月20日至3月8日“移动办公”全网舆情热门主题词词云图)

 

04

NLP技术实时分析情感属性,及时采取应对举措

重大公共事件面前,无论是对企业运营管理还是政务开展效率,都是一种巨大的考验。尤其在公开的网络环境中,某些类型的情绪表达往往会动态的影响到更多人,将影响扩大。如何及时识别、接收并量化某事件的情感属性是舆情分析中的难点,也是重点。一方面这些情感属性数据可以及时提醒我们该做点什么了,一方面也可以对所采取得行动的效果做直观的评估。

 将某企业一款移动办公软件名称设为关键词后,我们发现,自2月10日全国各企业学校陆续线上复工复学后,网民对该产品情绪以赞扬、喜悦为主,但同时前期也面临着些许厌恶和悲伤的情绪。2月16日,大约一周后,负面情绪开始逐渐下降。我们翻阅了各平台该产品的花样“致歉”素材,时间恰好集中在2月16日前后。直观量化的情绪走势图也让各种决策的下发和评价有了数据支持。

(1月20日至3月8日某品牌全网舆情情绪走势及情绪分布图)

 理解各种情绪可能对人类来说是一件简单的小事,但语言表达中的细微,如讽刺、成语等对计算机来说却是个大问题。得益于数据量和项目实践优势,清博团队在2019世界人工智能大会黑客马拉松(WAIC)AutoNLP大赛中取得第三名的好成绩,同期还在第18届中国计算语言大会CCL2019中文幽默比赛和互联网虚假新闻检测2019全球挑战赛中双双取得第一名的优异成绩。

 

05

浪里淘金,自动筛选重要热点资讯

还是以疫情期间的复工为例,虽然各企业都想着早点复工早日恢复经营,但 “中小企业扶持政策”“办公环境防护要求”“行业上下游发展现状”等一些国家、地方的重要政策及要求切不可忽视。

数百万资讯海洋中,如何快速准确找到你需要的信息呢?清博舆情系统提供了如下两个解决方案:①依靠大数据技术系统自动筛选“热门文章”,用户只需要点选平台类型即可一键查收。②根据信息来源自动进行媒体分类,用户自主根据查询需要,查看各级媒体平台内容。

(2月29日至3月7日,全网“复工”相关舆情信息中热门文章)

(2月29日至3月7日,全网“复工”相关舆情信息网页端各媒体分布占比图)

此次疫情期间,为让大家更方便实时查看全网舆情信息发布及趋势情况,我们也在移动端同步上线了“疫情全网分析传播”页面,舆情系统官网扫描二维码即可到达。

(清博舆情系统官网-移动端疫情传播分析入口示意图)

 数据科学家维克托·迈尔·舍恩伯格曾经说过:信息技术真正的革命并不在于分析数据的机器,而在于数据本身和我们如何运营数据。除了以上介绍的清博舆情产品,我们也一直在充分发挥自身数据和技术优势,在移动端上线了“疫情防护”数据产品 “全国疫情实时数据”“防护用品生产企业查询”“患者同程查询”“防疫知识问答”“疫情谣言粉碎机”“疫情全网传播”“卫健委公号发布”“蔬菜合作社查询”等数十款数据产品,功能涵盖了“查、测、防、援、购、宣、辟、保”等8大关键维度,基本覆盖了疫情防护工作的各个环节,并且所有产品均提供免费的API接口。

 欢迎有清博舆情系统试用及数据产品接入需求的伙伴与我们联系,以下为清博舆情系统试用群二维码,请有试用需求的童鞋扫码入群,本群需实名备注,且仅限200人(试用名额有限),非诚勿扰哈。