信息爆炸的时代,从浩瀚的数据中挖掘信息远远不够,加强舆情信息的分析和趋势预测,从数据收集走向深度研判,这是大数据时代舆情管理的目标。8月16日,清博舆情系统震撼上线,完美地将大数据运用到舆情管理中,在危机预警及应对上实现了新的跨越,即日起免费全网试用。
第一招:舆情监测,唯快不破——
1秒响应,不能再多
网络世界里,一秒钟能发生很多事情。国外网站公布的调查数据告诉我们:“一秒钟内,网民使用谷歌搜索超5.4万次,发出推特6000到7000条,通过Ins分享729张照片,在YouTube上观看125406条视频,用Skype打出2177个电话,发出200万份电邮……”
互联网数据产生时效快,变动性强,涉及内容庞杂,与此同时,新兴平台的崛起,用户数量的激增也给舆情监测的更新频率和数据响应时长提出了更高要求。
如果一款舆情产品能做到秒级监测,政府机构和企事业单位使用时有了这样神奇的反应速度,一旦处置社会突发事件,每次都能够赶在媒体做出新闻报道前,知晓风险,就可以先于信息曝光而做到完备的危机预警,降低舆论产生的负面影响概率。
如今,清博舆情系统已经完美地具有了这一功能,不仅如此,在信息网络不断升级的技术变革下,这个速度还可以更快。
(按照时间降序,获取舆情监测事件
全平台秒级更新信息)
那么,过于求快,会影响舆情数据的全面性和精准度吗?在舆情系统开发过程中,技术和产品的同学们始终在思考这个问题,不会让它发生。还有,别忘了清博起家的资本就是大数据技术,在舆情系统上线前,清博大数据就收录了包括微博、微信、网站以及主源内容类APP的全平台账号、网页、站点,数据海量,并且全覆盖。
这些资源是构建现有舆情系统的强大基础。用PM2.5的秒级监测来打比方,目前最新的“PM2.5云监测仪”取样时间定义为秒,监测半径为1-2公里,如果换成清博舆情系统,那它的监测半径就是全平台(互联网无边界,监测即无边界),“PM2.5云监测仪”对环境的高频次取样是保证时效和信息量的关键,而清博舆情系统24小时不间断地实时数据抓取相较于前者,优势显然更为突出。
(清博舆情系统能对舆情事件进行
全天候24小时不间断的数据采集)
第二招:主观语言,客观分析——
终极目标,人工智能
舆情系统具备了风险预警的前提条件,用户如何才能理清网民表达的纷扰复杂的意见?这是产品面临的一大挑战。主观言论充斥个人情绪、包含语言艺术、暗合特定社会背景,这种考验综合分析能力的“文字游戏”是汉语言的特色,但也给舆情研判造成不小的麻烦。
那么,现有的技术能实现全文本解析的100%精确度吗?答案是目前还不能,只要人类语言还在进步,就不可能达到100%精确。清博舆情系统在多轮测试迭代过程中,除了使用通行的理论研究标准对文本进行层级划分,比如使用巴斯模型对社交媒体,即微博、微信进行舆情演化机制探究,把对舆情事件发表评论的归为“创新者”,把转发文章或评论的归为“模仿者”,分辨出舆情事件传播过程中的焦点文本、热门信息、原创与否。国外经典文本处理、分析模型有很多种,但在中文表述的特殊性影响下,靠机器完全解析网络语言还有很长的一段路要走。
(清博舆情系统能采集全平台网民
对事件的热门评论,直达社情民意)
为尽量减小这一问题对舆情产品功能的影响,清博舆情系统采取的办法是不断扩充词库含义范围,对算法精益求精。同时,清博研究院作为清博舆情专家团队,也会定期向清博舆情产品项目补充舆情词库、增加分析维度,因此清博舆情系统并不是一蹴而就的,即使上线,产品功能仍会继续升级更新。
“从近代的发展来看,汉语就没有纯洁过,因此网络语言是一种发展趋势,我们无法阻挡。一种新兴语汇的流行不是少数人能够决定的,而是多数人的广泛传播和使用,且这种传播是不可阻挡的。”既然网络语言进一步发展的趋势无可阻挡,那么清博舆情系统自然也不会停下对终极目标的追求——人工智能,让产品模拟人类思维。很多人会质疑,可马云爸爸都说了:“梦想还是要有的,万一不小心实现了呢?”
第三招:需求不一,定制专属——
解析话语,重建体系
想了解舆情产品的用户需求,首先应该确定谁的需求最迫切。从古代溯源,舆情监测基本都是地方小官分内之事,各级地方官收集本地大小事件信息逐级上报中央,最终形成邸报,是一项系统正规的舆情监测方式,侧面反映的正是执政者对舆情的迫切需求,“居庙堂之高则忧其民”,即使到了现代,政府部门仍旧对舆情十分重视,但在舆情管理方面,尤其是网络舆情,仅靠人工显然是力有未逮。
除了政府部门,企业的舆情需求同样迫切。7月14日,江苏索普董事长吴青龙因涉嫌受贿罪被立案侦查。连续两任董事长落马,给这家上市国企的重组计划再添阴霾,改革陷入僵局。这种情况下,不管是身陷囹圄的江苏索普,还是其他企业,遇到这类负面事件,在缺少前期监测预警的情况下,舆论的杀伤力是极度可怕的,公司股价大跌往往是不可避免的恶果。
(清博舆情系统可根据客户指定要求
设置情绪等级阈值、文本语言库)
综上所述,对舆情产品需求最迫切的一是政府,二是企业。从外部看,两者的组织结构完全不同;从内部看,两者的话语体系更是大相径庭。一个舆情系统能同时满足两者的监测管理需求吗?当然可以。
拿清博舆情系统的“情感属性”版块来说,一般的舆情系统是不能修改情感监测评析标准的,但是针对不同监测对象而言,话语体系的不同会导致情感解析结果的差异,只有按照监测对象语言特点、习惯来区分监测,才能实现精准预警,深度研判。
在“情感属性”这一块,评判打分可以根据客户指定要求设置等级阈值、文本库。这样操作的最终目的是建立属于不同用户的专属舆情话语体系,而不是使用通行标准,表面上简化了系统体验,实际上很容易造成舆情监测的错乱。清博舆情系统在测试过程中,搜集了多家政府、企业的客户反馈,所有这些已被融入系统各项版块细节中,等待各位行家“把玩”。
再来一招:只做专业,不玩煽情
好的舆情产品不是靠一腔热血浇灌出来的。在清博舆情系统诞生前,公司遍访业内专家大咖,征集意见,基本敲定了产品的逻辑架构,至于后面的细节填充完善,则是经历了一轮又一轮的推倒重建,为此,产品技术团队闭关数月,说起来也都是泪。
处于初创阶段的公司不像成熟的大公司,能任性玩煽情,打情感牌,先入人心,再谈产品。初创公司的产品,尤其是用户定位不是一般大众消费者的舆情产品,只能稳扎稳打,靠专业取胜,靠口碑扩大市场,追求高效与速度,而“玩煽情”不是清博的套路。
产品之本:用户基础,支撑体系
清博舆情系统有庞大的用户体系作支撑。目前的注册用户已经遍布全国,辐射各省、直辖市以及香港特别行政区,其中北上广占比最多,仅北京就占18%。
在行业分布上,包括网信办、发改委等政府机构,清华大学、中国人民大学、武汉大学等全国顶尖高校,《人民日报》、央视、新华网等知名媒体,以及万科、华为等上市公司。其中民企占比最大,达39%。
“阅读原文”,获取更多精彩呈现。