在网络空间治理中运用社交大数据
当今社会,社交媒体已经成为用户内容获取与危机风险传播的主要渠道。根据艾瑞咨询发布的《2019年中国移动社交行业研究报告》,我国移动社交媒体用户规模预计2020年将达到8.2亿。社交媒体的传播生态越来越呈现出全民化、移动化、社交化的特点,由此在日常情境中产生的社交大数据,为基于多维度、多群体、多因素的大规模数据分析提供了可能,进而为网络内容生态的风险治理提供了有效支持。对这些非结构化数据进行合理利用,有助于及时发现潜藏在网络空间中的风险,并借助技术手段有针对性地采取化解之策。
一方面,社交大数据为打击非法言论、优化网络空间内容生态治理提供了重要的技术支撑。社交媒体常常成为网络谣言、黄暴信息、虚假新闻等滋生与传播的温床,严重危害了网络言论环境。依靠传统的屏蔽、关键词过滤、用户举报等措施,往往收效有限,且易产生反作用。而应用人工智能、语义分析、文本挖掘等技术,对社交平台不良信息进行监测、分类和追踪,可以更大限度发挥社交大数据的治理价值。譬如通过广泛采集社交平台数据,帮助辨明网络谣言的传播路径,从而及时阻断谣言传播,增强辟谣效果。
国外一些机构已经推出许多应用于信息内容治理的技术与产品,例如,海外社交平台推特在2017年已经开始将人工智能技术应用到网络垃圾信息的应对工作中,实现对色情暴力图片的筛选,以及对恐怖主义言论与相关网络组织行为进行监控分析。路透社近年研发的新闻追踪器AI News Tracer,能够追查最终来源,并辨明新闻真实性。我国在加强算法治理技术建设上也取得一定进展,但在甄别社交平台高风险用户和行为方面仍有待进步。
另一方面,社交媒体往往是舆情风险高发地,乃至网络意识形态博弈的关键阵地。社交媒体汇集了用户对与自身密切相关的事件所表达的观点和意见,蕴含着丰富而真实的民情民意。利用社交大数据做好舆情研判,将有助于制定舆论引导策略、化解舆情高危风险。另外,社交机器人的大量使用,也让网络意识形态之争走向风险前沿,抵御自动化的操纵宣传成为维护网络安全的必行任务。牛津大学互联网研究院在一项关于计算宣传的研究中,挖掘了有关中国政治的150万条微博评论以及110万条推特评论,结果发现微博上几乎没有机器人的迹象,而推特上则有大量发表反华言论的机器人被使用。而在今年,清华大学的研究者同样运用大数据挖掘与分析方法,发现了推特上与中国相关的推文中有超过1/5疑似由社交机器人用户发布。这些借助社交大数据才得以发现的潜在风险,为相关部门执行网络治理与对外传播工作敲响了警钟。
在社会风险治理场景中运用社交大数据
社会风险不仅存在于网络空间。面对公共卫生事件、自然灾害、社会行动等实际风险,社交大数据在更广泛的社会治理场景中同样具有应用价值,可以在风险辨识与预警、风险分析与评估以及智能决策等风险治理全流程发挥积极作用。
广州大学南方灾害治理研究中心主任周利敏认为,相较于传统治理局限,大数据治理具有实时性、准确性、全面性、可视化等优势。而与社会调查或其他大数据来源相比,社交媒体作为一种“非正式沟通”的方式,在紧急状态下往往是用户优先使用的信息渠道,在某些情境下甚至会引发用户主动上传数据,这使得社交大数据在风险状态下具有突出的即时性、接近性、互动性与个性化,具体可以在以下三个基本环节助力风险治理。
其一,社交大数据能够帮助提早发现社会问题或自然灾害端倪,及时进行风险预警。现代风险治理区别于传统的被动应对模式,更多强调主动预防。利用社交媒体大数据进行风险监测,进行信息排查和预警,可以实现早发现,并为早防治、早化解打下基础。治理主体调用各地用户上传至平台的文本,对目标主题的数据走向进行智能分析,从而揭示风险趋势。例如,美国西北大学的Kathy Lee团队对推特数据进行深度文本与时空分析,建立了实时的疾病监测系统。该系统不仅可以用于对季节性流行病如流感的暴发进行早期预警,还可以监测不同类型的癌症病患者分布特征等。
其二,社交大数据依靠自下而上的巨量数据收集、处理与精确分析,筛选整合出有价值的信息实现智能决策,便于管理者从全局角度做出科学判断。当风险应对已经因种种现实干扰因素面临困境,社交大数据有可能是一个突破口,结合地理大数据、空天大数据等帮助有关部门决策部署。比如在极端自然环境、交通阻塞等情境下,利用灾民上传的社交媒体数据,可以将受灾地区、人群等信息传至指挥与决策部门,进而提高现场救灾效率。再比如在疫情早期,一些患者选择利用微博超话进行医疗求助。有团队尝试测算发布者住址与最近医院的距离,了解医疗资源的区域紧张程度。这些数据实际上可用于后续援助资源的投入与调配。此外,结合社交大数据反馈的舆情信息,有针对性地开展风险沟通与舆情应急处置工作,例如,考量何时公布、以何种方式公布、需要回应哪些关切等细节,提升灾情信息的公开性与透明性,进而助力灾害风险沟通和舆情压力疏解。
其三,社交大数据在灾后重建、风险评估与反馈改进环节同样大有可为。利用社交大数据监测灾后社会情感与网络心态,建立相应指标体系与评价模型,可以对灾区人群心理状况进行评估与疏导。另外,依托信息聚合系统平台,将社交大数据纳入到相应灾害或社会风险的反思总结过程,以民间数据的视角审视防灾救灾的长处与不足,为今后风险治理工作提供宝贵经验。
社交大数据风险治理的现状与建议
社交大数据能够支持风险研判与预警,提供风险治理建议,并提升风险治理效率。我国社会的数字化广度与深度在大数据治理中具有天然优势,在社交数据采集与利用方面具有一定技术基础,但也存在配套政策法规未跟上、风险应对机构专业化有限、治理主体单一且缺乏沟通、风险治理机制不健全等不足。本次新冠肺炎疫情中,社交媒体成为风险预警与放大发酵的关键场所。还有网络调查显示,“朋友圈”和微信群等社交媒体是国人获取和传播疫情信息的主要渠道。可以说,社交媒体介入公共卫生事件等重大风险、发掘大数据在风险治理中的巨大潜在优势,将成为一大趋势。习近平总书记指出,鼓励运用大数据、人工智能、云计算等数字技术,在疫情监测分析、病毒溯源、防控救治、资源调配等方面更好发挥支撑作用。
针对未来变化,首先要强化技术治理能力,组织相应机构与人才队伍化解风险。继续提升技术手段向智能化、网络化发展,借力新基建推动社交大数据风险治理的共通性基础技术,包括5G技术、物联网、人工智能、云计算、网络安全技术等,从而构建全新的社会风险治理体系。有研究认为,我国的社交媒体监测目前仍侧重于“防”和“堵”,但在预防风险方面还显不足。未来应学习国外先进数据治理经验,深化算法治理与人工干预的有机结合,加强专业人才的培养与专门机构的运作支持。
其次,整合政府跨部门协同治理,实现有限数据共享。我国利用社交大数据仍处在探索阶段,政府内部缺乏有效沟通与协调,风险数据库相对分散。为此应推动治理主体的跨部门整合,打破数据壁垒。另外,社交大数据只是大规模数据治理中的一个部分,应寻求不同类型大数据之间的有效对接,提高风险治理的科学性与准确性。
再次,完善数据安全与隐私保护政策,保障社交大数据合法可靠。社交媒体数据是个人属性信息的组合,在用于公共治理时应厘清私密性与公共性的边界。政府应加快完善数据保护政策,在收集并使用社交信息时兼顾民众隐私与风险治理有效性的平衡,避免数据滥用。
最后,探索多元主体参与的风险协同治理。社交大数据的产生与维护涉及到用户、平台企业、政府等多个主体,我国据此应进一步发挥互联网企业、网民等在大数据风险治理中的作用,激发平台维护网络生态的自觉意识,调动网民参与的积极性与监督责任,在网络空间乃至其他风险场景实现共享共治的良性互动。