Abstract: Compared with the traptional Web and information applications, social mepa has brought a lot of convenience to people's lives. At the same time, it's becoming wider for its prect interaction with the real society and impact on the society, even to a certain extent affects the national security and social stability. Research on network security situational awareness and emergency management based on social sensor will contribute to solve the problem of national security, social development, etc. This paper presents a model of network security situational awareness and emergency management based on social sensors. With the inpvidual social mepa, the model researches the content such as the sensor data, behavior, emotions, attitudes and other data that are generated by Internet users and perceives security situation of network society and realistic society. In order to solve specific emergencies, it can also be combined with computer simulation system and be guided by realtime data analysis.
0引言
微信、微博、QQ、知乎等各类社会化媒体使得各种真假难辨的信息得以迅速病毒式传播。大量社会化个体在制造和传播信息的同时,也作为社会传感器感知着互联网社会与现实社会的安全态势,怎么样整理社会化个体的感知能力和媒体资源的协调管理能力,提高面向互联网与现实社会危机事件的应对管理能力至关要紧。
社会化媒体出现之前,个体与群体的信息传播仅在小范围内以人际交流的方法传播,很难采集剖析,而电视、报纸、电台、门户网等传统媒体也只不过单向传播,没办法对个体感知进行全方位的探测与采集。微博、微信等社会化媒体的进步,用户自媒体的信息在社交互联网中自由、开放式流动,用户实时迅速发布信息的同时成为了感知社会的传感器。现在基于社会化媒体开放平台,研究互联网社会与现实社会的安全和管理问题已经成为一个情报学、计算机科学、管理科学、社会学等多学科交叉的新兴研究范围。
1有关工作
1.1社会化媒体上的社会传感器有关研究
1)社会传感器互联网。互联网社会中,每一个网民个体都在依据我们的先验常识和表达能力感知并表示着社会活动的很多方面,包含自然灾害、突发危机、交通堵塞、空气污染等等。这类信息很难用智能化的方法跟踪采集,因此Wagner[1]等人在2009年提出Human as Sensor(人即传感器)的看法,数十亿人构成的巨大的传感器互联网,覆盖了世界的政治、经济、文化、气候、交通等每个范围。除去对客观世界的感知以外,还可以对物理传感器没办法涉及到的人类行为、思想、情感等范围进行感知。为了系统地借助文本、图像、音频、视频等信息资源,王飞跃[2](2004)、王晖[3](2010)提出了仿照物理学传感器信号处置原理,构建社会传感互联网的思想,通过对社交互联网中要紧节点的动态剖析,达成对社会数据的全方位、分层次的感知。
2)群体智慧。《The Wisdom of Crowds》(2004)一书首次从“群体智慧”的定义着手,研究怎么样驾驭群体智慧,最大限度地勉励、整理和应用群体智慧,达成社会个体智商资源的积累和扩张。Wikipepa吸引群体协作共建常识库,突破个体利益的驱使,激起自由、开放的常识集体创作,形成了全球最大的常识库。谷歌的流感预测实验借助大量网民的搜索关键词进行基于群体行为的流感感知与预测,其准确率和实时性超越医疗范围专家。
3)数据感知。David Esley, John Kleinberg(2011)在《Network, Crowds, and Market》一书中系统地研究了互联网、动机和人群聚合行?椤;?于社会化媒体的数据感知还包含对社会个体和群体的语言、行为、情感和心理的剖析,用户画像和群体画像成为采集用户和群体信息的重点研究范围。赵妍妍、秦兵等(2010)[4]通过剖析大量社会化媒体文本信息,挖掘网民的看法及其情感倾向,并对外开放了情绪地图的数据可视化平台。
1.2互联网安全方面的研究
伴随网络的高速发展,特别是Web 2.0下的各类社交网站飞速发展,借助社会化媒体研究互联网社会的安全问题引起了国内外学者的广泛关注,张永铮、方滨兴等(2007)[5]等从互联网体系结构、病毒传播、敏锐内容剖析、互联网入侵、防火墙等范围拓展了很多的互联网安全研究,对于互联网社会安全问题的研究主要集中在敏锐内容剖析方面(包含色情、暴力、反动等信息)。方滨兴等(2015)[6]对社会化媒体的关系和结构特质、社会化媒体中的群体及其行为、社会化媒体中的信息及其传播三个方面进行了详尽剖析。在此基础上,围绕该方面的拓展研究,可重点阐析为两个范围,内容如下: 1)事件剖析。Becker(2009)提出借助社会化媒体的实时性和对现实世界的动态反映特质,研究社会化媒体事件抽取,剖析事件主体、事件、可信度、趋势,预测事件的后果和影响面。王娟(2010)[7]针对已有互联网安全态势感知模型缺少有效的数据融合和协同管理机制的问题,提出了一种层次化大规模互联网态势感知模型。
2)互联网舆情剖析。张一文等[8](2011)觉得媒体的影响力、政府疏导力、事件性质和网民相互用途力一同用途于舆情热度,因此通过打造四级的指标体系来评价很规突发事件的舆情热度。王国华等[9](2012)在舆情衍生特质对热门事件影响的基础上提出舆情关联,作者觉得互联网舆情热门事件主如果通过主体、主题、情绪等要点发生联系来生成舆情簇或者舆情集,进而来影响舆情的演化。
除此之外,美国DARPA推出了借助计算机剖析和处置社会舆情的TIA计划,表明愈加多的国家针对基于大量社会化媒体数据对互联网情报监控研究工作已经加强了各方面的投入力度。
1.3危机传播管理方面的研究
危机的发现、传播监控、管理是社会安全管理重点研究范围。在此,给出各范围的研究内容综述如下:
1)危机发现。洪宇等[10](2007)较系统地介绍了面向大众媒体信息流的话题测试与跟踪(TDT)任务。李恒训(2011)[11]关于互联网热门话题发现的研究涵盖了新闻、平台、博客三种平台,并指出互联网热门话题测试的研究办法。Mathioudakis(2010)[12]构建的“TwitterMonitor”系统中测试微博流中频率异常高的突发词(Burst Keywords),而后对突发词根据出目前同一微博中次数聚类来找到新兴话题(Emerging Topic)。
2)危机传播。Duggan(2004)[13] 从信息发出者与信息同意者的影响原因入手,构建危机信息传播模型。Helsloot(2013)[14]从危机的属性和社会定位方面入手,定性剖析了危机信息发出后对不同社会群体的影响。
3)危机管理。对于危机发生之后的传播管理,唐钧(2004)[15]指出以全步骤信息管理为基础、以危机信息通讯为渠道、以危机信息管理机制为平台,全方位构建政府危机信息管理软件。董竟(2006)[16]觉得科学健全的危机信息管理机制可以预防谣言的扩散。
1.4基于社会化媒体的互联网安全应对管理方面的研究
主要从应对影响原因、应对资源、应对仿真和应对决策方面拓展研究。迄至现在,现已推出的主流成就可得研究分类设计内容如下:
1)应对影响原因。Drabek(2014)[17]觉得,有效的应对预案和应对决策、多主体的应对决策方法、智能型的应对指挥中心、健全的多主体应对演练模式均影响多主体应对协同效率。
2)应对资源。Cheu等人[18](2008)研究应对服务配置来保护及服务要紧交通基础设施。Huang等人(2013)[19]研究了应对资源配置的不确定性建模办法。
3)应对仿真和应对决策。Levy等(2007)[20]提出应用群体互联网剖析法(GANP)进行应对决策。英国科波拉软件公司在2005年推出的实时可视化剖析互联网民意的系统,有益于直观把握互联网舆情的安全态势。Subrahmanian(2007)[21]指出,社会文化建模已开始应用于安全和反恐决策预警中。在社会公共安全范围,中国科学院智能化研究所情报安全信息学研究团队与国家有关业务部门合作,基于ACP办法研发了大规模开源情报获得与剖析处置系统,对社会情报进行实时监控、剖析、预警与决策支持与服务。因为社会系统的复杂性,涉及大规模计算所需的建模、剖析、算法和仿真环境正在逐步进步。
综上所述,针对社会化媒体的互联网安全监管研究已经成为情报学、社会学、计算机科学、信息科学、传播学、管理学等多个学术范围的研究热门,但对于互联网危机事件的传播、监管、应对的研究多使用定性剖析的办法,缺少数据实证;部分基于问卷或定向数据采集的定量研究,其数据规模很难反映事件的真实状况。而从计算机角度出发,对互联网危机事件的数据挖掘、数据剖析的研究总是只关注剖析办法、剖析模型本身,缺少对于该办法和模型在应对管理范围的应用研究,学科交叉融合的深度并不充分。基于博客、微博等互联网数据感知的研究,一般数据源自比较单一的媒体平台或开放平台,受平台特点影响易产生数据偏置。为此,本文从计算机科学、情报科学和管理科学相交叉的角度,提出一种整理社会化媒体、范围开放平台等多源大量数据进行互联网安全态势感知及应对管理模型。
2基于社会传感器的互联网安全态势感知及应对管理策略设计以互联网安全态势感知和提升危机应对处置能力为目的,探索社会化媒体、门户、平台、电视、报纸、广播、“天眼”视频监控系统等各类开放数据源的整理,打造跨媒体资源协同应对处置的理论和办法,研究可得设计策略内容如下。
2.1??建基于社会化媒体的社会传感器数据采集平台
1)针对微博、门户网、平台、每人网等社会化媒体,打造分布式用户数据采集系统,实时爬取互联网中的文本、图像、音视频等数据。
2)针对数据开发分词、词性标注、句法剖析、语义剖析、情感剖析等数据构建数据剖析子系统。
3)基于剖析后的数据,剖析用户性别、年龄、兴趣喜好、地点、政治倾向等用户属性,进行用户可视化画像。
4)以节点和边的图论方法表示社交互联网中用户之间的关系,研究用户好友圈、社交圈与群体动态演化。
2.2打造社会化媒体上事件“发现-跟踪-预测”系统
1)互联网安全问题在社会化媒体上以突发事件的方法存在,整理突发事件、危机传播等研究范围文献,对突发公共事件进行特点提取和分类,量化事件传播过程中的特点及其网站权重分配,打造社会化媒体事件突发性衡量指标。 2)依据主题模型聚类事件主题,剖析主题时间单元与影响范围、突发词和突发区间监测,开发热门事件发现系统。
3)研究突发事件的五元组形式化描述,描述事件的主题、任务、时间、地址、有关事件。
2.3对危机事件扩散过程进行可视化剖析
1)以节点间的传播树形关系表示危机事件传播的互联网拓扑结构,抽象事件扩散过程中的各节点之间的关系,结合复杂互联网动态演化理论,打造互联网舆论的实时可视化跟踪模型。
2)引入时间维度,打造仿真时间与现实时间之间的映射关系,研究事件在时间序列上的进步态势。
3)结合马尔科夫模型和统计线性回归模型打造事件传播趋势预测框架,预测肯定时间和区间内事件的扩散范围。
2.4打造危机事件案例库
1)在社会传感器数据采集平台上,结合事件五元组形式化表示办法,过滤数据噪音,打造可扩展性强的NoSQL数据存储系统,结构化存储突发公共事件有关数据。
2)对事件打造查看索引,便于组合复杂查看条件对事件有关数据进行检索。
3)打造事件数据剖析系统,总结事件“产生、进步、消亡”生命周期内的共性规律,对日后突发公共事件的应对处置提供参考。
2.5构建基于互联网社会和现实社会计算剖析的动态应对管理机制
1)整理社会传感器、“天眼”系统、传统媒体等开放数据源,在云计算基础平台上,剖析事件有关的资源、能力和预案,准确把握事件的动态变化态势。
2)剖析微博、微信、每人网等社会化媒体与电视、报纸、官方新闻网站等不同媒体在风险和信息交流、传播模式、决策时效性、政策或方案、决策出发点、制约原因、决策失误或延误等方面的动态及现象。
3)组织专家资源、媒体资源、政府资源,优化资源调度策略,提升资源的互补能力和应对优化配置的学习力,进而提升资源间协同应对能力。
4)从资源间的互补能力、整理能力、学习力三个层面来剖析动态应对预案设计办法。在应对协同预案的设计中,充分考虑资源间合作的风险交流、信息交流、应对请求与响应的时间约束、协同决策任务序列等要紧原因,打造以社会安全态势数据为依据的动态应对处置机制。
3基于社会传感器的互联网安全态势感知及应对管理模型依据上述所设计的应对策略,基于社会传感器数据采集平台进行数据采集,通过对用户画像、群体画像和事件画像的剖析进而刻画及剖析事件整体,在此基础上进行感知互联网安全态势;然后通过仿真模拟达成决策仿真。最后,经概括形成案例数据库服务于动态应对系统策略及应对方案。由此,提出基于社会传感器的互联网安全态势感知及应对管理模型如图1所示。
4结束语
相比以往互联网舆情的有关研究,本文提出的基于社会传感器的互联网安全态势感知及应对管理模型革新性地将用户画像、事件画像应用到突发事件应对研究中,将传统的敏锐词剖析办法扩展到结合社会计算的文本剖析、行为剖析、情感剖析、群体剖析、事件剖析、互联网传播剖析等办法,对事件主题、人物、传播路径等特点展开更全方位的剖析和更直观的表示;提出的基于社会传感器的突发公共事件“发现-跟踪-预测”系统,将社会化媒体中个体生成的大量数据当作突发事件的感知器,测试公共事件的突发性阈值,实时跟踪事件传播路径,结合马尔科夫模型预测事件进步态势;提出的互联网社会和现实社会互动剖析的动态应对管理机制,整理互联网社会和现实社会的开放数据源,以实时数据剖析为导向,打造自学习的事件仿真系统。显然,本文提出的模型对于提高互联网突发事件的应对处置能力具备肯定的应用前景,但同时,一个不可小觑的问题是,互联网媒体传播速度极快,需要突发危机事件的数据剖析系统尽可能实时,这对于算法复杂度和计算硬件的平台有非常高的需要,因此,后续将进一步研究可以达成对大规模突发危机事件数据进行实时剖析的算法和机制。