揭开开源情报的神秘面纱

作者: 李寒

揭开开源情报的神秘面纱0

美国兰德公司于2018年5月发布报告《定义国防业界(defense enterprise)第二代开源情报》,提出了第二代开源情报(OSINT)产生的背景与基本定义,并在国防业界的框架下阐述了第二代开源情报的内容分类、操作周期、使用工具、分析方法、发展趋势及未来展望。该报告论述了开源情报的优势与劣势,进而引发关于开源情报的几点思考与启示。

兰德公司报告的主要内容

第二代开源情报的产生背景与基本定义。随着互联网的日益普及、社交媒体和大数据分析的迅速发展,利用开源情报来获取信息的程度大大加深,信息的来源和处理方法日趋复杂,数据的数量和类型逐步拓宽,开源情报本身发生了重大转型。美国家情报总监(DNI)办公室曾于2011年将开源情报定义为“将公开数据和信息进行搜集、利用、分发,用来满足特定用户需求的情报”。鉴于公开情报的性质不断变化,该报告建议将当前时期开源情报的发展过程定义为第二代开源情报,并把起始时间追溯至情报界创建开源中心的2005年。这一年,脸书(Facebook)及油管(YouTube)的相继问世,以及2006年推特(Twitter)的成立,使得大部分在线内容越来越多地源自于互联网站、个人账户及社交媒体。由此推测,新一代开源情报活动是种需要多学科、多领域、多人员交织融合的情报工作,旨在给情报界及国防业界带来更多有新意、有价值的信息与知识。

第二代开源情报的内容分类与操作周期。从纷繁复杂的海量信息中识别其价值的重要性不言而喻,为了能够更好地将开源信息加以整合利用,兰德公司将第二代开源情报分为四种类型,即新闻媒体、灰色文献、长篇社交媒体内容和短篇社交媒体内容。其中,新闻媒体和灰色文献属于机构生成内容,长篇社交媒体信息和短篇社交媒体信息属于个人生成内容。开源情报的搜集范围之广、内容体量之大由此可见一斑。

此外,兰德公司还将开源情报的操作周期分为收集、处理、开发和生产四个步骤。其中,收集是指针对开源信息的获取,处理是指检验开源信息的方法,开发是指识别开源信息的价值,生产是指将有价值的信息提供给用户。

一是收集,指的是识别潜在的、有用的信息并保留上述材料。新闻媒体和灰色文献的收集相对容易,大多数内容都可在线获得,相比之下,社交媒体信息在收集阶段就要面对很多挑战。首先,社交媒体信息可能很难获得完整的、原始的数据和图片,即使能够获得完整的数据和图片,也不能作为群体样本来进行参考;其次,由于社交媒体数据能够轻易地包含民众的信息,情报机构必须遵循与搜集和存储信息有关的严格程序。

二是处理,指的是甄别信息后将其进行翻译与整合,主要用来分析多类型的社交媒体信息。处理可以采取多种形式,包括将原文进行翻译,或将图片和视频整合为可用的材料。在处理过程中,可以使用相应的软件和程序,以更便捷的方法和更低廉的成本来完成工作内容。但与此同时,开源信息中各种俚语、表情符号或图标的使用频率越来越高,这也在一定程度上加大了处理难度。

三是开发,指的是鉴定、评估可信性以及编写成文。鉴定需要证实信息的实际情况是否如其所说;评估可信性需要判断所掌握信息的真实程度;编写成文需要将搜集的材料整合成完整、有序的内容。这些过程对于新闻媒体和灰色文献来说相对容易,但是对于社交媒体信息却比较困难,社交媒体用户可能会故意隐藏其真实身份,或故意提供虚假信息。

揭开开源情报的神秘面纱1
情报学科的重叠性质

四是生产,指的是将信息以可用的形式提供给用户。开源信息可与秘密情报进行交叉验证,相互融合后形成更为可靠的内容,并以书面报告、口头简报或图表等形式传达给情报用户。

第二代开源情报的使用工具与分析方法。情报界通常使用商业现成技术或工具对开源情报进行分析,特别是对社交媒体数据进行分析,但大多数商用现成技术或工具都是为商业目的而开发的——用于广告宣传、品牌管理和消费分析。这些工具通常可以满足情报界一些特定需求,但这些工具往往是针对商业需求而开发设计的,并不是专门针对情报界,因此在实际操作中,对情报界所产生的效能是非常有限的。社交媒体分析是一个快速发展的新兴产业,开发设计商业现成技术或工具的公司还处在快速变化之中,虽然这些工具可以帮助情报界掌握大量信息,但这些信息往往也会很快过时,如果仅仅依赖商用现成品技术或工具进行情报工作,信息的滞后性会使情报分析判断存在一定风险。

该报告还列举了一些用于社交媒体信息分析的方法,包括语言词汇分析、社交网络分析、地理空间分析等,这些分析方法可以单独使用,也可以相互结合,以便能够更充分地利用开源情报的情报价值。具体包括:一是语言词汇分析,语言词汇分析是所有分析方法中最基础的内容,可以计算出一个词语在特定句子或文章中出现的频率,并以此判断用户的语言偏好和情感倾向,进而分析出个人或群体的思想倾向、价值观念、政治立场等,甚至能够对未来发展趋势做出预测;二是社交网络分析,社交网络分析通过分析社交媒体用户的信息、评论、互动等情况,搭建社交媒体关系网络,分析该用户及群体在某一事件或领域内的影响力;三是地理空间分析,社交媒体平台用户通过发布“地理标签”自动将一篇文章或推文链接到指定位置,地理空间分析通常与其他分析方法相结合,进一步分析敏感位置目标。

第二代开源情报的发展趋势与未来展望。尽管情报界已经意识到,越来越多有价值的情报存在于公共信息领域,但情报界在充分挖掘第二代开源情报的发展潜力方面仍然进展缓慢,业界专家希望能够高效利用数字革命带来的大量信息,取得情报分析的进一步发展。一是密切关注可能催生的第三代开源情报。兰德公司认为,近几年来,技术专家一直着力研讨向第三代互联网过渡的问题,第三代互联网的机器处理数据、机器学习以及自动推理可能会催生第三代开源情报。第三代开源情报的特点或将以机器学习与自动推理为基础,侧重于情报收集和情报分发,进一步发展数据加密和拒绝访问。二是努力加强与私营企业和学术界的交流合作。兰德公司认为,虽然情报机构与非政府组织的交流合作具有一定挑战性,但都是可以被克服的。近几年来,公开信息领域一直也有私营企业和学术界的广泛参与,情报机构应该与其共享情报、共同分析,进一步加强情报融合。

开源情报的优势与劣势

开源情报的优势。信息时代的开源情报相较于秘密情报,具有以下优势。一是情报搜集来源稳定,媒介形式广泛多样。开源情报资料来源包括政治、军事、经济、人文、地理等各个领域,具体媒介形式则包括杂志、广告、博客等,甚至可以利用一些不起眼的细小信息,如电梯数据、地铁数据、披萨饼外卖数据等,对其加以分析就能产生重要的情报产品。

二是情报获取成本较低,信息共享频繁便捷。开源情报所需的成本较低,在便捷的信息时代中,想要获取新闻报道、期刊杂志、电视广播等公共来源所提供的免费信息易如反掌,各种情报收集与分析工具也使开源情报的获取与利用更加便捷,尤其对于中小型国家来说,可以更为广泛和迅速地开展情报工作。与此同时,开源情报还能够更轻易地实现国家间的信息共享、交流与合作,扩大情报信息范围,提高情报生产效率。

揭开开源情报的神秘面纱2
开源情报操作周期

三是交叉验证辨析真伪,填补秘密情报空白。通过秘密手段获得的情报数量往往是比较少的,开源情报能够较快地填补情报空白,与秘密情报相互补充,在一定程度上能够对其进行交叉验证,进一步提高了情报的准确性。例如,把社交媒体信息与谍报情报信息相互印证融合,能够使人力分析更加深入;把军事网站公开发布的消息与技术侦查信号相互印证融合,能够使军事行动分析更加准确。

四是非传统安全问题愈加突显,公开情报地位不断上升。“9·11”恐怖袭击事件爆发以后,世界各个国家所面临的威胁已不单是传统安全问题,而是受到传统和非传统两个方面安全问题的共同威胁。非传统安全威胁通常是以非政府、非常规的形式突然出现,不受任何规则和行为的约束,在面对传统安全问题时,秘密情报能发挥主要作用,而在面对非传统安全问题时,开源情报则能发挥其特有作用,逐渐在国家安全情报工作中起到越来越重要的作用。

开源情报的劣势。信息时代的开源情报相较于秘密情报,具有以下劣势。一是来源繁多,关键信息容易遗漏。互联网上的大部分信息和数据都是海量的、碎片的、无规律的,公开情报资料中既包含了信号又包含了噪音,增加了“信号与噪音”出现的频率,容易对情报分析人员的判断造成不利于得出正确结论的干扰。二是内容复杂,可靠性验证难度大。互联网上的大部分信息和数据质量参差不齐,其真实性和有效性需要经过大量的、反复的、多层的交叉验证,甄别难度比较大,虚假信息不仅可以来自敌方,也可以来自己方,如何辨别虚假情报一直以来都是个值得研究的问题。

关于开源情报的思考

完善情报机制及其运用。随着信息逐步实现全球覆盖,开源情报不再局限于单一领域,政治情报中可能包含着经济情报、军事情报中可能包含着科技情报,各个领域的情报信息相互交织,进一步推动情报融合,在情报发展进程中发挥着重要作用。例如,在美国情报界,国家情报总监负责统筹整个情报界的情报整合与分析工作。由此可见,一个情报大国或者情报强国都需要建立专门的情报统筹机构,用来打破各个部门单位之间的壁垒,这样既实现了情报共享,又减少了技术和人力资源的浪费。

揭开开源情报的神秘面纱3
按开源信息类型划分的开源情报操作周期组成要素的难度

提升情报分析人员素质。开源情报的分析体量巨大,包含的信息和数据质量也都参差不齐,这就要求开源情报分析人员的业务知识、研究能力和综合素质都必须过硬。一是要具有较强的筛选和鉴别能力,对真正有价值的情报进行提取分析, 形成用户所需的情报产品。二是要具有较高的辨析真伪能力,保留和整合正确的情报并依据这些材料进行分析判断,反之则会出现情报失误,造成不可挽回的严重后果。

创新开源情报工作模式。当前对于开源情报能够起到的重要作用还未得到普遍共识,大部分仍停留在借鉴外国经验的阶段,重视的程度较低、投入的研究较少。在当今大数据时代的影响下,一是应尽快利用院校和研究机构的科研能力及技术优势,针对开源情报存在的重点、难点问题积极开展共建项目和专题研究,推动开源情报由理论向实践的转变。二是结合当前世界发展形势,扩招开源情报迫切需求的小语种、军事情报学、计算机科学等专业人员,提高情报分析水平和专业化程度,为开源情报在多领域提供更广阔的发展空间。

责任编辑:王宇璇

上一篇 点击页面呼出菜单 下一篇