江苏捷胜锚机有限公司
(原泰兴市捷胜船舶设备有限公司)
地址:江苏省泰兴市江平南路76号
全球服务热线:13905266196
手机:13905266196 13905264589
电话:0523-87838058
传真:0523-87838058
网址:www.jscbsb.com
E-mail:js139589@163.com jm139589@163.com
探索大数据的开发应用和保护
人气:13573 发布时间:2018-08-08
为了克服大数据管理者面临的问题,本文提出一种基于数据扩散控制的大数据保护方法。该方法的主要思想是:大数据的管理者基于安全虚拟化技术,为数据开发方提供集中的数据处理平台,所有待处理的数据及其处理结果都被限制在指定的物理范围内,数据开发方不再拥有大数据副本,因此不必担心由于他们引发的数据泄露问题。这一基于数据扩散控制的大数据保护方法不影响数据开发方的数据处理流程和操作习惯,也不需要对相关应用进行修改。
1 大数据的安全保护现状
数据脱敏方法是目前大数据安全保护中较为常见的方法。所谓数据脱敏是指对大数据中的个人敏感信息进行技术处理,使得其中的个人信息主体在不借助额外信息的情况下,无法被识别。数据脱敏应当尽量保证数据原始特征不被破坏,使得共享的数据具有相同或者相当的可利用价值。
常用的数据脱敏方法包括采用加密、哈希或者删除相关个人敏感信息等,虽然这些脱敏方法还存在一些问题需要进一步解决,比如如何隐匿个人隐私标识数据并在其余数据公开的情况下,不能反向推定已隐匿的数据,相关算法也是研究热点,包括k-匿名、L多样性、差分隐私等。
对大数据采取分级分类的保护也是大数据安全保护的一个重要内容。数据分级分类保护是指根据数据的重要性和敏感性等指标,对数据进行类别和安全等级划分,并按照数据分级分类结果,采取相应强度的数据安全保护措施,以实现在最大程度地开发和利用数据的同时,对数据进行充分和必要的安全保护。
数据的分级分类保护应该采用多维度指标体系,比如数据形态、数据内容、数据类型、数据完整性、数据准确性、数据新鲜度、数据加工层级、数据重要性、数据敏感度等,不同的保护需求和应用场景,其分级分类指标可能不尽相同。
美国国家标准和技术研究所(NIST)提出了数据分级分类的建议和方式。NIST按照信息和信息系统保密性、完整性和可用性等三个方面定义了数据分级分类的维度,同时对每个维度定义了三个影响级:低、中、高。NIST还根据信息系统中处理、传输和存储的信息类型的重要性来确定该信息系统的安全类别,并配套制定了相关标准指南,以配合上述分级分类原则的实施和落地
•首先,它们对内部员工和第三方服务人员(如驻场开发、测试和维护人员)缺乏有效的安全管控手段。在利益的诱使驱动下,这部分人群可能会利用他们对内部网络安防机制的了解以及他们能够接触到数据的便利,绕开安全机制或利用安防漏洞,截留、获取敏感数据,并通过转让或出售等方式获得非法利益。近几年来,这类案件在银行、卫生医疗、物流、教育等行业领域频频发生,给社会带来极大的危害;
•其次,由于各种原因,大部分用户的网络安全防护措施在设计和建设时都或多或少地存在疏漏环节,加之在日常管理运维中也存在经验不足或管理不到位情况,给数据的越权访问提供了机会,这些违规行为很难被发现和追踪;
•再次,在大数据开发和应用环境中,数据的所有权和使用权在技术层面很难分割,如果允许相关人员或合作方对数据进行开发和应用,就意味着他们在技术层面拥有数据的所有权,他们可能会未经允许对数据进行复制转让,由此带来数据损失和安全责任问题;
•最后,网络病毒和木马依然是严重的数据安全威胁,比如勒索软件利用病毒木马的原理机制,对用户数据进行加密,并通过金钱敲诈等方式获取非法利益,而传统的网络病毒检测和查杀机制还不能对勒索软件等进行有效防范。
大数据面临着这些安全风险,一个重要的根源在于数据扩散问题。如果大数据的管理者能够有效控制大数据副本的复制范围,将大数据限制在一个可控可信的物理环境中,那么上述风险就会得到极大地缓解。
2 基于数据扩散控制的数据安全保护方法
针对数据安全风险和传统网络安全机制的局限性,本文提出一种基于数据扩散控制的数据安全保护方法,即将数据副本的复制范围限制在一个可控可信的物理环境中。其主要思想包括:
(1)通过集中化的数据安全操作平台实现对数据的集中安全管控,对数据的复制范围进行安全控制,防止数据泄露;
(2)通过密码技术实现对集中数据安全操作平台的可信运行保证,有效阻止数据勒索威胁,同时对用户操作进行规范;
(3)通过细粒度的数据访问控制机制,防范数据的越权访问;
(4)通过可视化安全审计机制,对相关人员的违规操作和访问行为进行快速和直观的追溯。