后web2.0时代,互联网和物联网每天都在产生大量的数据。人们渴望这些巨大数据资源的价值,这就使得“大数据”的概念应运而生。如果说“数据”是未来支撑核心技术的基础“原材料”,那么“大数据”正在演变为一种战略资源。当“用户需求导向”成为企业的共识时,大数据的收集、挖掘和分析开始支持企业的业务运营、营销策略甚至战略方向,数据成为企业越来越珍惜的宝贵资产。

目前建设大数据平台的企业不在少数。与传统数据库相比,大数据平台的数据集中量大,价值更高,安全建设要求明显更高。但是,由于大数据平台采用非结构化的数据库类型,与以往的应用和数据库不同,对应于相对简单的传统网络结构,大数据平台的安全建设给平台开发者和运营商带来了难题。

近日,安华金和各行业IT运维开发组对大数据安全市场现状和需求进行了调查。希望了解用户大数据使用和运维安全现状,了解各行业用户在数据库运维方面的安全需求,整理出一套适合大数据平台特点的完整的数据安全方案,帮助用户进行安全建设。安华金从各种渠道获得的近400份问卷中收集了170份有效样本进行统计分析,总结归纳了这份《大数据安全市场现状及需求分析》,提取了报告的关键分析结论,并与关注大数据安全的人士分享。

参与者简介

研究样本来自不同行业的部门或企业,包括政府、制造、医疗、金融、通信、教育、能源、交通、保险等行业。调查对象以技术人员为主,直接从事IT运维或技术开发,或为用户提供运维服务、解决方案及相关产品咨询,其中技术经理、运维工程师、技术开发人员占大多数。他们将指导或直接参与本单位大数据平台的建设和运维,承担大数据安全建设的责任,为这份调查报告的客观性和专业性提供了基本保障。

调查结果

大数据技术的应用现状

在本次调查中,有一半的受访者表示已经将大数据技术应用到公司的部分业务中,或者在应用计划中明确列出,处于技术选择阶段。另一半回答者虽然还没有真正开始大数据应用项目,但也比较关注,处于技术研究阶段。同时,有45%投资过大数据应用的受访者表示,大数据技术在公司核心数据分析或业务系统中的应用,意味着公司核心业务数据被写入大数据平台,具有很高的商业价值,需要更高的敏感度。

可以肯定的是,大数据技术已经受到了各行业用户的广泛关注。当市场上近一半的群体已经行动起来,一旦行业标杆案例成熟,另一半用户的方案很快就会进行复制推广。

大数据产品的使用

对于许多需要提供24小时不间断服务的网站来说,升级和扩展数据库系统是非常痛苦的,往往需要停机维护和数据迁移。此外,大数据平台对传统关系数据库提出了更多挑战,包括高性能事务管理、实时读写和高可用性的要求。因此,在大数据平台的建设中,关系数据库的许多特性已经失去了作用,非关系数据库已经成为大数据平台的标准。

在本次调查中,我们列举了目前比较常见的几种非关系型数据库产品,希望了解几种产品的市场接受度:

32%的受访者使用的是广泛使用的MangoDB数据库。Mongo最大的特点是支持一种非常强大的查询语言,语法类似于面向对象的查询语言,可以实现大部分类似于关系数据库单表查询的功能,还支持数据的索引。MongoDB主要解决海量数据的访问效率问题。当数据量达到50GB以上时,Mongo的数据库访问速度是MySQL的10倍以上,这是MongoDB流行的主要原因。

其次是Hbase、Hive、Redis等等,都占22%左右。Hive和HBase都是基于Hadoop平台的数据仓库工具,具有学习成本低、通过类似SQL的语句快速实现简单的MapReduce统计、无需开发专门的MapReduce应用等优点,非常适合数据仓库的统计分析。

Spark紧随其后,占17%: Spark是类似Hadoop的开源集群计算环境,具有Hadoop MapReduce的优势;然而,与MapReduce不同的是,作业中间输出结果可以保存在内存中,因此不需要读写HDFS。因此Spark可以更好的应用到需要迭代的MapReduce算法中,比如数据挖掘、机器学习等。

此外,其他选项的答案中也出现了DB2、阿里大数据云等产品。

大数据平台中的数据是什么?

我们在谈安全建设时,首先要找出被保护的对象,不同业务类型、不同敏感级别的数据,根据自身的敏感级别和访问使用条件,选择合适的保护手段。因此,我们需要知道用户社区将什么数据放入大数据平台进行存储和使用。

调查结果显示,50%的受访者会将“生产数据”放入大数据平台,这是公司主要业务系统实时生成的重要数据。这些数据直接从生产环境写入大数据平台,具有很强的实时性和敏感性。

41%的受访者选择“用户数据”,这也是企业赖以生存的业务数据;此外,34%的受访者选择了访问日志,24%的受访者选择了交易信息。

此外,14-15%的受访者表示会将第三方数据和财务数据放在大数据平台中,其中第三方数据的出现是指测试、开发和分析场景中的业务数据共享和数据分发。此外,少数受访者提到了企业信用数据。

用户的安全顾虑

大数据平台收集公司各方面的数据,并向各种内部或外部业务系统开放接口,这意味着传统环境下的数据安全威胁在大数据应用场景中更加复杂的叠加和自由组合。那么,用户更关注大数据平台的哪些方面的安全顾虑呢?

59%的受访者选择漏洞攻击,56%选择“数据共享安全”。与传统环境相比,共享场景中的安全问题在大数据技术的应用中更加突出,已经能够与传统安全威胁中的“漏洞攻击”相抗衡。不难理解,大数据平台不仅提供存储和查询功能,在数据分析和价值挖掘方面也有更重要的价值,这就决定了大数据平台需要向多个部门甚至多个单位开放。例如,政府大数据平台将为区域内各政府单位提供数据接口。

46%的受访者选择“泄露企业机密”。在安全问题造成的后果中,用户似乎更担心机密数据的泄露,这是企业的命脉。

38%的受访者选择“弱权限控制”,这与大数据平台涉及的人员规模和角色的复杂性有关。目前只有具备一定技术水平的单位才有能力搭建大数据平台,但也需要引入第三方开发人员和测试人员。在后期的数据维护和挖掘中,需要引入第三方服务公司,这些不同访问角色的权限划分和控制变得越来越重要。

28%的受访者选择了“无审计信息”,这表明用户更加关注大数据平台的审计记录,这将为所有安全事件的问责提供依据。

值得注意的是,只有13%的受访者选择“违反国家法律法规”,这与“安全需求大多来自政策要求”的传统观点不同。确保数据安全的需要已经成为越来越多用户关注的焦点。

哪些大数据安全产品最受欢迎?

传统的安全建设思想也适用于大数据安全,但在技术手段的实现和方案的集成上,非关系数据库的技术结构比传统关系数据库更难。此外,由于大数据平台的数据访问来源、对象和流程复杂得多,安全策略的制定和实施也会更加困难,用户更喜欢哪几类数据安全产品?

大数据运维管控产品受到59%受访者的青睐,说明用户最重视运维端的行为控制。事实上,相对于应用端的数据读写,运维端的开发人员、测试人员和分析师会有更高的数据操作权限,这也意味着更高的控制难度。

其次,大数据防火墙产品占比41%。由于防火墙多用于应用端的外部安全防护,因此也满足了用户对漏洞攻击等外部入侵的安全防护需求。

32%的受访者选择大数据审计,低于运维管控和防火墙产品,与传统环境下的安全要求明显不同。用户似乎更关注能够在事件中提供管理和控制的安全手段,审计产品在事件发生后监控旁路和跟踪的能力也很重要,但似乎不那么紧迫。

分别有27%和28%的候选人进行“大数据风险扫描”和“敏感数据梳理”。安全风险扫描可以帮助用户发现潜在的安全风险,如安全漏洞、安全配置薄弱、密码薄弱等。有些问题可以手动修复,以提高平台安全基线,指导安全方案的规划。敏感数据的排序是整体数据安全建设的基础,但当涉及到大规模、复杂数据类型的大数据平台时,这项技术将面临诸多挑战。

“大数据脱敏”被看好20%。这项技术适合数据分发和共享场景中的安全需求,但这个数字并没有预期的高。可能用户在考虑性能。还有待观察。

1.《数据库需求分析报告 大数据安全市场现状和需求分析》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。

2.《数据库需求分析报告 大数据安全市场现状和需求分析》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/guonei/1701897.html