很多组织的数据景观十分混乱,其数据分布在组织内部部署设施、多个公共云和私有云中,在SaaS应用程序中以及边缘中都可以找到不同类型的大量数据。组织希望采用人工智能技术扩展其数据的价值,并可以安全一致地访问。这些努力已经成为应对数据蔓延并将这些数据转化为见解的一场斗争,这些见解可以促进组织制定决策并帮助在市场竞争中获胜。
有关边缘计算和物联网发展的重大转折点有很多:根据调研机构Gartner公司的预测,截至2020年底,全球约有117亿台物联网设备。到2025年,全球75%的组织的数据将在传统集中数据中心或云平台之外的边缘生成和处理。随着物联网设备变得更加智能化和日益普及,很多组织争相将物联网产生的数据集成到运营系统或分析系统中,它们将使其数据格局更加复杂。
由于发生的冠状病毒疫情,远程工作在2020年得以兴起,这也是朝着协作应用程序、平台和自携设备(BYOD)的方向迈进的一个重要因素。所有文档、交互和其他数据资产的处理痕迹都没有消除,并且没有关于文档共享和存储过程的具体指导。例如,最近的一项调查发现,71%的受访者表示使用即时消息和业务协作工具来共享敏感且对业务至关重要的组织数据。
数据运营咨询机构和平台提供商DataKitchen公司的首席执行官Chris Bergh解释说:“物联网的兴起以及边缘计算和远程工作的发展趋势推动了业务从集中化向分散化的整体转变。对于IT组织来说,其复杂性意味着失去了对数据资产的控制。组织创建数据的速度要比其数据团队管理和治理数据要快得多。”
行业专家表示,在疫情发生之前,就已经出现数据分散并蔓延的趋势。但他们指出,疫情的到来加速了数据蔓延的速度、范围和影响。Info-Tech Research公司首席组织架构师兼数据与分析高级总监Andy Neill表示,组织比以往任何时候都更需要通过实施更健壮的方法来主动管理,并从数据中获取见解,从而赶上数据快速增长的潮流。
数据蔓延带来的漏洞和监管挑战
Brillio公司美国地区分析负责人Sandhya Balakrishnan表示,问题在于数据呈现爆炸式增长却没有得到管理,使组织的数据容易受到破坏和泄漏。他解释说,用来整合和保护云平台中的数据的主流数据策略通常无法在边缘施行。他说:“这意味着业务运营没有单一的事实来源。这使人们对组织数据的质量和安全性产生了怀疑。”
IBM公司全球首席人工智能官Seth Dobrin表示,数据蔓延也使遵守世界各国和地区的隐私法规成为一项艰巨的挑战。他说:“这变得越来越困难,因为如果组织在多个国家/地区拥有办事机构,并且在各个国家/地区之间共享数据,因此必须遵守所在国或所在地区的法规。”
他补充说,组织最终需要这些数据的单一视图。尽管数据是分散的,但处理数据的用户和业务流程却不是这样。因此,他们需要在集中用例的场景中处理数据。他解释说:“这存在一些悖论。一方面,组织将数据分散,但是它们还需要一种以数据统一的方式来理解、管理和使用数据的方法。”
凯捷公司北美地区工程和研发业务部门技术与创新高级副总裁Subhankar Pal表示,对于首席信息官来说,这意味着他们需要制定一种数据管理战略,以防止数据蔓延,这一战略允许业务快速扩张,同时保持安全性、成本效益、可靠性和性能。他说,“边缘的数据管理为习惯于处理数据中心的首席信息官带来更多新的安全挑战,通过边缘设置,数据处理更靠近数据源,并远离在物理上更安全的集中式数据中心。”
专家表示,随着首席信息官和IT组织与数据蔓延作斗争,以下是需要采取的五个重要措施:
1. 从全面的数字和数据策略开始
这是一个重要的起点,说明控制数据蔓延对业务的价值以及组织不进行优先投资的风险。Neill说:“一旦制定了这一战略,组织就可以有条理、有计划地通过数据实践和平台实施。
2. 专注于支持自动化的数据架构
Dobrin表示,强大的数据架构策略应该解决业务需求的运作方式,映射支持业务所需的数据架构,并部署可以支持各种模式的正确的自动化技术。他警告说:“并没有一个万能的平台能够完成所有工作。”有些技术旨在解决一些“垂直”问题,例如边缘处理或单个云数据存储,还有其他技术来解决“水平”问题,例如数据目录,该目录在整个数据结构中记录数据,然后使数据可供业务用户使用。
3. 组织其他高管的参与
Neill表示,首席信息官只是组织拥有和运营的大型现代数据管理和数据治理格局中的一部分。他解释说:“首席信息官只负责数据保管,或负责支持数据的系统、解决方案和基础设施。”
首席数据官、首席分析官、首席运营官或组织高层的其他非IT成员应拥有数据并执行计划以利用数据资产。他说:“了解这些责任的分配方式以及它们之间的相互关系,可以帮助IT团队和组织对数据保持更一致的控制。更重要的是,可以从中获得更多价值,从而推动业务发展。”
4. 投资安全以跟上数据蔓延的步伐
Pal表示,随着数据用户、接入点以及软件和硬件数量的增加,边缘计算安全性日益受到关注。他解释说:“组织需要投资更安全的、基于边缘的安全解决方案,即使这些解决方案的成本更高也要实施,因为组织难以承受数据泄露带来的损失。组织可以依靠加密和密钥管理作为边缘设备上数据安全性的核心,在某些情况下,多因素身份验证将发挥重要作用。”
5. 确保数据治理能够促进数据的规模化
随着数据流复杂性的提高,组织在尝试实施数据治理时会冒着围绕清单遭遇阻碍的风险。Pal说:“这是对生产力的一种征税。数据治理不应关注于如何限制用户,而应该关注促进大规模安全可控地使用数据,这与规则实施有关。他说:“这种称为DataGovOps的自动化设计了数据质量管理和保护工作流,从而增强而不是限制数据使用。”
首席信息官克服数据泛滥的机会
调研机构IDC公司在2020年开展的一项研究发现,接受调查的IT领导者中有80%认为数据蔓延是其组织必须解决的最关键问题之一。
Dobrin说,没有对数据蔓延采取适当措施的组织将面临实际的财务后果。他们不仅面临遭受数据合规性罚款的风险,而且还必须应对效率低下的存储和处理数据带来的更高成本。
此外,如果组织不能有效地管理数据蔓延,将导致业务流程不可靠以及过于缓慢,他补充说:“其最终结果可能是从不良的业务决策到客户流失,再到更高的客户服务成本。”
总之,数据是一种非常有价值的货币,它为寻求竞争优势的组织提供了更多机会。 Balakrishnan表示,但只有在具有一个明确的战略来标准化存储、安全和使用的情况下,这一点才能奏效。
他说:“对首席信息官来说,这意味着要建立全面了解、发现和管理这些不同的数据资产的能力,而这些资产不能再被视为二次投资。如果组织在数据管理方面进行创新并加强数据治理,那么数据可以释放的机会将成倍增加,包括搜索数据、利用市场使数据民主化以及寻找负责任地利用数据的用例的能力。”