数据准备工具:详解策略的秘密武器
Gartner公司数据和分析团队高级分析师、《Gartner公司数据准备工具市场指南》的主要作者Ehtisham Zaidi说:“寻找、访问、清理、转换数据,以及及时与合适的人共享数据,仍然是数据管理和分析中最耗时的障碍之一。” Hitachi Vantara公司首席营销官Jonathan Martin表示,对于希望通过分析来转变业务的组织而言,主要问题不在于掌握人工智能,而在于掌握数据管道。 他说,“数据准备工作是很具挑战性的工作。如何确定所有这些数据在哪里?可以建立一个投资组合吗?是否可以设计管道以自动、托管和管理的方式将所有这些数据源连接在一起,从而使组织能够在正确的时间将这些数据获取到正确的位置、正确的人员、正确的机器?” 那么如何采用数据准备工具以解决这些问题?以及在为组织选择数据准备工具时需要寻找哪些内容。以下是深入研究数据准备为何仍然是重大分析面临的挑战的原因, 数据准备面临的挑战 多种因素加剧了数据准备面临的挑战。 首先,支持分析计划所需的数据源和数据类型的数量和复杂性呈指数级增长。通过组织内部和外部的分布式数据生态系统访问这些数据源需要大量的时间、资源、技能和工具来完成。 IDC公司数据集成和完整性软件服务研究总监Stewart Bond说,“这是当今时代数据环境具有的复杂性。因为存在多种不同的数据类型:交易数据、社交媒体数据、结构化数据、非结构化数据、日志文件数据、图形数据。数据环境存在各种不同的数据,存储这些数据的技术也各不相同。” 其次,对自助数据访问和集成的请求数量使IT团队不堪重负。Zaidi说,这表明从集中式IT模型到数据集成的功能不再有效。 他说:“IT部门需要通过易于用户使用和理解的工具来配置数据访问和集成,这是对数据准备的需求进一步上升的原因。” 第三,数据需求不断变化,因为业务分析师、集成商、业务用户、数据工程师和数据科学家对他们的项目都有不同的数据需求。 Zaidi说:“这使得一次准备数据并使不同的角色/消费者可以使用它们来满足他们不断变化的需求,” 下一代数据准备工具 他补充说,随着数据准备工具的成熟,组织的痛点已经显著改变。其痛点在于用来连接哪些数据源以及准备哪些数据。如今,组织将重点放在数据治理、沿袭、可追溯性和质量上。他们还面临着确保具有必要技能的合适人员可以使用数据准备工具访问正确数据的权限。 Bond将此归结为“数据智能”问题,即有关数据的元数据。 (编辑:ASP站长网) |