当前位置: 首页 >互联网 > 内容

当今的大数据挑战源于多样性 而非数量或速度

互联网
导读 根据Gartner研究副总裁Doug Laney的说法,管理和利用大数据的挑战来自三个方面。Laney在十多年前首先指出,大数据给企业带来这样的问题...
2022-06-23 03:05:13

根据Gartner研究副总裁Doug Laney的说法,管理和利用大数据的挑战来自三个方面。Laney在十多年前首先指出,大数据给企业带来这样的问题,是因为它引入了难以管理的数量、速度和多样性。问题是,太多的IT部门在数据量和速度上抛弃了他们所拥有的一切,忘记了解决各种数据的基础问题。

早在2001年,Laney就写道,“领先的企业将越来越多地使用集中式数据仓库来定义一个通用的业务词汇表,以改善内部和外部的协作。”这种词汇的问题——以及阻止公司创建它的可变性——仍然是当今大数据问题中解决得最少的方面。

三大数据

许多企业已经找到了利用增加的数据量和速度的方法。例如,脸书可以分析大量数据。当然,这些数据通常会在相同的参数中反复出现。这促进了技术创新,如列数据库,现在被其他公司广泛使用,这些公司面临着相同数量的类似数据项。

在驯服速度方面,像Spl unk这样的供应商通过每秒捕获数千个事件的日志文件来帮助企业分析快速创建的数据。对大量事件的分析旨在安全和性能监控用例。与数据量挑战一样,速度挑战主要通过复杂的索引技术和分布式数据分析来解决,这些技术使处理能力能够随着数据速度的提高而扩展。

然而,在多样性方面,太多的企业仍然面临着大数据分析方法的大问题。这个问题是由三个因素驱动的:第一,由于成长、收购和技术创新给环境增加了新的系统,企业被锁定在一个高度异质性的环境中,而这种异质性只会随着时间的推移而增加。企业需要跟踪太多类型的系统和管理成千上万的数据类型,并且使用不同的名称和格式来表示相同的数据。

其次,在很多情况下,这些系统和数据类型会报告相关信息,这些信息可以安全地过滤掉,与要解决的问题无关。有必要可靠地识别有影响的信息。

综艺挑战的第三个方面是环境的不断变化或改变。升级系统、引入新系统、添加新数据类型和引入新术语。这进一步削弱了我们应对数据变化挑战的能力。这给多样性挑战增加了一个额外的层次。(如需了解更多信息,请查看《大数据:如何捕捉、粉碎和利用大数据做出商业决策》。)

解决数据变更的问题

要解决数据变更问题,企业必须从IT领域着手,因为它通常代表着最严重的违规者和各种问题的最大受害者。第一步是从所有IT元素或资产的全面定义或分类开始。这为IT内部或周围的任何事情提供了基线或基础,使企业能够根据已知的分类法或术语来管理不断增长的异构性。

下一步是确定在不同的记录系统中表现同一物体的多种方式。这使IT专业人员能够查看他们的异构环境,并高度过滤和压缩数据到相关和可管理的数据块中。

最后,IT经理必须采用不断检查环境的过程,例如引入新类型的元素或引用相同元素的新术语。

通过这些步骤,IT组织可以管理各种问题,并获得深入的见解,而这在历史上与IT团队无关。此外,管理品种的问题大大提高了他们在工具和技术上的投资回报,这些工具和技术解决了更传统的数据量和速度问题。

版权声明:转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢您的支持与理解。