对于数字行业的老兵来说,Hadoop 在 '大数据' 的演变中意味着一个前后变化。 不仅在技术层面上,作为首个大规模采用的平台来存储和利用大量信息,还因为它带来了利用这一趋势开辟新市场的新技术参与者。
Uno de ellos fue Cloudera, fundada en 2008, que en el imaginario colectivo sigue marcada a fuego como la empresa detrás de la distribución más extendida de Hadoop en el mundo empresarial. Pero los tiempos cambian, y esta multinacional busca transformarse en tiempos en que 数据是无处不在的,人工智能需要这些数据才能构建。
“Cloudera的遗产很重要,因为它让我们深入理解了大型企业如何应对处理和管理海量数据的挑战,”** Charles Sansbury,公司的首席执行官,担任这一职务已超过一年** 解释道。“但我们投入了大量时间和资源来发展我们的技术。今天,我们参与了数十个开源项目,将这些技术结合起来,使其可供大型公司使用。我们不再仅仅是一家Hadoop公司,尽管一些竞争对手坚持将我们贴上这样的标签。”
在与 DISRUPTORES - EL ESPAÑOL 的采访中,Sansbury 辩称,这一转型不仅仅是技术上的,更是战略上的,并且与数据本身的迁移密切相关,从每个公司的数据中心到公共云环境,越来越多地采用结合这两个世界的混合方法。
“当我来到这里时,许多组织表示他们的 100% 工作负载将迁移到云端。但今天,在与世界上大多数大型银行和许多政府交谈后,我听到的情况截然不同:仅有四分之一,也许三分之一的操作在公共云上,”这位高管评论道。“大型企业正在押注于一种混合平台,使他们能够在本地环境和云中管理工作负载。这对我们来说是个好消息,因为我们的赌注一直是提供这种能力。”
指的是 Cloudera 数据平台,一种结合了 Spark 和 Ozone 等技术以及用于管理混合环境中数据的工具的解决方案。 根据 Sansbury 的说法,该平台还允许将结构化、非结构化、合成和机器生成的数据集成到一个平台中。
“有趣的是,云服务的大型供应商和基于云的数据管理公司都开始接受与本地数据更好地互操作的必要性,”Sansbury指出。“尽管他们没有公开承认,但他们的行动反映出他们听取了客户的意见。企业不愿意将每一片数据都迁移到云端, 这迫使他们寻找能够在不同基础设施之间提供互操作性的 платформы。”
“说你可以合并几张电子表格很简单,但当我们谈论持续创建和分析的全球交易数据的巨大体量时,现实却大相径庭。这正是我们的平台旨在管理的内容,提供能够实现最复杂数据集的摄取、存储和分析的工具,”宣称。
我请求具体化,以将这个想法落实到实际领域,并呼吁金融部门: “一天结束时账户的余额是多次互动的结果:存款、取款、累积的利息…… 这些元素每一个都有其自身的数据管理复杂性。我们从客户那里听到的是对这些数据来源和相关性在其分析中具有确定性的需求。”
数据的遣返
无论如何,显而易见的是,公共云作为一种通用解决方案——经济、高效和安全——来进行l a gestión de datos的承诺已经落空。
“企业发现,采用基于云的架构所承诺的节省并没有实现。在许多情况下,**由于计算和电力的可变费用,成本反而增加了,**这些是云定价的关键组成部分,”查尔斯·桑斯伯里证实道。“这些成本不仅没有下降,尤其是在电力方面,反而在上升。”
Y cual efectó dominó, muchas organizaciones se han puesto manos a la obra para redefinir sus estrategias al respecto: “我们看到的案例是,与云相关的成本并没有上升50%,而是比预期高出几个数量级。 某些持续运行并需要大量计算资源的工作负载应该在本地基础设施或在自有硬件的私有云上运行。另一方面,像一次性促销或概念验证这样的临时任务或需求变化的任务,适合在公共云上进行。”
现在的承诺是通过将云与本地基础设施相结合的混合模型。根据Cloudera的最高负责人所说,“通过允许企业将其工作负载分配到合适的环境中,我们不仅优化了成本,还提供了在一个技术要求不断变化的世界中至关重要的操作灵活性。”
从大型 '数据湖' 到 '边缘计算'
边缘计算虽然在过去几年中失去了一些主导地位,但仍然是许多首席信息官战略中的核心主题,包括我们所讨论的供应商。查尔斯·桑斯伯里甚至辩称,这一趋势在其客户中开始重新获得动力。“在过去的12个月里,我们看到关于边缘的讨论重新兴起。最初,趋势是将所有内容集中在大型数据存储库中,但一些行业,如自然资源或能源行业,正在探索如何直接在边缘利用数据分析。”
一个例子是执行官强调的石油和天然气公司:“这些公司在陆地和海上平台上运营,正在引领边缘计算用例的发展。在某些情况下,在偏远地点捕获的数据足以进行本地分析,这消除了集中处理的必要性。但在其他情况下,数据需要与来自不同位置的其他数据集集成,以获得全面的视图。”
因此,挑战在于确定在什么场景下边缘的本地分析是足够的,以及何时需要统一数据:“我们仍处于早期阶段,企业正在努力寻找在边缘保持分析与集中数据以获得更全面视图之间的平衡。然而,我们相信,从长远来看,模型将演变为在边缘拥有更多的计算和存储能力,因为这将更高效。”
吃或被吃
Cloudera曾是一家上市公司,直到两个投资基金决定将其从交易所撤回,以加快其转型并推动其增长。然而,这家公司的规模与许多竞争对手相比仍然较小(例如,包括大型云超大规模公司),但在其活动层面上仍保持着一个有趣的主导地位。
一种典型的情况让我们面临一个经典的两难选择:吃还是被吃。 “我们是两家私募股权公司的财产。在这种环境下,你无法预测未来,所以我专注于我能控制的事情,那就是构建伟大的产品,提供卓越的客户服务,并创造一个团队能够获得授权的环境,”桑斯伯里回避了可能出售的问题。
对于Sansbury来说,Cloudera的规模使其具有竞争力,但也使其对收购具有吸引力,这并不是一个劣势,只要保持对基础的关注。“如果你做对了事情,就会创造选择:你可以吸引资本,收购公司或重新回到公开市场,”他解释道。
在这方面,目前 Cloudera 的战略包括合并和收购,以加速创新。“我们的客户告诉我们他们希望看到哪些能力。我们识别出对他们相关的技术,并在合适的时机将其纳入,”Cloudera 的 CEO 接着说道。“我们在我们的生态系统中整合解决方案,以以盈利的方式加速研究和开发。这是一种优化成本并为我们的客户和公司带来价值的方式。”