Gartner报告:正处于数据科学与机器学习工具 “大爆炸”的时代(2)
有远见者象限如此拥挤不堪,只有不到七家新的供应商在这一象限里争夺位置。 Databricks 于 2 月 5 日获得了 2.5 亿美元的风投。Databricks 对整个分析生命周期的支持、对混合云战略的支持以及支持各种用户的能力,给 Gartner 留下了深刻的印象。用户对基于 Spark 的产品给予了高度评价,据 Gartner 称,文档是 Databricks 的加分项之一。然而,定价、合同谈判及监视、管理和故障排除与调试的潜在问题都是 Databricks 的潜在弱点。 Gartner 表示,这是 DataRobot 在有远见者象限中首次亮相,这要归功于它 “为增强数据科学和机器学习设定了标准”,客户因此有了强大的体验,这有助于公司在已有忠实客户群上获得吸引力。销售执行、定价、可扩展性问题以及 “增强分析” 空间可能的商品化都是共同关注的问题。 H2O.ai 在 2 月 5 日召开了 H2O 世界大会,由于市场竞争激烈,以及客户对其能力的一些担忧,H2O.ai 从领导者象限跌落到有远见者象限中。但,其核心开源机器学习组件的性能仍然是 H2O.ai 的强项,它基于 GPU 的深度学习和无人驾驶人工智能的自动机器学习能力令 Gartner 印象深刻。但是,对于非开发人员来说,学习曲线过于陡峭,而且缺乏管理能力,数据访问和数据准备的能力也欠缺,这些都是令人担忧的问题。 据 Gartner 的说法,Mathworks 在满足以资产为中心的行业客户的需求方面有着 “惊人的力量”(该公司在制造商和工程组织中有着多年的经验)。因此,MathWorks 从挑战者象限向有远见者象限迈出了巨大的一步。它提供的 MATLAB 因其 “民间工程师” 能力而广受赞誉,而实时流媒体、深度学习和仿真的集成数据准备和支持,给人们留下了深刻的印象。Dings 很难被非工程师使用,而且不支持 Google Cloud Platform,缺乏自动机器学习能力也是其不利因素。 Microsoft 凭借基于云端的产品取得了不错的成绩,包括 Azure Machine Learning、Azure Data Factory、Azure HDInsight、Power BI。Microsoft 与第三方合作的方式,尤其是 Databricks 的 Spark 产品,对各种数据角色(包括入门级的机器学习爱好者)的支持也是一个加分项。机器学习过程中的自动化是一个问题,所有不同工具的一致性也是如此。缺乏本地化能力也限制了它的适用性。 尽管 IBM 在 2019 年仍然留在有远见者象限,但它已经失去了优势。IBM Watson Studio 产品的全面性得到了 Gartner 的称赞,该产品为专家和民间数据科学家提供服务。将 SPSS 建模器集成到 Watson Studio 中也得到了称赞。但是,IBM 重塑产品和转变战略的频率是 Gartner 关注的问题,因为获得完整的端到端功能还需要多个产品的许可授权。 Google 在数据科学和机器学习平台排名方面表现相当不错,很大程度上这要归功于 Google 的云端上广泛的可用工具。它的核心数据科学平台包括 Cloud ML Engine、Cloud AutoML、TensorFlow 和 BigQuery ML。但是 Google 也提供了独特的硬件,包括 Tensor 处理单元(Tensor Processing Unit,TPU)、Kaggle 众包以及一系列其他产品。对 Google 来说,可扩展性和速度是 Google 的优势。但是,这些工具之间缺乏端到端的一致性是个问题,而且也缺乏可用性。另外,缺少本地化产品也是个问题。 特定领域者象限 特定领域者象限有四家供应商。 SAP 的 Predictive Analytics(PA)产品与 HANA 紧密集成,使其适合 SAP HANA 客户。处理大型 HANA 数据集和江模型部署到 SAP 应用的能力是强项。SAP 对统一机器学习架构的愿景也是如此,它与 Leonardo 机器学习基金会相关。然而,产品的一致性、不断变化的人工智能战略以及客户体验,都是对这家德国巨头不利的标志。 Domino Data Lab 从有远见者象限降级,这主要反映了其感知执行能力的下降。Gartner 很欣赏 Domino 的产品战略,尤其是它专注于协作和构建端到端解决方案。它与开源和专有产品的整合能力是额外的优势,它的可扩展性也是如此。但是,根据 Gartner 的调查,Domino 侧重于专家数据科学家,这让民间数据科学家感到不满,而且它还缺乏一些数据准备、自动化和增强功能。 Anaconda 仍然属于特定领域者类别。Anaconda 产品的主要优势在于它能够接触开源 Python 社区,该社区继续推动数据科学的创新。它扩展开源 Python 的能力也是个优势。但是根据 Gartner 的说法,成功使用 Anaconda 平台所需的专业知识是一个警示,Python “丛林” 的复杂性也是一个问题。对开源社区的依赖也使客户在需要某些特定内容时处于劣势(Gartner 使用了模型操作化的示例),整体的一致性水平也是缺点之一。 (编辑:ASP站长网) |