大数据利用率的增加 使Hadoop在电信行业兴起
Hadoop俗称分布式计算,最早作为一个开源项目,最初只是来源于谷歌的两份白皮书。然而正如十年前的Linux一样,虽然Hadoop最初十分简单,但随着近些年来大数据的兴起,其也获得了一个充分体现价值的舞台。这也正是业内普遍将Hadoop看做是下一个Linux的原因。
Hadoop本身是分布式平台,通常来说是由Maste和SqoopHIVE两个角色所构成,用来做数据处理和存储。Hadoop的特点是随着Sqoop数据增加,呈线性扩展方式来进行弹性伸缩。
Hadoop可为电信行业提供有效数据存储
具体到电信行业,Hadoop的作用主要有五个方面。一个是海量低价值密度的数据存储,可以实现像结构化、半结构化、非结构化数据存储,为我们偏冷的数据或者中温度的数据提供高聚合带宽访问和扩容能力。比如典型的业务类型像日志存储和分析,运营商的搜索服务等业务都可以在Hadoop上进行相应的运行。
除了数据存储的应用之外,Hadoop的第二类应用则是在数据仓储里常见的ETL类应用。众所周知,数据的提取和组织是数据应用必不可少的过程,所有结构化、半结构化数据或者不同系统之间的数据格式都不一样,只有进行相应的组织之后,才能进行分析,而Hadoop得作用也恰恰就在于此。
Hadoop的第三类应用就是可以做查询系统或者是离线的查询系统。比如说详单的查询,上网记录的查询,投诉高并发的查询,甚至一些离线分析都可以在Hadoop上完成。
第四种应用就是我们说的话单拆分,处理系统。像二级一级话单处理等。
第五种则主要是为CEP实时处理提供相应的支撑,比如基于用户位置变化进行广告投送,来进行精准广告的推送,这些都可以通过Hadoop 数据库的功能来完成。
中国市场对Hadoop发展至关重要
英特尔数据中心软件部大数据产品高级顾问黎超先生表示,我们认为Hadoop对整个X86的发展会是一次重大的机会,所以英特尔是Apache主要贡献者之一,同时英特尔希望能利用在软硬件方面的投入,使得Hadoop更容易走向传统行业,而并非仅仅局限于互联网行业。
另外,在英特尔看来,中国市场也是Hadoop发展的重点所在。因为中国市场是英特尔的第一大市场,所以英特尔Hadoop核心研发团队完全设在中国上海,目的就是更好的去服务于我们本地的客户。
大家现在看到的英特尔Hadoop发行版的软件包堆栈状态,在英特尔Hadoop发行版里基本包含了所有Hadoop重要的组件,从HDFS到MapReduce到更多语言开发接口以及数据采集接口,同时英特尔提供图形化界面简化企业用户对Hadoop的管理工具包。
和传统的Hadoop相比,英特尔的产品改进之处颇多。第一个是提供商业化的支撑,因为传统行业不像互联网客户能大量使用开源软件,传统行业客户如果使用开源软件,通常也需要有这种厂商来提供商业化的支撑。也就是说在问题出现之后能够获得相应的服务。
电信、金融等行业需求有别于互联网
黎超先生表示,诸如电信,金融等传统行业的客户,其自身需求和互联网客户还有所不同,前者在数据的安全性上比互联网的客户要求更高。所以英特尔Hadoop发行版在数据的安全性、可用性、性能以及易用性等方面都做了比较多的改进。
对于复杂的大数据处理过程而言,没有任何一种平台能够完全满足其需求。英特尔的Hadoop也不例外,这就需要Hadoop本身具有良好的多平台兼容性,比如英特尔Hadoop发行版可以跟电信企业所有数据平台通过各种各样的接口集成,这样就为电信客户形成了一整套完整有效的大数据平台解决方案。便于在不同情况下满足用户的不同需求。
英特尔除了提供Hadoop软件发行包以外,另外可以为用户去提供大数据设备的设计参考,比如说针对数据访问特性,无论高并发类型的访问还是长时间保留低价值密度的数据需求,我们都可以提供不同的参考,企业用户可以根据这些参考找到对应的服务器生产厂商来提供相应的设备去构建自己的大数据平台。 (编辑:ASP站长网) |