设为首页 - 加入收藏 ASP站长网(Aspzz.Cn)- 科技、建站、经验、云计算、5G、大数据,站长网!
热搜: 创业者 手机 数据
当前位置: 首页 > 运营中心 > 产品 > 正文

【IDCC2020】圆桌对话:技术定义IDC(9)

发布时间:2020-12-13 05:11 所属栏目:30 来源:网络整理
导读:
导读:吴成斌:关于这个问题,以前我们数据中心都是定义为IT系统、服务器、网络服务的,数据中心建设成什么样主要取决于IT的需求。但是随着数据中心的技术演进,向上影响服务器的状态,比如液冷服务器,整机柜服务器,都

吴成斌:关于这个问题,以前我们数据中心都是定义为IT系统、服务器、网络服务的,数据中心建设成什么样主要取决于IT的需求。但是随着数据中心的技术演进,向上影响服务器的状态,比如液冷服务器,整机柜服务器,都是由于数据中心的形态变化主动产生的一些革新,并不是它们自己业务的需求,而是我们底层的技术去影响。慢慢有可能以后数据中心的架构和技术还会影响互联网和云计算的形态,我们出于某种考虑这个数据中心的可用性只有两个9,只有三个9,你的备份要根据我的特点做一些调整。未来可能上层的互联网和IT系统,和IDC可能会有一些互动,相互的影响。这是我的想法。

主持人:谢谢。前面几位嘉宾把我们的话题引到了运维的阶段,我们最后吴总谈到了关键的一点,要承认数据中心不是百分之百可靠,我们看看运维这个阶段。按通常来讲,我们按狭义计算,数据中心运维错误率其中有将近30%是人为故障造成的,如果我们把这个间接的计算上,这个问题没及时发现,发现了没及时解决,去解决的时候又没解决好,全是人为造成的,这些加起来相当于70%的错误都是人为造成的,人也非常重要。像刚开始说的,对于技术来讲,不仅仅是影响一些物质化的东西,技术是否也会影响到IDC人的思维、行为习惯和管理行为?让我们人的管理,人的效率提高。各位嘉宾有没有这方面的感受或者看法?

吴成斌:现在数据中心里面确实出现了很多智能化的手段,这些可以大大降低我们对人力的需求,这也是由于IDC形态的发展而引起的,以前的数据中心可能很小,现在对人力的需求越来越高,这些智能化的手段可以缓解或者解决现运营或者运维阶段的一些问题,包括郭总的公司产品就是来解决我们这个问题的。我觉得这个问题肯定是以后数据中心技术变革一个非常重要的方面,毕竟我们制冷系统还有供配电系统是非常传统的行业,它的变革会相对慢一点,而智能化系统它的技术是新的,需求是新的,一定会引领数据中心技术的变革趋势。

郭逸昕:从运维态势来说,我们可能习惯性分成一线的值班监控,二线的技术专家,然后是管理层。大部分的一线做的7×24小时几班倒,他们是可以去进一步利用,这个利用的方法很简单,就是相信在座的各位如果管IDC都有自己大量的知识库或者以往根据不同设备的维修经验,其实只要在出现这个事件的时候能通知一线人员以往用了哪些操作步骤,多做这么一步,对于他们来说可能就能多干出50%的事情,就不用呼叫二线了,二线的专家可能研究当前的新技术,可以规划制冷和供配电,管理层可以去基于这个去建设新的运维管理体系或者运营体系。我就可以把原有的一线变成1.5线,拿医院来说从分诊台变成社区医院的医生。这个很重要。

严瀚:因为我们公司还有代维的业务,代替客户运维整个数据中心,我们了解了很多东西。刚才讲的规划也是朝这个方向发展,更自动化,更好的运行,核心就是颗粒度和架构问题。如果你的系统架构有单点你就要有专门的人看这个,要不然出现就是致命的问题,比如像冷机、主管和主要的冷却塔。颗粒度的选择非常重要,我们现在小颗粒度的理念,包括间接蒸发冷却也是小颗粒度,一个一千瓦的数据中心可以有10台,甚至20台空调,因为每个系统只有50千瓦,一个一千瓦的空调就有24个系统,这24个系统都是完全独立的,坏一个压力就比较低了。浪涌的模式,这种架构可以保证整体的可靠性,包括对监控远程的支持,可以实现设备的智能化全部远程进行后台的监控,甚至管理远程的开关机,远程调温都是可以实现,需要分级的授权。我们客户可以在家里面用手机直接接受数据中心的故障,如果出现一个小故障,一个颗粒度坏了对于制冷系统的影响只有二十四分之一,这样就高枕无忧。我们杭州有一个具体的金融客户采用了这种架构,原来如果按照正常的运维班底需要三班倒,每班三个人运行3000千瓦的机房,但是换成我们这种方案以后只请了一个人,白天8个小时做巡逻和日常性事物,下班之后靠手机接收,节省了80%的人力。这个给整个数据中心运维带来的革新可能是翻天覆地的变化,所以越来越多的小颗粒度系统,最佳颗粒度一直是我们研究的重要方向,肯定会给运维带来更大的改变。

杜远:刚才听三位领导讲的时候,我心里在琢磨一个问题,技术和人为造成故障的关系,这个问题挺尖锐的,我听着也挺怪的。之前讲到人有30%的错误是由人为造成的,解决这个错误都是通过管理手段,很少通过技术手段。模拟了好几个场景,因为人为造成的问题有两种,一种是故意的,一种是不小心的。故意的没有办法,手里拿着绝缘钳子的东西在里面晃荡,任何手段都是没有作用的,他是蓄意的。但是非蓄意的,不小心造成的情况,什么样的技术手段可以去弥补呢?因为有些工作不是AI可以代替的,现在没有那么高级的机器人可以代替,比如我就是拧一颗螺丝,就是需要一个人,这里的技术含量,我的螺丝刀不一样,我是防脱落的,可能有一点技术含量,但是真的到不了现在所谓的跟新基建相关也好,跟AI相关也好,到不了这个层面,只是简单的机械原理。

(编辑:ASP站长网)

网友评论
推荐文章
    热点阅读