设为首页 - 加入收藏 ASP站长网(Aspzz.Cn)- 科技、建站、经验、云计算、5G、大数据,站长网!
热搜: 重新 试卷 文件
当前位置: 首页 > 运营中心 > 建站资源 > 优化 > 正文

阿里大牛详解分布式系统,大型网站分布式系统实战解析

发布时间:2019-08-05 12:06 所属栏目:21 来源:JavaSpring高级进阶
导读:分布式系统 分布式系统从当初的CORBA 到EJB,Web和SOA,从集群到现在的NoSQL 云计算和大数据Hadoop等分布式系统,横向水平扩展Scala out/in是分布式系统设计的一个特点,可靠性 容错性是两个质量指标。 什么是分布式系统? 一大批服务器组成一个集合,对于

分布式系统

分布式系统从当初的CORBA 到EJB,Web和SOA,从集群到现在的NoSQL 云计算和大数据Hadoop等分布式系统,横向水平扩展Scala out/in是分布式系统设计的一个特点,可靠性 容错性是两个质量指标。

什么是分布式系统?
  1. 一大批服务器组成一个集合,对于用户来说仍然是一个整体连贯系统。
  2. A. Tanenbaum定义:分布式网络的计算机中的组件之间协调动作是通过消息进行通讯。
  3. G. Coulouris定义:当你知道有一台电脑崩溃,但是你的软件运行从来不会停止。
  4. Leslie Lamport定义:分布式系统是这样系统:旨在支持应用程序和服务的开发,可以利用物理架构 由多个自治的处理元素,不共享主内存,但通过网络发送异步消息合作。
  5. 与分层应用区别:分层的应用程序(例如,3层)是 划分应用程序逻辑,是一种逻辑分层,而不是物理,而分布式系统DS是物理分层,和实际部署有关。

与传统集中式系统相比:

集中式系统是一种Scale out/in,纵向扩展,要么向上升级服务器到中大型机,要么升级多核,增加CPU核数,集中式纵向扩展适合计算聚合度比较高的数据,而分布式适合计算松散数据,非结构化或半结构化数据。无论采取哪种扩展伸缩方案,需要根据业务数据特点而定。

任何分布式系统总是需要完成两个任务:计算和存储。计算和存储分离是分布式系统的重要特征。而通常在集中式或单机系统中,这两者是可能结合在一起,比如通过一个SQL语句实现查询后排序,查询是从存储中获得数据,排序是属于计算,因此这个SQL语句实际是将计算和存储耦合在一起。在应对大数据或大并发的情况下,这种方便的捆绑带来性能问题,而分布式计算和分布式存储虽然带来复杂性,但是也为系统的处理能力打开了上升拓展的空间。

分布式系统特点:

  1. 并发性:共享资源,采取ACID或Base原则,见:CAP定理。
  2. 分布式系统设计遵循CAP定理, CAP是:Consistency(一致性), Availability(可用性), 和 Partition tolerance(分区容错性) 可靠性 简称,CAP定理认为,CAP三种之中,只能同时满足其中两种。
  3. 可扩展性Scalable是重要特点,通过扩展能够获得高性能 高吞吐量 低延迟Latency。
  4. 可靠性/可用性:故障发现和处理以及恢复 容错处理。在一个正常运作系统中存在一个时间比例的条件。 如果一个用户不能访问系统比例增大,它被认为是不可用。可用性公式:
  5. Availability = uptime / (uptime + downtime)
  6. 容错failover是指一个系统在错误发生的情况下,仍然一切运行正常。表示这个系统是宽容错误的。
  7. 消息处理: 具体产品有:RabbitMQ ZeroMQ Netty等等。
  8. 异构性: 不同操作系统 硬件 程序语言 开发者,中间件是一种解决方案。
  9. .安全性:授权认证 SSO单点登录 Oauth等等。

定位命令:

  1. 标识资源 URLs
  2. 命名服务Naming services
  3. 定位寻找Lookup
  4. 主要见SOA中的服务查找。如Zookeeper实现服务查找。

透明性:

  1. 访问透明度: 使用相同的操作本地和远程资源
  2. 位置透明:访问资源无需知道其物理或网络位置
  3. 并发透明度:多个流程可以同时运行访问使用共享资源,当不能干扰堵塞 它们的处理流程
  4. 复制透明性: 资源的多个实例可以被用来复制以提高可靠性和性能,但无需由用户编制专门的应用程序来实现。
  5. 故障透明度:出现软件硬件故障时,使用户和应用方案能继续完成他们的任务不受影响。
  6. 移动透明度:允许在 系统存在移动的资源和客户。
  7. 性能透明度:允许系统重新配置以 提高性能负荷变化
  8. 缩放透明度:在应用程序结构没有变化的情况下能够在规模上扩展或伸缩系统,以提高吞吐量处理能力。
分布式系统的挑战

分布式系统是难于理解、设计、构建 和管理的,他们将比单个机器成倍还要多的变量引入到设计中,使应用程序的根源问题更难发现。SLA(服务水平协议)是衡量停机和/或性能下降的标准,大多数现代应用程序有一个期望的弹性SLA水平,通常按"9"的数量增加(如,每月99.9或99.99%可用性)。每个额外的9变得越来越难实现。

让事情更加复杂的是,我们越来越常见地看到:分布式系统的故障表现为间歇性错误或性能下降(俗称的限电)。这些失败模式耗费更多时间来诊断。例如,Joyent经营一些分布式系统作为其云计算基础设施的一部分。在这样一个系统中,包括高可用性、分布式的键/值存储,Joyent最近经历了瞬态应用程序超时。对于大多数用户系统运行正常,其反应延迟也是在SLA范围内。然而,有百分之5 - 10的请求超出了一个预定义的程序超时。这样的失败问题并没有重现在开发或测试环境中,他们经常会"消失"几分钟到几小时。排除这个故障的根本是需要大量数据存储的系统分析。

这些系统包括:数据存储API(node . js),RDBMS(关系数据库管理系统)和由系统内部使用(PostgreSQL)以及操作系统和终端用户应用程序依赖于的键/值系统。最终,导致过度的根本问题是在应用程序语义锁定,但确定之前需要相当大的数据收集和相关性工作,包括工程师耗费大量工作时间以及学习不同领域的专业知识。

分布式系统由两个物理因素的限制:

  • 节点的数量(能够增加所需的存储和计算能力)
  • 节点之间的距离(信息的传送距离,最好以光速)

这两个约束导致下面值得挑战的情况发生:

  • 独立节点随着数目的增加发生故障的概率增加(减少可用的和管理成本增加)
  • 独立节点随着数目增加可能会增加节点之间的通信的消耗(随着规模的增大性能降低)
  • 地理距离的增加提高遥远的节点之间的通信延迟(减少某些操作的性能)
如何架构分布式系统

适用于分布式系统架构的最常见的一个术语是SOA(面向服务架构)。SOA可以避免不愉快的CORBA(公共对象请求代理体系结构),通过WS - *标准,一套松散耦合的Web服务完成独立的小功能,并且彼此独立,他们是一个有弹性的分布式系统的基础。对比上一代,服务是新流程,他们是正确的抽象层次系统中的离散功能。

(编辑:ASP站长网)

网友评论
推荐文章
    热点阅读