分布式系统面临的挑战有哪些 分布式系统带来的问题及解答

本文章由注册用户 知无涯 上传提供 评论 发布 纠错/删除 版权声明 0
摘要:分布式系统建立在网络上,而网络是不可靠的,可能的网络问题包括:网络分割、延时、丢包、乱序等,这些会给分布式系统带来挑战,除此之外,异构的机器与网络、普遍的节点故障也是分布式系统面临的主要挑战之一。分布式系统工作过程中,还会带来一些问题,比如如何找到所需的服务、如何避免雪崩、如何对系统进行监控等。下面一起来看看分布式系统面临的挑战有哪些以及分布式系统带来的问题及解答吧。

一、分布式系统面临的挑战有哪些

分布式系统需要大量机器协作,面临诸多的挑战,其中主要的挑战有:

1、异构的机器与网络

分布式系统中的机器,配置不一样,其上运行的服务也可能由不同的语言、架构实现,因此处理能力也不一样;节点间通过网络连接,而不同网络运营商提供的网络的带宽、延时、丢包率又不一样。怎么保证大家齐头并进,共同完成目标,这是个不小的挑战。

2、普遍的节点故障

虽然单个节点的故障概率较低,但节点数目达到一定规模,出故障的概率就变高了。分布式系统需要保证故障发生的时候,系统仍然是可用的,这就需要监控节点的状态,在节点故障的情况下将该节点负责的计算、存储任务转移到其他节点。

3、不可靠的网络

节点间通过网络通信,而网络是不可靠的。可能的网络问题包括:网络分割、延时、丢包、乱序。相比单机过程调用,网络通信最让人头疼的是超时:节点A向节点B发出请求,在约定的时间内没有收到节点B的响应,那么B是否处理了请求,这个是不确定的,这个不确定会带来诸多问题,最简单的,是否要重试请求,节点B会不会多次处理同一个请求。

总而言之,分布式的挑战来自不确定性,不确定计算机什么时候crash、断电,不确定磁盘什么时候损坏,不确定每次网络通信要延迟多久,也不确定通信对端是否处理了发送的消息。而分布式的规模放大了这个不确定性,不确定性是令人讨厌的,所以有诸多的分布式理论、协议来保证在这种不确定性的情况下,系统还能继续正常工作。

二、分布式系统带来的问题及解答

1、如何找到所需的服务?——服务发现组件

问题描述:线上生产环境中,尤其容器部署情况下服务实例地址(服务器端口)是动态分配的,服务调用者无法提前获取服务实例地址和端口。

解决方案:在服务运行时,通过服务发现组件解析服务名来获取服务实例地址和端口。

2、如何找到实例?——请求分发的策略

问题描述:找到服务器后,还应该确定将当前请求发往服务器的哪一个实例。

解决方案:

(1)如果同一个服务的实例都是完全对等的(无状态),那么按负载均衡策略来处理就足够(随机、轮询、权重、hash、一致性hash、fair等各种策略)。

(2)如果同一个服务的实例不是对等的(有状态),那么需要通过路由服务(元数据服务等)先确定当前要访问的请求数据在哪一个实例上,然后再进行访问。

3、如何避免雪崩?

问题描述:一个故障由于正反馈不断被扩大,从而导致整个系统故障

解决方案:

(1)【快速失败】和【降级机制】:熔断、降级、限流等,通过快速减少系统负载来避免雪崩的发生。

(2)【弹性扩容机制】,通过快速增加系统的服务能力来避免雪崩的发生。

4、如何对系统进行监控?

问题描述:对于一个分布式系统,如果我们不能很清楚地了解内部的状态,那么高可用是没有办法完全保障的。

解决方案:监控系统的各层

(1)【硬件层面】:服务器温度、磁盘RAID阵列等。

(2)【系统层面】:存活状态、CPU、RAM、load负载。

(3)【应用层】:mysql、Nginx、Django、LVS、HAProxy。

(4)【业务层面】:PV、UV、订单。

5、分布式存储如何做数据切片?

问题描述:既然要实现分布式数据库,那么应该如何将数据进行切片?

解决方案:Hash、Consistent Hash和Range Based分片策略。

6、如何设置冗余?如何复制数据?

问题描述:分布式存储的高可用性需要冗余来保证,那么如何做冗余?如何对数据进行复制、更新时保证两份数据的一致性?

解决方案:

(1)【中心化方案】:主从复制、一致性协议(Raft和Paxos)。

(2)【去中心化的方案】:Quorum、Vector Clock。

网站提醒和声明
本站为注册用户提供信息存储空间服务,非“MAIGOO编辑”、“MAIGOO榜单研究员”、“MAIGOO文章编辑员”上传提供的文章/文字均是注册用户自主发布上传,不代表本站观点,版权归原作者所有,如有侵权、虚假信息、错误信息或任何问题,请及时联系我们,我们将在第一时间删除或更正。 申请删除>> 纠错>> 投诉侵权>> 网页上相关信息的知识产权归网站方所有(包括但不限于文字、图片、图表、著作权、商标权、为用户提供的商业信息等),非经许可不得抄袭或使用。
提交说明: 快速提交发布>> 查看提交帮助>> 注册登录>>
最新评论
相关推荐
如何判别分布式系统的优劣 判断分布式管控系统优劣的七大标准
分布式系统在各行各业的应用越来越广泛,市面上的分布式系统产品也比较多,主要可以通过看核心技术、看功能覆盖、看画面还原度、看大屏同步性、看坐席延时性、看集中管控、看运维管理七个方面来判断其优劣。下面一起来看看如何判别分布式系统的优劣以及判断分布式管控系统优劣的七大标准吧。
分布式系统面临的挑战有哪些 分布式系统带来的问题及解答
分布式系统建立在网络上,而网络是不可靠的,可能的网络问题包括:网络分割、延时、丢包、乱序等,这些会给分布式系统带来挑战,除此之外,异构的机器与网络、普遍的节点故障也是分布式系统面临的主要挑战之一。分布式系统工作过程中,还会带来一些问题,比如如何找到所需的服务、如何避免雪崩、如何对系统进行监控等。下面一起来看看分布式系统面临的挑战有哪些以及分布式系统带来的问题及解答吧。
分布式系统和集中式系统的区别有哪些 分布式系统好还是集中式系统好
分布式系统和集中式系统在系统架构、数据存储、任务分配、应用场景等方面存在一定的差异,相比较而言,集中式系统具有架构简单、易于管理和控制的优点,适用于对数据一致性要求较高的场景;而分布式系统具有架构灵活、可扩展性强的优点,适用于对数据处理能力和并发访问能力要求较高的场景。下面一起来看看分布式系统和集中式系统的区别有哪些以及分布式系统好还是集中式系统好吧。
分布式系统为什么具有健壮性 怎么构建健壮的分布式系统
分布式系统的处理和控制功能是分布的,单一站点产生的故障不会对整个系统造成太大的影响,即使设备故障,也可以通过容错技术实现系统的重构,因此分布式系统一般都具有健壮性,不过构建分布式系统时,还是要注意通过最小化组件间依赖、隔离错误、在系统中建立缓冲区等方法,构建更健壮的分布式系统。下面一起来看看分布式系统为什么具有健壮性以及怎么构建健壮的分布式系统吧。
分布式系统的CAP理论是什么 分布式系统CAP特性如何取舍
分布式系统的CAP理论是指一个分布式系统不可能同时满足数据一致性、服务可用性和分区容错性这三个基本需求,最多只能同时满足其中的两个,这一理论深刻影响着分布式系统的发展,在实际应用中,分布式系统会根据需求舍弃其中一个特性,大多数都是牺牲了一致性。下面一起来了解一下分布式系统的CAP理论是什么以及分布式系统CAP特性如何取舍吧。