CAP定理由如下三部分组成。
CAP里面的C和A都比较好理解,P好像有点抽象,其实这么理解就对了,P的意思就是允许存在网络故障。
对于一个分布式数据存储系统来说,如果没有网络故障
,那么CAP的 三个特性都是可以满足
的。
但分布式系统的 网络故障一定是不可避免的
,所以P是一定要满足的,并且此时C和A只能满足一个,因此就出现了CP模型和AP模型。
假设我们现在有如下这么一个分布式数据存储系统。
当数据同步因为网络问题而无法实现时,下面来分别看下CP模型和AP模型的行为是什么。
在CP模型下,因为要满足C的一致性,所以一旦网络出现问题导致数据同步失败,此时数据的读取就会被拒绝从而导致读取超时或失败,这种情况下,系统变得不可用,即A不满足。
在AP模型下,因为要满足A的可用性,所以就算网络出现问题导致数据同步失败,此时数据的读取还是能够成功读取到数据,但这种情况下节点间的数据是不同的,即C不满足。
CAP的C表示一致性,要求节点间的数据要完成数据同步。
CAP的A表示可用性,要求系统对外随时都能提供数据读取的服务。
CAP的P表示分区容错性,要求系统能够在存在网络故障的情况下运行。
因为分布式系统中网络故障是一定会存在的,所以P是一定要满足的,并且C和A是一定无法同时满足的,此时就形成了CP模型和AP模型。
CP模型在网络发生故障时会拒绝对外提供数据读取服务,此时A也就是可用性无法满足。
AP模型在网络发生故障时还是会对外提供服务,但节点间的数据会不一致,此时C也就是一致性无法满足。
在Nacos中,对于临时实例的服务实例信息获取,Nacos采用AP模型,具体的实现采用Distro协议,而对于持久化实例,Nacos采用CP模型,具体的实现采用SOFAJRaft协议。