通过2-3-4树理解红黑树

上一篇博文中,发现红黑树在批量删除最小值时性能非常的好

有点看不懂了,因此重新回顾了一下红黑树进行理解

上学时每次看算法导论的红黑树都是半懂,插入还行,删除部分的双重黑色实在太难理解了

其中的旋转变色部分也是觉得很奇怪,为什么要这么操作,能不能用别的操作方式

这一次尝试使用众多好评的2-3-4树来进行理解,加深印象

2-3-4树和红黑树是等价的

根据规则,任意一颗2-3-4树都可以转换为红黑树

推导,任意一颗红黑树都可以转换为2-3-4树:

  • 黑节点就相当于2节点
  • 一旦出现红节点
    • 由于红色节点的子节点为黑色,所以不允许出现两个相同红色节点
    • 那么红节点的父节点一定为黑色。因此红节点加上他的父节点,至少可以组成一个3节点
  • 在这个基础上,如果红节点的兄弟节点也是红色的,红节点,父节点和兄弟节点可以组成一个4节点

因此2-3-4树和红黑树是等价的

并且,由于2-3-4树的节点最多只存在一个黑色节点,因此2-3-4树的高度 = 红黑树的高度

用2-3-4树来理解红黑树的操作

插入

寻找后插入叶子节点

从上往下搜索,直到达到叶子节点

被插入的叶子节点是2节点

变成3节点

graph TB
	subgraph 如果叶子节点是2节点
		subgraph 插入2前
    	a[1]
    	b[2]
    	end
    	subgraph 插入2后
    	c[1 and 2]
   		end
	end

对应红黑树:父节点为黑色

直接插入红色节点

graph TB
	subgraph 父节点为黑色
   		subgraph 插入2前
   		a((1))---b((nil))
   		c((2))
   		end
   		style c fill:#f9f,stroke:#333,stroke-width:4px

		subgraph 插入2后
		d((1))---e((nil))
		d((1))---f((2))
		end
		style f fill:#f9f,stroke:#333,stroke-width:4px
   end

被插入的叶子节点是3节点

变成4节点

graph TB
    subgraph 如果叶子节点是3节点
    	subgraph 插入0前
        a1[1 and 3]
        b1[2]
        end
        subgraph 插入0后
        a2[0 and 1 and 2]
        end
        subgraph 插入4前
        a3[1 and 3]
        b3[4]
        end
        subgraph 插入4后
        a4[1 and 3 and 4]
        end
        subgraph 插入2前
        a5[1 and 3]
        b6[2]
        end
        subgraph 插入2后
        a6[1 and 2 and 3]
        end
	end

对应红黑树有3个插入位置,对应算法导论有三种情况(3为父节点,1为子节点的情况同理)

核心是让3节点变成4节点的时候,按序重排

这里的重排不只是3节点的两个节点和新插入的节点,(在4节点插入导致的向上递归后)还包含了两个节点原有的2个子树,一共五个节点要按顺序来排列好

五节点的位置是不确定的,因此算法不太好写,相对而言,算法导论中的左右旋转方法是一种比较好理解的巧妙算法

graph TB 
    subgraph 插入前
    a1((1))---b1((位置1))
    a1((1))---c1((3))
    c1((3))---e1((位置2))
    c1((3))---f1((位置3))
    end
    style c1 fill:#f9f,stroke:#333,stroke-width:4px

对应红黑树:父节点为黑色

位置1,直接插入同上

对应红黑树(算法导论情况2):父节点为红色,叔叔节点为黑色,和父节点还有祖父节点不为一条直线

位置2,对父节点(图中节点3)旋转,目的是为了使父节点和祖父节点为一条直线,从而转换到情况3

对应红黑树(算法导论情况3):父节点为红色,叔叔节点为黑色,和父节点还有祖父节点为一条直线

位置3,对插入节点(图中节点2)进行旋转,目的是为了送一个节点给叔叔节点

graph TB
	subgraph 父节点为红色,叔叔节点为黑色,和父节点还有祖父节点不为一条直线
		subgraph 插入2前
        a1((1))---b1((nil))
        a1((1))---c1((3))
        c1((3))---e1((2))
        c1((3))---f1((nil))
        end
        style c1 fill:#f9f,stroke:#333,stroke-width:4px
        style e1 fill:#f9f,stroke:#333,stroke-width:4px 
        subgraph 父节点右旋
        a2((1))---b2((nil))
        a2((1))---c2((2))
        c2((2))---e2((nil))
        c2((2))---f2((3))
        end
        style c2 fill:#f9f,stroke:#333,stroke-width:4px
        style f2 fill:#f9f,stroke:#333,stroke-width:4px
	end
graph TB
	subgraph 父节点为红色,叔叔节点为黑色,和父节点还有祖父节点为一条直线
        subgraph 插入4前
        a1((1))---b1((nil))
        a1((1))---c1((3))
        c1((3))---e1((nil))
        c1((3))---f1((4))
        end
        style c1 fill:#f9f,stroke:#333,stroke-width:4px
        style f1 fill:#f9f,stroke:#333,stroke-width:4px
        
        subgraph 父节点左旋,插入4后
        a2((3))---b2((1))
        a2((3))---c2((4))
        end
        style b2 fill:#f9f,stroke:#333,stroke-width:4px
        style c2 fill:#f9f,stroke:#333,stroke-width:4px
	end

被插入的叶子节点是4节点

4节点的中值分裂上去,由于多了一个父节点,可以多一个子节点分叉,因此小值和大值各自成为一个子节点

上升后的节点当做新节点向上递归,直到不再插入4节点

graph TB
	subgraph 如果叶子节点是4节点
        subgraph 插入4前
        a[0]---b[1 and 2 and 3]
        c[4]
        end
        subgraph 插入4后
        e[0 and 2]---f[1]
        e[0 and 2]---g[3 and 4]
        end
	end

对应红黑树有4个插入位置,对应算法导论同一个情况

graph TB
    subgraph 插入4前
    aa((0))---bb((nil))
    aa((0))---a((2))
    a((2))---b((1))
    a((2))---c((3))
    b((1))---d((位置1))
    b((1))---e((位置2))
    c((3))---f((位置3))
    c((3))---g((位置4))
    style b fill:#f9f,stroke:#333,stroke-width:4px
    style c fill:#f9f,stroke:#333,stroke-width:4px
    end

对应红黑树(算法导论情况1):父节点为红色,叔叔节点为红色

父节点和叔叔节点变黑色,祖父节点变红色,祖父节点当做新节点向上递归

如果祖父节点的父节点为黑色(说明成功插入了2-3-4树的一个2节点或者3节点的位置1)则递归结束,否则祖父节点当做新插入节点

除非遇到root节点,这就说明已经无法向上递归成为黑色节点的从节点了,只能自己成为一个2节点,从而使红黑树高度+1

graph TB
	subgraph 父节点为红色,叔叔节点为红色
        subgraph 插入4前
        aa((0))---bb((nil))
        aa((0))---a((2))
        a((2))---b((1))
        a((2))---c((3))
        c((3))---e((nil))
        c((3))---f((4))
        end
        style b fill:#f9f,stroke:#333,stroke-width:4px
        style c fill:#f9f,stroke:#333,stroke-width:4px
        
        subgraph 插入4后
        gg((0))---hh((nil))
        gg((0))---g((2))
        g((2))---h((1))
        g((2))---i((3))
        i((3))---j((nil))
        i((3))---k((4))
        end
        style g fill:#f9f,stroke:#333,stroke-width:4px
        style f fill:#f9f,stroke:#333,stroke-width:4px
        style k fill:#f9f,stroke:#333,stroke-width:4px
	end

删除

寻找删除节点的替代节点

从上往下搜索,直到达到需要删除的节点

如果在内部节点,找到后继节点,转换为删除后继叶子节点

从红黑树角度来看

当存在右子树的时候,红黑树和2-3-4树逻辑是一样的

但如果红黑树无右子树,又存在左子树,那么替代节点改为删除节点前继节点,也就是删除节点的左二子(由于红黑树的特殊性质,左子树一定为单独的红色节点)

被删除的替代节点是3或4节点

分别变成2或3节点

graph TB
	subgraph 3或4节点
        subgraph 删除2前
        a[1 and 2]
        end
        subgraph 删除2后
        b[1]
        end
        subgraph 删除3前
        c[1 and 2 and 3]
        end
        subgraph 删除3后
        d[1 and 2]
        end
    end

对应红黑树有3个删除位置,对应算法导论同一种情况

对应红黑树:被删除节点为红色

直接删除

graph TB
	subgraph 节点为红色
        subgraph 删除2前
        a((1))---b((nil))
        a((1))---c((2))
        end
        style c fill:#f9f,stroke:#333,stroke-width:4px
        subgraph 删除2后
        d((1))
        end
        
        subgraph 删除3前
        g((2))---h((1))
        g((2))---i((3))
        end
        style h fill:#f9f,stroke:#333,stroke-width:4px
        style i fill:#f9f,stroke:#333,stroke-width:4px
        subgraph 删除3后
        j((2))---k((1))
        j((2))---l((nil))
        end
        style k fill:#f9f,stroke:#333,stroke-width:4px
    end

被删除的替代节点是2节点

对应红黑树:被删除节点为黑色

优先向相邻兄弟节点借,相邻兄弟节点是3或4节点,父节点不限

2-3-4树的父节点中,较近的节点替代当前节点,这时2-3-4树的父节点会产生一个空位

这个空位由2-3-4树的兄弟节点中,较近的节点来替代

graph TB
   subgraph 相邻兄弟节点是3或4节点,父节点不限
       subgraph 删除5前
       a1[... and 4]---b1[...]
       a1[... and 4]---c1[... and 2 and 3]
       a1[... and 4]---d1[5]
       end
       subgraph 删除5后
       a2[... and 3]---b2[...]
       a2[... and 3]---c2[... and 2]
       a2[... and 3]---d2[4]
       end
   end

对应红黑树有3个删除位置,但是对应算法导论3种情况

graph TD
	subgraph id[" "]
        subgraph 父为3节点
        a1((4))---b1((1))
        a1((4))---c1((位置3))
        b1((1))---d1((位置1))
        b1((1))---e1((位置2))
        style b1 fill:#f9f,stroke:#333,stroke-width:4px
        end
        subgraph 父为4节点
        a2((1))---b2((0))
        a2((1))---c2((4))
        b2((0))---d2((位置1))
        b2((0))---e2((位置2))
        c2((4))---f2((位置2))
        c2((4))---g2((位置1))
        style b2 fill:#f9f,stroke:#333,stroke-width:4px
        style c2 fill:#f9f,stroke:#333,stroke-width:4px
        end
    end
对应红黑树(算法导论情况1):兄弟节点为红色

和算法导论相印证,情况1兄弟节点为红色,对父节点右旋以后变色,变成情况1,情况3或者情况4

graph TD
	subgraph 兄弟节点为红色
	    subgraph 父为3节点在删除5前
        a1((4))---b1((1))
        a1((4))---c1((5))
        b1((1))---d1((...))
        b1((1))---e1((2))
        e1((2))---f1((...))
        e1((2))---g1((...))
        style b1 fill:#f9f,stroke:#333,stroke-width:4px
        end
        subgraph 父为3节点在右旋后
        a2((1))---b2((...))
        a2((1))---c2((4))
        c2((4))---d2((2))
        c2((4))---e2((5))
        d2((2))---f2((...))
        d2((2))---g2((...))
        style a2 fill:#f9f,stroke:#333,stroke-width:4px
        end
        subgraph 父为3节点在变色后
        a3((1))---b3((...))
        a3((1))---c3((4))
        c3((4))---d3((2))
        c3((4))---e3((5))
        d3((2))---f3((...))
        d3((2))---g3((...))
        style c3 fill:#f9f,stroke:#333,stroke-width:4px
        end
    end

情况3和4根据2-3-4树来看,最终都是侄子节点和兄弟节点中较近的节点上移为父亲节点,原本的父亲节点替换当前节点

对应红黑树(算法导论情况3):兄弟节点为黑色,较近侄子节点为红色

父节点可以为红色也可以为黑色

和算法导论相印证,情况3较近侄子节点为红色,对侄子节点左旋,并变色变成情况4

对应红黑树(算法导论情况4):兄弟节点为黑色,较远侄子节点为红色

父节点可以为红色也可以为黑色

和算法导论相印证,较远的侄子节点为红色,此时再对兄弟节点右旋,变色,即达到平衡

graph TD
	subgraph 兄弟节点为黑色,较近侄子节点为红色
        subgraph 删除5前
        a1((4))---b1((2))
        b1((2))---c1((...))
        b1((2))---d1((3))
        a1((4))---e1((5))
        style a1 fill:#fff,stroke:#333,stroke-width:4px
        style d1 fill:#f9f,stroke:#333,stroke-width:4px
        end
        subgraph 对侄子节点左旋后
        a2((4))---b2((3))
        a2((4))---c2((5))
        b2((3))---d2((2))
        b2((3))---e2((nil))
        d2((2))---f2((...))
        d2((2))---g2((nil))
        style a2 fill:#fff,stroke:#333,stroke-width:4px
        style b2 fill:#f9f,stroke:#333,stroke-width:4px
        end
        subgraph 变色后
        a3((4))---b3((3))
        a3((4))---c3((5))
        b3((3))---d3((2))
        b3((3))---e3((nil))
        d3((2))---f3((...))
        d3((2))---g3((nil))
        style a3 fill:#fff,stroke:#333,stroke-width:4px
        style d3 fill:#f9f,stroke:#333,stroke-width:4px
        end
	end
graph TD
	subgraph 兄弟节点为黑色,较远侄子节点为红色
		subgraph 较近侄子为红转换后,或较远侄子节点为红
        a3((4))---b3((3))
        a3((4))---c3((5))
        b3((3))---d3((2))
        b3((3))---e3((nil))
        d3((2))---f3((...))
        d3((2))---g3((nil))
        style a3 fill:#fff,stroke:#333,stroke-width:4px
        style d3 fill:#f9f,stroke:#333,stroke-width:4px
        end
		subgraph 对兄弟节点右旋后
        a4((3))---b4((2))
        a4((3))---c4((4))
        b4((2))---d4((...))
        b4((2))---e4((nil))
        c4((4))---f4((nil))
        c4((4))---g4((5))
        style c4 fill:#fff,stroke:#333,stroke-width:4px
        style b4 fill:#f9f,stroke:#333,stroke-width:4px
        end
        subgraph 变色后
        a5((3))---b5((2))
        a5((3))---c5((4))
        b5((2))---d5((...))
        b5((2))---e5((nil))
        c5((4))---f5((nil))
        c5((4))---g5((5))
        style a5 fill:#fff,stroke:#333,stroke-width:4px
        end
        subgraph 删除5后
        a6((3))---b6((2))
        b6((2))---c6((...))
        b6((2))---d6((nil))
        a6((3))---e6((4))
        style a6 fill:#fff,stroke:#333,stroke-width:4px
        end
	end
然后向父节点借:相邻兄弟节点是2节点且父亲节点是3或4节点

由于确定红黑树的兄弟节点没得借了,只能父节点下降为当前节点

下降以后,父节点会少一个分叉,因此只能把兄弟节点和父节点合并为同一个节点

graph TB
   subgraph 相邻兄弟节点是2节点且父亲节点是3或4节点
       subgraph 删除5前
       a1[... and 2 and 4]---b1[...]
       a1[... and 2 and 4]---c1[3]
       a1[... and 2 and 4]---d1[5]
       end
       subgraph 删除5后
       a2[... and 2]---b2[...]
       a2[... and 2]---c2[3 and 4]
       end
   end

对应红黑树有3个删除位置,对应算法导论有两种情况

graph TD
	subgraph id[" "]
        subgraph 父为3节点
        a1((4))---b1((2))
        a1((4))---c1((位置3))
        b1((2))---d1((位置1))
        b1((2))---e1((位置2))
        style b1 fill:#f9f,stroke:#333,stroke-width:4px
        end
        subgraph 父为4节点
        a2((4))---b2((2))
        a2((4))---c2((5))
        b2((2))---d2((位置1))
        b2((2))---e2((位置2))
        c2((5))---f2((位置2))
        c2((5))---g2((位置1))
        style b2 fill:#f9f,stroke:#333,stroke-width:4px
        style c2 fill:#f9f,stroke:#333,stroke-width:4px
        end
    end
父为3节点对应红黑树(算法导论情况1):兄弟节点为红色

和算法导论相印证,情况1通过右旋后变色转换为情况2

父为4节点对应红黑树(算法导论情况2):兄弟节点为黑色,侄子节点为黑色

和算法导论相印证,情况2将兄弟节点变成红色后,将父节点作为新的替代节点向上追溯,由于父节点是红色,因此红变黑且追溯结束

graph TD
	subgraph 兄弟节点为红色
	    subgraph 父为3节点在删除5前
        a1((4))---b1((2))
        a1((4))---c1((5))
        b1((2))---d1((...))
        b1((2))---e1((3))
        style b1 fill:#f9f,stroke:#333,stroke-width:4px
        end
        subgraph 父为3节点在右旋后
        a2((2))---b2((...))
        a2((2))---c2((4))
        c2((4))---d2((3))
        c2((4))---e2((5))
        style a2 fill:#f9f,stroke:#333,stroke-width:4px
        end
        subgraph 父为3节点在变色后,或父为4节点
        a3((2))---b3((...))
        a3((2))---c3((4))
        c3((4))---d3((3))
        c3((4))---e3((5))
        style c3 fill:#f9f,stroke:#333,stroke-width:4px
        end
        subgraph 父为3或4节点在删除5后
        a4((2))---b4((...))
        a4((2))---c4((4))
        c4((4))---d4((3))
        c4((4))---e4((nil))
        style d4 fill:#f9f,stroke:#333,stroke-width:4px
        end
	end
最后都没得借:相邻兄弟节点和父亲节点都是2节点

兄弟节点和父亲节点合并成一个3节点

向上递归修复,合并后的节点当做是一个新的处理节点,查看他的兄弟节点和父亲节点

graph TB
   subgraph 相邻兄弟节点和父亲节点都是2节点
       subgraph 删除1前
       a1[...]---b1[2]
       b1[2]---c1[1]
       b1[2]---d1[3]
       end
       subgraph 删除3后
       a2[...]---b2[1 and 2]
       end
   end

对应红黑树有1个删除位置,对应算法导论只有一种情况

graph TD
	a1((2))---b1((1))
	a1((2))---c1((位置1))
对应红黑树(算法导论情况2):兄弟节点为黑色,侄子节点为黑色

最终状态:将兄弟节点变成红色,并向上追溯

和算法导论相印证,情况2将兄弟节点变成红色后,将父节点作为新的替代节点向上追溯,同样的,当追溯后新的节点为红色,红变黑且追溯结束

否则直到追溯到root节点(必然是黑色的,没得借,因此整个树高度-1)

graph TD
	subgraph 兄弟节点为黑色,侄子节点为黑色
	    subgraph 删除3前
        a1((...))---b1((2))
        b1((2))---c1((1))
        b1((2))---d1((3))
        end
        subgraph 删除3后
        a2((...))---b2((2))
        b2((2))---c2((1))
        b2((2))---d2((nil))
        style c2 fill:#f9f,stroke:#333,stroke-width:4px
        end
	end

小结

找替代节点

有右子树找后继,没有右子树找前继(就是左儿子),左右子树都不存在就不需要替代节点了

兄弟节点为红色的旋转

然后,根据删除的各步骤操作,可以把兄弟节点为红色的部分单独提取出来

在红黑树中不管是向相邻兄弟节点借,还是向父节点借,在兄弟节点为红色的时候,都需要进行旋转

兄弟节点为红色,意味着该节点的父节点是一个3节点

而2-3-4树的3节点是对应着两种红黑树的,左倾或者右倾

graph TD
	subgraph id[" "]
        subgraph 父为3节点,左倾红黑树
        a1((4))---b1((2))
        a1((4))---c1((...))
        b1((2))---d1((...))
        b1((2))---e1((...))
        style b1 fill:#f9f,stroke:#333,stroke-width:4px
        end
        subgraph 父为3节点,右倾红黑树
        a2((2))---b2((...))
        a2((2))---c2((4))
        c2((4))---d2((...))
        c2((4))---e2((...))
        style c2 fill:#f9f,stroke:#333,stroke-width:4px
        end
    end

此时对其旋转,对2-3-4树来说不代表任何操作,只是为了操作红黑树时更好的借相邻兄弟节点

借2-3-4树的相邻节点,红黑树查看红色侄子节点

旋转后才是正式的2-3-4树开始借相邻节点,而不影响2-3-4树的高度

从红黑树视角看:

旋转以后就可以统一为兄弟节点为黑色的情况,然后就可以查看是否存在红色侄子节点可以借过来替代删除,而不影响红黑树的高度

借2-3-4树的父节点,红黑树向上追溯红色节点去借

如果2-3-4树的相邻节点不存在(红黑树的侄子红色节点不存在),就向2-3-4树的父节点强行借一个下来

如果被借的2-3-4树父节点是一个2节点,那么2-3-4树的高度会减少,他自然会向2-3-4树的祖父节点递归向上去借,直到root节点没得借了,2-3-4树整个高度-1

从红黑树的视角看:

也就是向上追溯去借红色节点

理解Nil节点

由于树是从下往上递归生长的,因此只有叶子节点的判定的时候,会出现节点不存在的情况

递归向上以后会变成内部节点,此时需要进行两种区分,例如在插入4节点时

叶子节点的判定是parent->parent->left && parent->parent->right

递归向上后叶子节点的判定是parent->parent->left && parent->parent->left->isRed && parent->parent->right && parent->parent->right->isRd

利用Nil节点,可以统一判定parent->parent->left->isRed && parent->parent->right->isRed

理解左旋右旋

如下图,染色节点是受影响节点,绿色节点(5)是旋转轴节点,一共有4个受影响节点

由于旧的父节点(3)即将占用旧的子节点(4)位置,而旧的父节点(3)原有的子树(5)即将挪走,变成旧的父节点(3)的父节点

因此一拍即合,旧的父节点(3)的子树设为旧的子节点(4)

顺便祖父节点(1)也需要更新他的子树

当然还有一些边界条件,旧的子节点(4)不存在,或者祖父节点不存在(1)

graph TD
	subgraph id[ ]
        subgraph 左旋2前
        	a1((1))---b1((..))
        	a1((1))---c1((3))
        	c1((3))---d1((2))
            c1((3))---e1((5))
            e1((5))---f1((4))
            e1((5))---g1((6))
            style a1 fill:#9ff,stroke:#333,stroke-width:4px
            style c1 fill:#9ff,stroke:#333,stroke-width:4px
            style e1 fill:#9f9,stroke:#333,stroke-width:4px
            style f1 fill:#9ff,stroke:#333,stroke-width:4px
            end
        subgraph 左旋2后
        	a2((1))---b2((..))
        	a2((1))---d2((5))
            d2((5))---e2((3))
            d2((5))---f2((6))
            e2((3))---g2((2))
            e2((3))---h2((4))
            style a2 fill:#9ff,stroke:#333,stroke-width:4px
            style d2 fill:#9f9,stroke:#333,stroke-width:4px
            style e2 fill:#9ff,stroke:#333,stroke-width:4px
            style h2 fill:#9ff,stroke:#333,stroke-width:4px
            end
    end

对一个节点,向哪一个方向旋转,简单来说就是将这个方向的父节点变成自己的对应子树(左旋将父节点变成左子树,右旋将父节点变成右子树)

根本目的是为了将一个节点迁移到另外一颗子树上,从而达到插入时迁移走多余红色节点;或者替代删除时借一个红色节点过来变黑

理解变色

上面提到,旋转的主要目的是插入送走一个节点或是删除是借一个节点

旋转以后需要变色才能平衡黑色

深入理解一下变色的各个Case

  • 左倾/右倾红黑树转换

    2-3-4树的3节点通过一次旋转后变色完成左倾或者右倾,有如下Case

    • 插入3节点(插入算法导论情况3)
    • 删除先左倾/右倾变化(删除算法导论情况1)
    • 删除向相邻兄弟节点借(删除算法导论情况3)
  • 插入时将4节点分裂成两个2节点,并且中间节点往上插入(插入算法导论情况1)

    4节点分裂的两个2节点,在红黑树中由原先4节点的红色变成黑色,中间节点往上插入,因此要黑变红,成为某个黑节点的从节点才能变成2-3-4树的3或4节点

    直到root节点(必然没有父节点,只能自己成为一个2节点,因此出现唯一的整个树高度+1的场景)

  • 删除时兄弟节点为黑色,侄子节点为黑色(删除算法导论情况2)

    2-3-4树的父节点和相邻兄弟节点合并成3节点,因此把红黑树的兄弟节点变红,父节点变黑

    如果红黑树的父节点原本是红色,说明2-3-4树的父节点原本至少是个3节点,因此能借到节点,向上追溯停止。

    如果红黑树的父节点原本是黑色,那么2-3-4树的父节点是个2节点,需要继续向上追溯借节点,直到root节点(必然是黑色的,没得借,因此出现唯一的整个树高度-1的场景)

  • 删除时兄弟节点为黑色,较远侄子节点为红色(删除算法导论情况4)

    通过旋转借来一个红色节点以后,就可以让当前子树多一个黑色节点来删除

    为了这个目的而红变黑

理解删除最小节点性能

上一篇博客所述,红黑树在批量删除最小节点时,性能非常好,几乎达到了\(O(n)\)的时间消耗

而众所周知红黑树的删除单个值性能是\(O(\log n)\)

那么为什么会有这个差异呢

根据本文的理解,删除分查找值,查找删除值的替代后继节点和删除替代后继节点三个步骤

  • 查找值:

    删除时第一次找到最小节点确实是\(O(log n)\)

    后续的删除最小节点的查找,只需要取上一个删除项的后继节点是\(O(1)\)的复杂度

    删除n个的查找是\(O(n)\)

  • 查找删除值的替代后继节点:

    由于每次删除都是最小值,因此不需要替代后继节点

  • 删除替代后继节点:

    实际上就是删除当前的最小值

    从2-3-4树来进行理解

    • 3-4节点的删除不需要任何操作

    • 2节点的删除比较坏的情况下旋转3次(情况1转情况3转情况4)
    • 最坏情况下向上回溯,每一次回溯都需要删除了指数级别的节点数,次数很少

    3-4-节点和2节点的删除可以平均为\(O(n)\)的时间复杂度,回溯的消耗忽略不计,因此这一步可以达到几乎\(O(n)\)的复杂度

总结3个步骤,是\(O(n)\)的复杂度

总结

核心是理解2-3-4树的各个节点在对应这个图的位置的插入删除操作

graph TB 
	subgraph id[ ]
		subgraph 2节点
        a1((1))---b1((位置1))
        a1((1))---c1((位置2))
        end
        subgraph 3节点
        a2((1))---b2((位置3))
        a2((1))---c2((3))
        c2((3))---e2((位置4))
        c2((3))---f2((位置5))
        style c2 fill:#f9f,stroke:#333,stroke-width:4px
        end
        subgraph 4节点
        c3((2))---d3((1))
        c3((2))---e3((3))
        d3((1))---f3((位置6))
        d3((1))---g3((位置7))
        e3((3))---h3((位置8))
        e3((3))---i3((位置9))
        style d3 fill:#f9f,stroke:#333,stroke-width:4px
        style e3 fill:#f9f,stroke:#333,stroke-width:4px
        end
    end

通过本篇总结的理解后,我也手撸了一个红黑树,性能看着比标准库还高一些(O0下快60%,O2下快20%)。。。

rb_tree.cpp

1
2
3
4
Tree insert:        Cost 514 ms
set insert: Cost 636 ms
Tree erase: Cost 497 ms
set erase: Cost 662 ms

参考资料

红黑树的传统理解

  • 细说红黑树(1)-核心定理

    这一篇从数学公式上证明了红黑树为什么是平衡的

  • wiki红黑树

    非常枯燥的不好理解的资料,只是作为权威资料列在这里

  • 红黑树在线生成

    一个红黑树在线插入删除动画生成的好网站,对理解红黑树有所帮助,强力推荐

  • 30张图带你彻底理解红黑树

    传统理解方式中,可以对照算法导论一起看的较好博文

    相比算法导论有些图表一步到位,这篇博文有一些中间转换状态,更利于理解

    但是传统理解方式看完也不知道为什么要这么旋转变色

  • AVL树,红黑树,B树,B+树,Trie树都分别应用在哪些现实场景中?

    介绍对比了各种树,对红黑树的介绍是:

    红黑树利用了缓存

    Robert Sedgewick, 红黑树的发明人,在《算法(第4版)》 中说过, 红黑树等价于2-3树

    其中2-节点 等价于普通平衡二叉树的节点,3-节点 本质上是非平衡性的缓存

    当需要再平衡(rebalance)时,增删操作时,2-节点 与 3-节点间 的 转化会吸收不平衡性,减少旋转次数,使再平衡尽快结束。

    在综合条件下,增删操作相当时,数据的随机性强时,3-节点的非平衡性缓冲效果越明显。因此红黑树的综合性能更优。

    继续追根溯源,红黑树的性能优势,本质上是用空间换时间

    这个理解非常深入了

  • 在二叉树中找到一个节点的后继节点

    用于实现红黑树的迭代器自增遍历

  • C++map迭代器的++操作是如何实现的?

    解释了为什么遍历map是\(O(n)\)

2-3-4树的理解

2-3-4树的实现

简单一个2-3-4树的实现在网上就五花八门,而且大部分都不太正确