板书笔记红黑树 (Web 视图)
目录
1. 关联式容器
2. 键值对
3. 树形结构的关联式容器
3.1 set
3.1.1 set的介绍
3.1.2 set的使用
1. set的模板参数列表
2. set的构造
3. set的迭代器
4. set的容量
5. set修改操作
6. set的使用举例
3.2 map
3.2.1 map的介绍
3.2.2 map的使用
3.3 multiset
3.3.1 multiset的介绍
3.3.2 multiset的使用
3.4 multimap
3.4.1 multimap的介绍
3.4.2 multimap的使用
3.5 在OJ中的使用
1.前K个高频单词
2. 两个数组的交集I
4. 底层结构
4.1 AVL 树
4.1.1 AVL树的概念
编辑
4.1.2 AVL树节点的定义
4.1.3 AVL树的插入
4.1.4 AVL树的旋转
4.1.5 AVL树的验证
4.1.6 AVL树的删除(了解)
4.1.7 AVL树的性能
4.2 红黑树
4.2.1 红黑树的概念
4.2.2 红黑树的性质
4.2.3 红黑树节点的定义
4.2.4 红黑树结构
4.2.5 红黑树的插入操作
4.2.6 红黑树的验证
4.2.7 红黑树的删除
4.2.8 红黑树与AVL树的比较
4.2.9 红黑树的应用
4.3 红黑树模拟实现STL中的map与set
4.3.1 红黑树的迭代器
4.3.2 改造红黑树
4.3.3 map的模拟实现
4.3.4 set的模拟实现
关联式容器 也是用来存储数据的,与序列式容器不同的是,其 里面存储的是 <key, value> 结构的 键值对,在数据检索时比序列式容器效率更高
3.1.1 set的介绍
set - C++ Reference
翻译:1. set 是按照一定次序存储元素的容器2. 在 set 中,元素的 value 也标识它 (value 就是 key ,类型为 T) ,并且每个 value 必须是唯一的。set中的元素不能在容器中修改 ( 元素总是 const) ,但是可以从容器中插入或删除它们。3. 在内部, set 中的元素总是按照其内部比较对象 ( 类型比较 ) 所指示的特定严格弱排序准则进行排序。4. set 容器通过 key 访问单个元素的速度通常比 unordered_set 容器慢,但它们允许根据顺序对子集进行直接迭代。5. set 在底层是用二叉搜索树 ( 红黑树 ) 实现的。注意:1. 与 map/multimap 不同, map/multimap 中存储的是真正的键值对 <key, value> , set 中只放value ,但在底层实际存放的是由 <value, value> 构成的键值对。2. set 中插入元素时,只需要插入 value 即可,不需要构造键值对。3. set 中的元素不可以重复 ( 因此可以使用 set 进行去重 ) 。4. 使用 set 的迭代器遍历 set 中的元素,可以得到有序序列5. set 中的元素默认按照小于来比较6. set 中查找某个元素,时间复杂度为: $log_2 n$7. set 中的元素不允许修改 ( 为什么 ?)8. set 中的底层使用二叉搜索树 ( 红黑树 ) 来实现
3.1.2 set的使用
1. set的模板参数列表
T: set中存放元素的类型,实际在底层存储<value, value>的键值对。
Compare:set中元素默认按照小于来比较
Alloc : set 中元素空间的管理方式,使用 STL 提供的空间配置器管理
2. set的构造
3. set的迭代器
4. set的容量
5. set修改操作
6. set的使用举例
3.2.1 map的介绍
map - C++ Reference
翻译:1. map 是关联容器,它按照特定的次序 ( 按照 key 来比较 ) 存储由键值 key 和值 value 组合而成的元素。2. 在 map 中,键值 key 通常用于排序和惟一地标识元素,而值 value 中存储与此键值 key 关联的内容。键值 key 和值 value 的类型可能不同,并且在 map 的内部, key 与 value 通过成员类型 value_type绑定在一起,为其取别名称为 pair: typedef pair<const key, T> value_type;3. 在内部, map 中的元素总是按照键值 key 进行比较排序的。4. map 中通过键值访问单个元素的速度通常比 unordered_map 容器慢,但 map 允许根据顺序对元素进行直接迭代 ( 即对 map 中的元素进行迭代时,可以得到一个有序的序列 ) 。5. map 支持下标访问符,即在 [] 中放入 key ,就可以找到与 key 对应的 value 。6. map 通常被实现为二叉搜索树 ( 更准确的说:平衡二叉搜索树 ( 红黑树 )) 。
3.2.2 map的使用
1. map的模板参数说明
key: 键值对中 key 的类型T : 键值对中 value 的类型Compare: 比较器的类型, map 中的元素是按照 key 来比较的,缺省情况下按照小于来比较,一般情况下( 内置类型元素 ) 该参数不需要传递,如果无法比较时 ( 自定义类型 ) ,需要用户自己显式传递比较规则( 一般情况下按照函数指针或者仿函数来传递 )Alloc :通过空间配置器来申请底层空间,不需要用户传递,除非用户不想使用标准库提供的空间配置器注意:在使用 map 时,需要包含头文件
2. map的构造
3. map的迭代器
4. map的容量与元素访问
问题:当key不在map中时,通过operator获取对应value时会发生什么问题?
5. map中元素的修改
【总结】
1. map 中的的元素是键值对2. map 中的 key 是唯一的,并且不能修改3. 默认按照小于的方式对 key 进行比较4. map 中的元素如果用迭代器去遍历,可以得到一个有序的序列5. map 的底层为平衡搜索树 ( 红黑树 ) ,查找效率比较高 $O(log_2 N)$6. 支持 [] 操作符, operator[] 中实际进行插入查找。
3.3.1 multiset的介绍
multiset - C++ Reference
[ 翻译 ] :1. multiset 是按照特定顺序存储元素的容器,其中元素是可以重复的。2. 在 multiset 中,元素的 value 也会识别它 ( 因为 multiset 中本身存储的就是 <value, value> 组成的键值对,因此 value 本身就是 key , key 就是 value ,类型为 T). multiset 元素的值不能在容器中进行修改 ( 因为元素总是 const 的 ) ,但可以从容器中插入或删除。3. 在内部, multiset 中的元素总是按照其内部比较规则 ( 类型比较 ) 所指示的特定严格弱排序准则进行排序。4. multiset 容器通过 key 访问单个元素的速度通常比 unordered_multiset 容器慢,但当使用迭代器遍历时会得到一个有序序列。5. multiset 底层结构为二叉搜索树 ( 红黑树 ) 。注意:1. multiset 中再底层中存储的是 <value, value> 的键值对2. mtltiset 的插入接口中只需要插入即可3. 与 set 的区别是, multiset 中的元素可以重复, set 是中 value 是唯一的4. 使用迭代器对 multiset 中的元素进行遍历,可以得到有序的序列5. multiset 中的元素不能修改6. 在 multiset 中找某个元素,时间复杂度为 $O(log_2 N)$7. multiset 的作用:可以对元素进行排序
3.3.2 multiset的使用
此处只简单演示set与multiset的不同,其他接口接口与set相同,可参考set。
3.4.1 multimap的介绍
翻译:1. Multimaps 是关联式容器,它按照特定的顺序,存储由 key 和 value 映射成的键值对 <key,value> ,其中多个键值对之间的 key 是可以重复的。2. 在 multimap 中,通常按照 key 排序和惟一地标识元素,而映射的 value 存储与 key 关联的内容。 key 和 value 的类型可能不同,通过 multimap 内部的成员类型 value_type 组合在一起,value_type是组合 key 和 value 的键值对 : typedef pair<const Key, T> value_type;3. 在内部, multimap 中的元素总是通过其内部比较对象,按照指定的特定严格弱排序标准对key 进行排序的。4. multimap 通过 key 访问单个元素的速度通常比 unordered_multimap 容器慢,但是使用迭代器直接遍历 multimap 中的元素可以得到关于 key 有序的序列。5. multimap 在底层用二叉搜索树 ( 红黑树 ) 来实现。注意: multimap 和 map 的唯一不同就是: map 中的 key 是唯一的,而 multimap 中 key 是可以重复的 。
3.4.2 multimap的使用
multimap 中的接口可以参考 map ,功能都是类似的。注意:1. multimap 中的 key 是可以重复的。2. multimap 中的元素默认将 key 按照小于来比较3. multimap 中没有重载 operator[] 操作 ( 同学们可思考下为什么 ?) 。4. 使用时与 map 包含的头文件相同:
1.前K个高频单词
力扣
2. 两个数组的交集I
力扣
4.1.3 AVL树的插入
AVL树就是在二叉搜索树的基础上引入了平衡因子,因此AVL树也可以看成是二叉搜索树。那么 AVL树的插入过程可以分为两步:
1. 按照二叉搜索树的方式插入新节点2. 调整节点的平衡因子
3. 新节点插入较高左子树的右侧---左右:先左单旋再右单旋
将双旋变成单旋后再旋转,即:先对30进行左单旋,然后再对90进行右单旋,旋转完成后再考虑平衡因子的更新。
1. 验证其为二叉搜索树
如果中序遍历可得到一个有序的序列,就说明为二叉搜索树
- 每个节点子树高度差的绝对值不超过1(注意节点中如果没有平衡因子)
- 节点的平衡因子是否计算正确
- 常规场景1 {16, 3, 7, 11, 9, 26, 18, 14, 15}
- 特殊场景2 {4, 2, 6, 1, 3, 5, 15, 7, 16, 14}
4.1.6 AVL树的删除(了解)
因为AVL树也是二叉搜索树,可按照二叉搜索树的方式将节点删除,然后再更新平衡因子,只不错与删除不同的时,删除节点后的平衡因子更新,最差情况下一直要调整到根节点的位置。具体实现可参考《算法导论》或《数据结构-用面向对象方法与C++描述》殷人昆版。
4.1.7 AVL树的性能
4.2.1 红黑树的概念
4.2.5 红黑树的插入操作
红黑树是在二叉搜索树的基础上加上其平衡限制条件,因此红黑树的插入可分为两步:
1. 按照二叉搜索的树规则插入新节点
2. 检测新节点插入后,红黑树的性质是否造到破坏因为 新节点的默认颜色是红色 ,因此:如果 其双亲节点的颜色是黑色,没有违反红黑树任何性质 ,则不需要调整;但 当新插入节点的双亲节点颜色为红色时,就违反了性质三不能有连在一起的红色节点 ,此时需要对红黑树分情况来讨论:约定 :cur 为当前节点, p 为父节点, g 为祖父节点, u 为叔叔节点
- 情况一: cur为红,p为红,g为黑,u存在且为红
cur 和 p 均为红,违反了性质三,此处能否将 p 直接改为黑?解决方式:将 p,u 改为黑, g 改为红,然后把 g 当成 cur ,继续向上调整。
- 情况二: cur为红,p为红,g为黑,u不存在/u存在且为黑
p 为 g 的左孩子, cur 为 p 的左孩子,则进行右单旋转;相反,p 为 g 的右孩子, cur 为 p 的右孩子,则进行左单旋转p 、 g 变色 --p 变黑, g 变红
- 情况三: cur为红,p为红,g为黑,u不存在/u存在且为黑
p 为 g 的左孩子, cur 为 p 的右孩子,则针对 p 做左单旋转;相反,p 为 g 的右孩子, cur 为 p 的左孩子,则针对 p 做右单旋转则转换成了情况 2针对每种情况进行相应的处理即可。
动态效果演示:
- 以升序插入构建红黑树
- 以降序插入构建红黑树
- 随机插入构建红黑树
4.2.6 红黑树的验证
红黑树的检测分为两步:
1. 检测其是否满足二叉搜索树(中序遍历是否为有序序列)
2. 检测其是否满足红黑树的性质4.2.7 红黑树的删除
红黑树的删除本节不做讲解,可参考:《算法导论》或者《STL源码剖析》
红黑树 - _Never_ - 博客园
4.2.8 红黑树与AVL树的比较
红黑树和AVL树都是高效的平衡二叉树,增删改查的时间复杂度都是O($log_2 N$),红黑树不追求绝对平衡,其只需保证最长路径不超过最短路径的2倍,相对而言,降低了插入和旋转的次数,所以在经常进行增删的结构中性能比AVL树更优,而且红黑树实现比较简单,所以实际运用中红黑树更多。
4.2.9 红黑树的应用
1. C++ STL库 -- map/set 、mutil_map/mutil_set2. Java 库3. linux 内核4. 其他一些库4.3.1 红黑树的迭代器
迭代器的好处是可以方便遍历,是数据结构的底层实现与用户透明。如果想要给红黑树增加迭代 器,需要考虑以前问题:
- begin()与end()
4.3.4 set的模拟实现
set的底层为红黑树,因此只需在set内部封装一棵红黑树,即可将该容器实现出来(具体实现可参考map)。