> 两三个星期没有发布新文章了,今天再来讲一个新的数据结构:图。
何为图论
见名知意,图论 (Graph Theory) 就是研究 图 (Graph) 的数学理论和方法。图是一种抽象的数据结构,由 节点 (Node) 和 连接这些节点的 边 (Edge) 组成。图论在计算机科学、网络分析、物流、社会网络分析等领域有广泛的应用。
如下,这就是一个图,可以看到这个图有 555 个顶点,分别编号为 {0,1,2,3,4}\{0, 1, 2, 3, 4\}{0,1,2,3,4} 。同时这个图有 444 条边,例如,在顶点 222 和 顶点 444 之间存在着一条边。
图的基本概念
在详细讲解图论和有关图论算法之前,先来了解一下在图论中的一些基本表述和规范。
1. 图 (Graph):图是一种由一组顶点和一组边组成的数据结构,记做 G=(V,E)G = (V, E)G=(V,E),其中 VVV 代表顶点集合,EEE 代表边集合。
2. 顶点 (Vertex):顶点是图的基本单位,也称为节点。
3. 边 (Edge):一条边是连接两个顶点的线段或弧。可以是无向的,也可以是有向的。一条边可以记做为 (u,v)(u, v)(u,v)。在无向图中,若存在一条(u,v)(u, v)(u,v),表示可以从 uuu 点直接走到 vvv 点,反之亦然。但若在有向图中,存在一条边 (u,v)(u, v)(u,v),表示可以从 uuu 节点直接走向 vvv 节点,如果不存在一条边 v,uv, uv,u,那么 vvv 节点就没有办法直接走向 uuu 节点。
4. 无向图 (Undirected Graph):图中的边没有方向,即 (u,v)(u, v)(u,v) 和 (v,u)(v, u)(v,u) 是同一条边。
5. 有向图 (Directed Graph/ Digraph):图中的边有方向,即 (u,v)(u, v)(u,v) 和 (v,u)(v, u)(v,u) 不是同一条边。
6. 简单图 (Simple Graph):表示含有重边(两个顶点之间的多条边)和自环(顶点到自身的边)的图。
7. 多重图 (Multigraph):允许有重边和自环的图。
8. 边权 (Weight of an Edge):一般表示经过这一条边的代价(代价一般是由命题人定义的)。
如下图,就是一个有向的简单图(通常来说,在有向图中边的方向用箭头来表示):
如下图,就是一个无向的多重图,其中存在两条边可以从顶点 555 到顶点 222:
与此同时,为了方便起见,对于无向图的处理,我们只需要在两个顶点之间建立两个方向相反的无向边就可以表示一个无向图,具体如下:
图的表示方法
在计算机中,图可以通过许多方式来构建和表示。总的可以分成图的邻接矩阵和邻接表两种方法(关于链式前向星本文不过多展开叙述,有兴趣的可以自行查阅相关文档)。
图的邻接矩阵 (Adjacency Matrix)
若一个图中有 NNN 个顶点,那么我们就可以用一个 N×NN \times NN×N 的矩阵来表示这个图。我们一般定义,若矩阵的元素 Ai,j≠−∞A_{i, j} \neq -\inftyAi,j =−∞ 表示从节点 iii 到 jjj 有一条有向边,其中边的权值为 Ai,jA_{i, j}Ai,j 。
假设存在一个有 333 个顶点的图,并且有三条有向边 E={(1,2),(2,3),(3,2)}E = \{(1, 2), (2, 3), (3, 2)\}E={(1,2),(2,3),(3,2)},那么就可以用邻接矩阵表示为:
G=[123101020013010]G = \begin{bmatrix} & \mathtt{1} & \mathtt{2} & \mathtt{3}\\ \mathtt{1} & 0 & 1 & 0 \\ \mathtt{2} & 0 & 0 & 1 \\ \mathtt{3} & 0 & 1 & 0 \end{bmatrix} G= 123 1000 2101 3010
画成可视化的图就长这个样子:
在 C++ 中,我们可以简单地用一个二维数组来表示:
图的邻接表 (Adjacency List)
邻接表本质上就是用链表表示图。数组的每个元素表示一个顶点,元素的值是一个链表,链表中存储该顶点的所有邻接顶点。假设存在一个有 444 个顶点的图,并且有四条有向边 E={(1,2),(2,3),(3,2),(3,4)}E = \{(1, 2), (2, 3), (3, 2), (3, 4)\}E={(1,2),(2,3),(3,2),(3,4)},那么就可以用邻接表表示为:
画成可视化的图就长这个样子:
在 C++ 中,我们可以使用 STL模板库 中的 vector 来实现:
一般情况下,推荐使用邻接表的方式来存图,因为使用邻接矩阵比较浪费空间。在顶点数量非常多但边非常少的图中,N2N^2N2 的时空复杂度会导致 MLE 或 TLE 等问题。
图的各种性质
1. 度数 (Degree):一个顶点的度是连接该顶点的边的数量。在有向图中,有 入度 (Indegree) 和 出度 (Outdegree) 之分(具体例子见后文)。
2. 路径 (Path):从一个顶点到另一个顶点的顶点序列,路径上的边没有重复。
3. 回路 (Cycle):起点和终点相同的路径。
4. 连通图 (Connected Graph):任意两个顶点之间都有路径相连的无向图。
5. 强连通图 (Strongly Connected Graph):任意两个顶点之间都有路径相连的有向图。
对于下面这个无向图不连通图,顶点 111 的度数为 111;顶点 222 的度数为 222;顶点 333 的度数为 111;顶点 444 的度数为 000。同时,由于 444 号顶点没有度数,所以该顶点没有办法到达任何一个其他的顶点,所以这个图是一个不连通图:
如下图,就是一个有向不强连通图。其中,顶点 111 的入度为 000,出度为 222;顶点 222 的入度为 111,出度也为 111;顶点 333 的入度为 222,但出度为 000。由于顶点 111 和顶点 222 可以走到顶点 333,但顶点 333 没有办法走到顶点 111 或顶点 222,因此下面的图不是一个强连通图:
对于下图来说,1→2→3→41\to 2\to 3\to 41→2→3→4 是一条从顶点 111 到顶点 444的路径。2→3→4→2→32\to 3\to 4 \to 2\to 32→3→4→2→3 就不是一个路径,因为相同的边 (2,3)(2, 3)(2,3) 被多次走到了。1→2→3→11\to 2\to 3\to 11→2→3→1 就是一个回路,因为这个路径的起点和终点相同:
图的遍历
图通常采用 深度优先搜索/ 广度优先搜索 这两个算法来遍历。其中深度优先算法是最常见的遍历算法。
对于一个用 邻接矩阵 保存的图,其深度优先搜索遍历的 C++ 代码如下:
对于一个用 邻接表 保存的图,其深度优先搜索遍历的 C++ 代码如下:
广度优先搜索的方式也类似:
对于判断无向图的连通性,我们只需要从任意一个点开始跑一遍深搜或者广搜就行了。如果所有顶点的 vis 都被标记了,则证明图是联通的,否则图就是不连通的。
例题讲解
P3916 图的遍历
模板题目,从每一个顶点开始用深搜遍历一遍就可以了。但从每一个点考虑能走到的最大点比较麻烦,一个更优的解决办法是反向建边,从最大的点开始遍历,这样子就可以一次性计算出多个结果。
P5318 【深基18.例3】查找文献
也是一道模板题目,正常遍历即可。
番外 - 图的常见算法
更多关于图论的算法,请持续关注后续更新。
1. 深度优先搜索 (DFS):适用于遍历图和检测图中的回路。
2. 广度优先搜索 (BFS):适用于寻找最短路径(无权图)。
3. Dijkstra 算法:适用于加权图中寻找单源最短路径。
4. Bellman-Ford 算法:适用于有负权边的图中寻找单源最短路径。
5. Floyd-Warshall 算法:适用于寻找所有顶点对之间的最短路径。
6. Kruskal 算法:用于求解最小生成树 (MST - Minimum Spanning Tree)。
7. Prim 算法:另一种求解最小生成树的方法。
8. 拓扑排序 (Topological Sorting):适用于有向无环图 (DAG),用于任务调度等应用。
9. Tarjan 算法:用于求解图中的强连通分量、割点、桥。