稳定排序算法详解 | Baeldung中文网

1. 概述

本文将介绍什么是稳定排序算法，以及它在实际开发中的应用场景。同时我们也会分析排序稳定性在哪些场景下是必须考虑的，哪些场景下可以忽略。

排序算法的“稳定性”指的是：当待排序的数据中存在多个相等的元素时，排序算法是否会保持它们原有的相对顺序。

举个例子：

我们有数组 A = [5, 8, 9, 8, 3]，其中有两个 8。如果我们能通过排序算法得到 [3, 5, 8, 8, 9]，并且两个 8 的相对顺序没有变化，那这个排序算法就是稳定的。

下面这张图可以更直观地帮助我们理解：

如图所示，稳定排序保留了两个相同值（8）的原始顺序，而不稳定排序可能会打乱它们的顺序。

并不是所有排序场景都需要稳定性。只有在以下情况下，稳定性才显得重要：

举个实际例子：假设我们正在统计一篇文章中各个单词的出现频率，并希望按频率排序。如果多个单词频率相同，我们希望它们按字母顺序排列。

输入文本：

how much wood would woodchuck chuck if woodchuck could chuck wood

输出结果：

how       1  
much      1  
wood      2  
would     1  
woodchuck 2  
chuck     2  
if        1  
could     1

第一次排序（按字母顺序）：

(chuck, 2)
(could, 1)
(how, 1)
(if, 1)
(much, 1)
(wood, 2)
(woodchuck, 2)
(would, 1)

第二次排序（按频率，使用不稳定排序）：

(wood, 2)
(chuck, 2)
(woodchuck, 2)
(could, 1)
(how, 1)
(if, 1)
(would, 1)
(much, 1)

⚠️ 问题来了：使用不稳定排序后，三个频率为 2 的单词顺序被打乱了，不再保持字母顺序。

如果我们使用稳定排序来按频率排序，结果如下：

(chuck, 2)
(wood, 2)
(woodchuck, 2)
(could, 1)
(how, 1)
(if, 1)
(much, 1)
(would, 1)

✅ 可以看到，频率相同的单词之间仍然保持了字母顺序。

基数排序（Radix Sort）是一种非比较型排序算法，依赖于稳定排序的子过程（通常是计数排序）。

它的工作流程如下：

for 每一位数字 k（从最低位到最高位）:
  使用计数排序对当前位进行排序

✅ 正是因为每轮排序都使用了稳定的子排序算法（如计数排序），Radix Sort 才能保证最终结果的正确性。比如在对十位数排序时，虽然 9881 向下移动了，但它仍然保持在 9888 的前面。

下面是一些常见排序算法的稳定性分类：

⚠️ 注意：某些不稳定排序算法也可以通过修改实现稳定排序，比如在 Quicksort 中使用额外信息来记录原始顺序。

理解排序算法的稳定性，有助于我们在实际开发中选择合适的排序策略，避免“踩坑”。