MD5 与 SHA 算法详解 | Baeldung中文网

1. 简介

本文将深入讲解两个常见的加密算法：MD5（消息摘要算法）和 SHA（安全哈希算法）。我们会分别介绍它们的原理、特点以及实际应用，最后对两者进行对比分析。

2. 加密哈希函数

首先明确一个概念：加密哈希函数是 MD5 和 SHA 的核心基础。它是一种将任意长度输入转换为固定长度输出的函数。这个输出通常被称为“哈希值”或“摘要”。

加密哈希函数应具备以下特性：

✅ 单向性：无法通过哈希反推出原始输入
✅ 伪随机性：输出应看起来像随机数据
✅ 抗碰撞性：很难找到两个不同的输入生成相同的哈希

这些特性使得哈希函数广泛应用于数据完整性校验、文件识别、身份认证、密码存储、数字签名等场景。可以说，它是保障系统安全的重要基础。

3. MD5

MD5 是一种广泛使用的哈希算法，它可以将任意长度的输入转换为一个 128 位的哈希值。虽然它已经被认为在密码学上不再安全，但仍在一些非安全场景中被使用，例如验证文件完整性。

MD5 的处理方式是将输入按 512 位为一组进行处理，每组再拆分为 16 个 32 位的字。最终输出为 128 位哈希值。

来看一个例子：

MD5("The grass is always greener on the other side of the fence.") = d78298e359ac826549e3030104241a57

如果我们只改动一个字符（例如将句号改为感叹号）：

MD5("The grass is always greener on the other side of the fence!") = 2e51f2f8daec292839411955bd77183d

输出的哈希完全不同，这正是哈希函数的“雪崩效应”体现。

3.1 安全性

MD5 最大的问题在于其抗碰撞性已被攻破。2011 年，IETF 发布了 RFC 6151，详细描述了对 MD5 的攻击方式。研究表明，攻击者可以在普通计算机上用不到一分钟的时间生成哈希碰撞。

因此，MD5 不适合用于需要高安全性的场景，如数字签名、身份认证等。

不过，MD5 仍常用于非安全用途，比如校验文件是否被篡改。例如，开发者发布一个软件包时会提供其 MD5 哈希值。用户下载后可以通过对比哈希值判断文件是否完整或被篡改。

⚠️ 踩坑提醒：如果你正在开发一个安全系统，请不要使用 MD5。

4. SHA-2

SHA（Secure Hash Algorithm）是一组哈希算法，目前主流版本包括 SHA-1、SHA-2 和 SHA-3。其中 SHA-2 是目前最常用、最安全的版本之一。

SHA-2 包括多个变种，如 SHA-224、SHA-256、SHA-512 等。它们使用相同的算法结构，但输出长度不同。其中 SHA-256 是最常用的，输出长度为 256 位。

来看一个 SHA-256 的例子：

SHA256("The grass is always greener on the other side of the fence.") = d017bcafd6aa208df913d92796f670df44cb8d7f7b548d6f9eddcccf214ac08a

同样，只改一个字符：

SHA256("The grass is always greener on the other side of the fence!") = a8c655db7f4d0a3a0b34209f3b89d4466332bbf2745e759e01567ac74b23a349

输出完全不同，同样体现了雪崩效应。

SHA-2 被广泛用于以下场景：

✅ 数字签名
✅ SSL/TLS 握手
✅ 密码存储
✅ 区块链技术（如比特币）
✅ 美国政府指定用于保护机密数据

4.1 安全性

SHA-256 的安全性体现在以下几个方面：

单向性：几乎不可能通过哈希反推出原始数据。理论上需要 ![2^{256}](/wp-content/ql-cache/quicklatex.com-1f4d59abd1b91fcd49721b834e544a25_l3.svg "Rendered by QuickLaTeX.com) 次尝试才能暴力破解
抗碰撞性：2^256 种可能的哈希值，几乎不可能出现碰撞
雪崩效应：微小输入变化导致完全不同的输出

因此，SHA-256 是目前最推荐使用的哈希算法之一。

5. MD5 vs. SHA-2：对比分析

特性	MD5	SHA-2
输出长度	128 位	224/256/512 位（常见为 256 位）
安全性	不安全，已可被碰撞攻击	高安全性，目前无已知有效攻击
抗碰撞性	弱，容易生成碰撞	强，几乎不可能碰撞
速度	更快	稍慢
常见用途	文件完整性校验	安全相关场景（如签名、加密）

✅ 推荐使用场景

SHA-2：适用于需要高安全性的场景，如用户密码存储、数字签名、SSL 握手等
MD5：仅用于非安全场景，如快速校验文件是否损坏或被篡改

⚠️ 踩坑提醒：如果你的系统涉及用户隐私、交易或身份认证，不要使用 MD5，否则可能成为攻击目标。

6. 总结

MD5 和 SHA-2 是两种常见的哈希算法。MD5 虽然速度快，但已经被证明不安全，不适合用于安全敏感的场景；而 SHA-2（尤其是 SHA-256）则具备极高的安全性，是目前推荐使用的标准。

在实际开发中，选择哈希算法应根据具体场景来决定：

若只是用于校验文件完整性，MD5 可以满足需求
若涉及用户安全、数据加密、身份验证等，务必使用 SHA-2 或更高版本

在性能不是瓶颈的前提下，优先选择更安全的算法。SHA-256 在安全性和性能之间达到了较好的平衡，是目前最推荐的哈希算法之一。

Persistence

REST

Security