

本文基本上是 A Tutorial on Linear and Differential Cryptanalysis 的翻译,用自己的语言复述了一遍,加了部分自己的理解。


块加密(Block Cipher),或称为分组加密,是一种对称加密算法。它将明文分成多个等长的块(block),使用确定的算法和对称密钥对每组分别加密解密。通常来说,每个块使用的加密算法是相同的,但是密码组件不一定相同,例如不同块的S盒不一定相同。


SPN——代换-置换网络(Substitution–permutation network), 是一系列被应用于分组密码中相关的数学运算,最典型的就是AES。这种加密网络使用明文块和密钥块作为输入,并通过交错的若干“轮”代换操作和置换操作产生密文块。代换(Substitution)和置换(Permutation)的组件分别被称作S盒(替换盒,S-boxes)和P盒(排列盒,P-boxes)。


下图是 Heys 在 A Tutorial on Linear and Differential Cryptanalysis 中设计的一个非常基础的"Toy Cipher"。

我们可以通过这个基础的"Toy Cipher",来学习一下SPN。

这个SPN密码中,输入16bit的明文和16bit的密钥,输出16bit的密文。分为4个块,每个块中, 分别有4bit明文、密文。共有4轮加密,每一轮加密由3个过程组成:

  1. 轮密钥异或
  2. 代换 (Substitution)
  3. 置换 (Permutation)



增加了一轮 轮密钥异或,主要是为了防止最后一轮的代换密码在密码分析中被非常容易的绕过。


1. 轮密钥异或


2. 代换 (Substitution)

input 0 1 2 3 4 5 6 7 8 9 A B C D E F
output E 4 D 1 2 F B 8 3 A 6 C 5 9 0 7


$$Count(SBoxs) = len(input)/\sqrt{len(SBox)}$$

这里的s盒是4x4(4bit输入,4bit输出), 16bit的s盒,input是16bit,因此有4个s盒。



3. 置换 (Permutation)

input 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
output 1 5 9 13 2 6 10 14 3 7 11 15 4 8 12 16


$$Output[i] = Input[PBox[i]]$$

通常每轮只有一个 p 盒,每轮 p 盒都相同。p 盒的作用主要使字母失去统计意义。


1. 基本思路



$$X_{i_1} \oplus X_{i_2} \oplus … \oplus X_{i_u} \oplus Y_{j_1} \oplus Y_{j_2} \oplus … \oplus Y_{j_v} = 0$$


这个表达式不是必然成立的, 对于一个优秀的密码算法,它成立的概率应当是 1/2 , 即左边的结果可能为 0 ,也可能为 1 。如果该表达式成立的概率距离 1/2 越远,则越容易使用线性分析法,获得明密文之间的线性关系,从而通过多组明密文对分析出密钥的值。假设线性表达式成立的概率为 P,那么 |P-1/2| 越大,越容易受到线性密码分析攻击。


2. 堆积引理(Piling-Up Principle)


对于简单的两个随机变量X1, X2, 有:

$$ \begin{align} P_r(X_1=i)=\begin{cases} p_1,&\quad i = 0 \newline 1-p_1,&\quad i=1 \end{cases} \end{align} $$

$$ \begin{align} P_r(X_2=i)=\begin{cases} p_2,&\quad i = 0 \newline 1-p_2,&\quad i=1 \end{cases} \end{align} $$

如果这两个随机变量的取值是独立的, 则有:

$$ \begin{align} P_r(X_1=i, X_2=j)=\begin{cases} p_1p_2,&\quad i = 0,j=0 \newline p_1(1-p_2),&\quad i = 0,j=1 \newline (1-p_1)p_2,&\quad i = 1,j=0 \newline (1-p_1)(1-p_2),&\quad i=1,j=1 \end{cases} \end{align} $$


$$ \begin{align} P_r(X_1\oplus X_2=0) &= P_r(X_1=X_2) \newline &= P_r(X_1=0, X_2=0) + P_r(X_1=1, X_2=1) \newline &= p_1p_2 + (1-p_1)(1-p_2) \end{align} $$


$$ \begin{align} p1 = 1/2 + \varepsilon_1 \newline p2 = 1/2 + \varepsilon_2 \end{align} $$

其中 $\varepsilon_1,\varepsilon_2$ 分别是p1,p2距离1/2的偏差。且有: $$ -1/2 \leq \varepsilon_1,\varepsilon_2 \leq 1/2 $$


$$ P_r(X_1 \oplus X_2 = 0) = 1/2 + 2\varepsilon_1 \varepsilon_2 $$

则 $X_1 \oplus X_2 = 0的偏差\varepsilon_{1,2}=2\varepsilon_1 \varepsilon_2$


$$ \begin{align} &对 X_1=0, 到 X_n=0 的概率分别为p_1 = 1/2+\varepsilon_1 到 p_n = 1/2 + \varepsilon_n \newline &如果这个n个随机变量是独立的,根据堆积引理有: \newline &P_r(X_1 \oplus … \oplus X_n = 0) = 1/2 + 2^{n-1}\prod_{i=1}^n\varepsilon_i \newline & 即 \newline &\varepsilon_{1,2,…,n}=2^{n-1}\prod_{i=1}^n\varepsilon_i \end{align} $$



$$ \begin{align} &假设有: \newline &P_r(X_1\oplus X_2=0)=1/2 + \varepsilon_{1,2} \newline &P_r(X_2\oplus X_3=0)=1/2 + \varepsilon_{2,3} \newline &则 \newline &P_r(X_1 \oplus X_3 = 0) = P_r(X_1 \oplus X_2 \oplus X_2 \oplus X_3=0) =1/2+2\varepsilon_{1,2}\varepsilon_{2,3} \newline &即 \newline &\varepsilon_{1,3}=2\varepsilon_{1,2}\varepsilon_{2,3} \end{align} $$


1. 单个S盒线性分析


对于本例中的4X4的S盒,有4个bit的输入:X1,X2,X3,X4, 会得到4个bit的输出: Y1,Y2,Y3,Y4。


X1 X2 X3 X4 Y1 Y2 Y3 Y4
0 0 0 0 1 1 1 0
0 0 0 1 0 1 0 0
0 0 1 0 1 1 0 1
0 0 1 1 0 0 0 1
0 1 0 0 0 0 1 0
0 1 0 1 1 1 1 1
0 1 1 0 1 0 1 1
0 1 1 1 1 0 0 0
1 0 0 0 0 0 1 1
1 0 0 1 1 0 1 0
1 0 1 0 0 1 1 0
1 0 1 1 1 1 0 0
1 1 0 0 0 1 0 1
1 1 0 1 1 0 0 1
1 1 1 0 0 0 0 0
1 1 1 1 0 1 1 1


$$ X_2 \oplus X_3 \oplus Y_1 \oplus Y3 \oplus Y4 = 0 $$

我们分别使用16组输入输出,计算上述表达式成立的概率为12/16, 关于1/2的偏差为12/16-1/2=1/4

X1 X2 X3 X4 Y1 Y2 Y3 Y4 expression
0 0 0 0 1 1 1 0 0
0 0 0 1 0 1 0 0 0
0 0 1 0 1 1 0 1 1
0 0 1 1 0 0 0 1 0
0 1 0 0 0 0 1 0 0
0 1 0 1 1 1 1 1 0
0 1 1 0 1 0 1 1 1
0 1 1 1 1 0 0 0 1
1 0 0 0 0 0 1 1 0
1 0 0 1 1 0 1 0 0
1 0 1 0 0 1 1 0 0
1 0 1 1 1 1 0 0 0
1 1 0 0 0 1 0 1 0
1 1 0 1 1 0 0 1 1
1 1 1 0 0 0 0 0 0
1 1 1 1 0 1 1 1 0


input\output 0 1 2 3 4 5 6 7 8 9 A B C D E F
0 8 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
1 0 0 -2 -2 0 0 -2 6 2 2 0 0 2 2 0 0
2 0 0 -2 -2 0 0 -2 -2 0 0 2 2 0 0 -6 2
3 0 0 0 0 0 0 0 0 2 -6 -2 -2 2 2 -2 -2
4 0 2 0 -2 -2 -4 -2 0 0 -2 0 2 2 -4 2 0
5 0 -2 -2 0 -2 0 4 2 -2 0 -4 2 0 -2 -2 0
6 0 2 -2 4 2 0 0 2 0 -2 2 4 -2 0 0 -2
7 0 -2 0 2 2 -4 2 0 -2 0 2 0 4 2 0 2
8 0 0 0 0 0 0 0 0 -2 2 2 -2 2 -2 -2 -6
9 0 0 -2 -2 0 0 -2 -2 -4 0 -2 2 0 4 2 -2
A 0 4 -2 2 -4 0 2 -2 2 2 0 0 2 2 0 0
B 0 4 0 -4 4 0 4 0 0 0 0 0 0 0 0 0
C 0 -2 4 -2 -2 0 2 0 2 0 2 4 0 2 0 -2
D 0 2 2 0 -2 4 0 2 -4 -2 2 0 2 0 0 2
E 0 2 2 0 -2 -4 0 2 -2 0 0 -2 -4 2 -2 0
F 0 -2 -4 -2 -2 0 2 0 0 -2 4 -2 -2 0 2 0


$$ \begin{align} &P_r(X_2 \oplus X_3 \oplus Y_1 \oplus Y_3 \oplus Y_4) = 1/2 + NlTable[0b0110][0b1101]/16 = 1/2 + 4/16 \newline &\varepsilon = 4/16 =1/4 \end{align} $$


$$ \begin{align} &\sum_{0ba_4a_3a_2a_1=0}^{15}\sum_{0bb_4b_3b_2b_1=0}^{15} (a_1 \cdot X_1) \oplus (a_2 \cdot X_2) \oplus (a_3 \cdot X_3) \oplus (a_4 \cdot X_4) \oplus (b_1 \cdot Y_1) \oplus (b_2 \cdot Y_2) \oplus (b_3 \cdot Y_3) \oplus (b_4 \cdot Y_4) \newline &\iff \newline &\sum_{i=0}^{15}\sum_{j=0}^{15}(0bX_4X_3X_2X_1 \cdot i)\oplus(0bY_4Y_3Y_2Y_1 \cdot j) \newline &(\cdot 符号指位运算中的与运算) \end{align} $$


2. 多组S盒的线性逼近

这一节中,我们以第二个块中明文中的(P5, P7, P8)作为输入。(没有特别的理由,只是这个作为例子比较简单)



对要进行线性分析的S盒(前3轮),每一轮的S盒, 输入、输出、偏差分别为:

$$ \begin{align} &S_{12}: X_1\oplus X_3 \oplus X_4 = Y_2 &bias: 1/4 \newline &S_{22}: X_2 = Y_2 \oplus Y_4 &bias: -1/4 \newline &S_{32}: X_2 = Y_2 \oplus Y_4 &bias: -1/4 \newline &S_{34}: X_2 = Y_2 \oplus Y_4 &bias: -1/4 \end{align} $$

我们假定Ui,j, Vi,j分别为第i轮S盒的第jbit输入、输出(1<=i<=4, 1<=j<=16); Ki,j为第i轮轮密钥的第jbit。(1<=i<=5, 1<=j<=16)



$$ \begin{align} \newline U_1 &= P\oplus K1 \newline V_{1,6}&= U_{1,5}\oplus U_{1,7} \oplus U_{1,8} \newline &= ((P_5) \oplus K_{1,5})\oplus (P_7\oplus K_{1,7}) \oplus (P_8 \oplus K_{1,8}) &bias: 1/4 \end{align} $$


$$ \begin{align} \newline U_{2,6} &= V_{1,6} \oplus K_{2,6} \newline V_{2,6} \oplus V_{2,8} &= U_{2,6} \newline &=V_{1,6} \oplus K_{2,6}& bias: -1/4 \newline &=P_5 \oplus K_{1,5}\oplus P_7\oplus K_{1,7}\oplus P_8 \oplus K_{1,8} \oplus K_{2,6} &bias: 2*1/4*-1/4=-1/8 \end{align} $$


$$ \begin{align} \newline U_{3,6} &= V_{2,6} \oplus K_{3,6} \newline U_{3,14} &= V_{2,14} \oplus K_{3,14} \newline V_{3,6} \oplus V_{3,8} &= U_{3,6} \newline &=V_{2,6} \oplus K_{3,6} & bias: -1/4 \newline V_{3,14} \oplus V_{3,16} &= U_{3,14} \newline &=V_{2,8} \oplus K_{3,14} & bias: -1/4 \newline V_{3,6} \oplus V_{3,8} \oplus V_{3,14} \oplus V_{3,16} &=V_{2,6}\oplus V_{2,8} \oplus K_{3,6} \oplus K_{3,14} \newline &= P_5 \oplus P_7\oplus P_8\oplus K_{1,5}\oplus K_{1,7} \oplus K_{1,8} \oplus K_{2,6} \oplus K_{3,6}\oplus K_{3,14} \newline bias&= 2^{3-1}*-\frac{1}{8}*-\frac{1}{4}-\frac{1}{4}=-\frac{1}{32} \end{align} $$


$$ \begin{align} \newline U_{4,6} &= V_{3,6}\oplus K_{4,6} \newline U_{4,8} &= V_{3,14}\oplus K_{4,8} \newline U_{4,14} &= V_{3,8}\oplus K_{4,14} \newline U_{4,16} &= V_{3,16}\oplus K_{4,16} \newline U_{4,6} \oplus U_{4,8}\oplus U_{4,14}\oplus U_{4,16} &= V_{3,6} \oplus V_{3,8} \oplus V_{3,14} \oplus V_{3,16} \oplus K_{4,6}\oplus K_{4,8}\oplus K_{4,14}\oplus K_{4,16} \newline &= P_5 \oplus P_7\oplus P_8\oplus \sum K \newline \sum K &= K_{1,5}\oplus K_{1,7} \oplus K_{1,8} \oplus K_{2,6} \oplus K_{3,6}\oplus K_{3,14} \oplus K_{4,6}\oplus K_{4,8}\oplus K_{4,14}\oplus K_{4,16} \end{align} $$



$$ \begin{align} &\sum K = 0 或 1 \newline &P_r(U_{4,6} \oplus U_{4,8}\oplus U_{4,14}\oplus U_{4,16}\oplus P_5 \oplus P_7\oplus P_8 = 0) = 1/2 - 1/32 或 1/2 + 1/32 \end{align} $$



$$ \sum(U_4\oplus K_5\oplus P=0)=n*1/32 $$

3. 爆破密钥

当我们有足够多的明密文对时,爆破[K5,5…K5,8], [K5,13…K5,16],对每一种可能的K5(共256种)我们可以根据K5, 和Cipher的值,计算得出[U4,5…U4,8], [U4,13…U4,16],从而计算实际的偏差。正确的K5, 偏差应该接近1/32。对于一个错误的K5, 计算出来的偏差应该接近于0。


[K5,5…K5,8], [K5,13…K5,16] bias [K5,5…K5,8], [K5,13…K5,16] bias
1 C 0.0031 2 A 0.0044
1 D 0.0078 2 B 0.0186
1 E 0.0071 2 C 0.0094
1 F 0.0170 2 D 0.0053
2 0 0.0025 2 E 0.0062
2 1 0.0220 2 F 0.0133
2 2 0.0211 3 0 0.0027
2 3 0.0064 3 1 0.0050
2 4 0.0336 3 2 0.0075
2 5 0.0106 3 3 0.0162
2 6 0.0096 3 4 0.0218
2 7 0.0074 3 5 0.0052
2 8 0.0224 3 6 0.0056
2 9 0.0054 3 7 0.0048

我们发现最大的偏差是0.0336, 接近于1/32=0.03125。 因此我们可以认为 [K5,5…K5,8] = 0b0010, [K5,13…K5,16] =0b0100


4. 线性密码分析的复杂性

作者认为,应该需要 $\varepsilon^{-2}$ 组明密文对。我们可以认为,如果可以获得$\varepsilon^{-2}$组明密文对,则该密码算法是可以被线性分析攻击的。


这个例子中,我们假设每个S盒是独立的,但是现实中的S盒不是独立的,这可能会对概率的计算产生比较大的影响。可能不同的S盒的组合产生的偏差可能会比相同的S盒的偏差更大,这个概念称为linear hull. 值得注意的是,如果每个S盒的偏差很小,但当多个S盒组合在一起时,它们可能会产生一个非常大的偏差。


  1. 找出所有的线性逼近
  2. S盒不同的情况

在0ctf2018的zer0SPN一题中,涉及了以上两种情况。可以参考我的另一篇博客 0ctf2018 zer0SPN (线性密码分析)


完整代码参见: linear_cryptanalysis/spn, 本文我们只介绍部分重要函数的功能。

func CalcNlTable(sBox []int) common.Matrix {func CalcBiasTable(nlTable common.Matrix) map[NlKey]int {用于计算所有的线性表达式的偏差。



// U =====Substitute=====> V =====Permutation=====> W ======subKey mixing======> U'
type Element struct {
	Value int
	Round int
	Col   int

func Substitute(uList []Element, biasTable map[lib.NlKey]int) ([][]Element, []int) {func Permutation(pBox []int, vList []Element) []Element {函数分别是基于Element的代换和置换运算。


type Round struct {
	Round    int
	SBox     []int
	PBox     []int
	UList    []Element
	VCombo   [][]Element
	BiasList []int

func (r *Round) AnalysisForEachRound(biasTable map[lib.NlKey]int) []Round {
	var nextRoundList []Round
	r.VCombo, r.BiasList = Substitute(r.UList, biasTable)
	for _, vList := range r.VCombo {
		nextRoundUList := Permutation(r.PBox, vList)
		nextRound := Round{
			Round: r.Round + 1,
			SBox:  r.SBox,
			PBox:  r.PBox,
			UList: nextRoundUList,
		nextRoundList = append(nextRoundList, nextRound)
	return nextRoundList

func Analysis(sBox, pBox []int, keySize, pair, biasProductLine, iteratorTime int) {实现了密码分析的过程,输出偏差大于biasProductLine的线性表达式。iteratorTime指定最大可爆破的密钥块。每次爆破,需要读取n组明密文对, 时间复杂度为O(2^iteratorTime*n)。一般来说,对于一个8bit的block,如果要爆破两块密钥,需要爆破2^8*2^8次, 假设共65535组明密文对,则大约要执行2^32次循环,是可接受的。但是如果要爆破3个密钥块,则是不可接受的。

func Check(sBoxInv []int, plainTextList, cipherTextList [][]byte, x, y, pair int, plainBitMap, cipherBitMap []BitMap) int {函数根据线性分析的结果,对密钥进行爆破。基于goroutine,实现了CPU 100%的利用。

1. 参考资料

2. 排版

