博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
算法实践——舞蹈链(Dancing Links)算法求解数独
阅读量:6607 次
发布时间:2019-06-24

本文共 18499 字,大约阅读时间需要 61 分钟。

在“”一文中介绍了舞蹈链(Dancing Links)算法求解精确覆盖问题。

本文介绍该算法的实际运用,利用舞蹈链(Dancing Links)算法求解数独

 

在前文中可知,舞蹈链(Dancing Links)算法在求解精确覆盖问题时效率惊人。

那利用舞蹈链(Dancing Links)算法求解数独问题,实际上就是下面一个流程

1、把数独问题转换为精确覆盖问题

2、设计出数据矩阵

3、用舞蹈链(Dancing Links)算法求解该精确覆盖问题

4、把该精确覆盖问题的解转换为数独的解

 

首先看看数独问题(9*9的方格)的规则

1、每个格子只能填一个数字

2、每行每个数字只能填一遍

3、每列每个数字只能填一遍

4、每宫每个数字只能填一遍(宫的概念,参看“”)

 

那现在就是利用这个规则把数独问题转换为精确覆盖问题

可是,直观上面的规则,发现比较难以转换为精确覆盖问题。因此,把上面的表述换个说法

1、每个格子只能填一个数字

2、每行1-9的这9个数字都得填一遍(也就意味着每个数字只能填一遍)

3、每列1-9的这9个数字都得填一遍

4、每宫1-9的这9个数字都得填一遍

 

这样理解的话,数独问题转换为精确覆盖问题就相对简单多了。关键就是如何构造精确覆盖问题中的矩阵

 

我们把矩阵的每个列都定义成一个约束条件。

 

第1列定义成:(1,1)填了一个数字

第2列定义成:(1,2)填了一个数字

……

第9列定义成:(1,9)填了一个数字

第10列定义成:(2,1)填了一个数字

……

第18列定义成:(2,9)填了一个数字

……

第81列定义成:(9,9)填了一个数字

至此,用第1-81列完成了约束条件1:每个格子只能填一个数字

第N列(1≤N≤81)定义成:(X,Y)填了一个数字。

N、X、Y之间的关系是:X=INT((N-1)/9)+1;Y=((N-1) Mod 9)+1;N=(X-1)×9+Y

 

 

第82列定义成:在第1行填了数字1

第83列定义成:在第1行填了数字2

……

第90列定义成:在第1行填了数字9

第91列定义成:在第2行填了数字1

……

第99列定义成:在第2行填了数字9

……

第162列定义成:在第9行填了数字9

至此,用第82-162列(共81列)完成了约束条件2:每行1-9的这9个数字都得填一遍

第N列(82≤N≤162)定义成:在第X行填了数字Y。

N、X、Y之间的关系是:X=INT((N-81-1)/9)+1;Y=((N-81-1) Mod 9)+1;N=(X-1)×9+Y+81

 

 

第163列定义成:在第1列填了数字1

第164列定义成:在第1列填了数字2

……

第171列定义成:在第1列填了数字9

第172列定义成:在第2列填了数字1

……

第180列定义成:在第2列填了数字9

……

第243列定义成:在第9列填了数字9

至此,用第163-243列(共81列)完成了约束条件3:每列1-9的这9个数字都得填一遍

第N列(163≤N≤243)定义成:在第X列填了数字Y。

N、X、Y之间的关系是:X=INT((N-162-1)/9)+1;Y=((N-162-1) Mod 9)+1;N=(X-1)×9+Y+162

 

 

第244列定义成:在第1宫填了数字1

第245列定义成:在第1宫填了数字2

……

第252列定义成:在第1宫填了数字9

第253列定义成:在第2宫填了数字1

……

第261列定义成:在第2宫填了数字9

……

第324列定义成:在第9宫填了数字9

至此,用第244-324列(共81列)完成了约束条件4:每宫1-9的这9个数字都得填一遍

第N列(244≤N≤324)定义成:在第X宫填了数字Y。

N、X、Y之间的关系是:X=INT((N-243-1)/9)+1;Y=((N-243-1) Mod 9)+1;N=(X-1)×9+Y+243

 

至此,用了324列完成了数独的四个约束条件,矩阵的列定义完成

那接下来,就是把数独转换为矩阵

数独问题中,每个格子分两种情况。有数字的格子、没数字的格子。

 

有数字的格子

以例子来说明,在(4,2)中填的是7

把(4,2)中填的是7,解释成4个约束条件

1、在(4,2)中填了一个数字。

2、在第4行填了数字7

3、在第2列填了数字7

4、在第4宫填了数字7(坐标(X,Y)到宫N的公式为:N=INT((X-1)/3)×3+INT((Y-1)/3)+1)

 

那么这4个条件,分别转换成矩阵对应的列为

1、在(4,2)中填了一个数字。对应的列N=(4-1)×9+2=29

2、在第4行填了数字7。对应的列N=(4-1)×9+7+81=115

3、在第2列填了数字7。对应的列N=(2-1)×9+7+162=178

4、在第4宫填了数字7。对应的列N=(4-1)×9+7+243=277

 

于是,(4,2)中填的是7,转成矩阵的一行就是,第29、115、178、277列是1,其余列是0。把这1行插入到矩阵中去。

 

没数字的格子

还是举例说明,在(5,8)中没有数字

把(5,8)中没有数字转换成

(5,8)中填的是1,转成矩阵的一行就是,第44、118、226、289列是1,其余列是0。

(5,8)中填的是2,转成矩阵的一行就是,第44、119、227、290列是1,其余列是0。

(5,8)中填的是3,转成矩阵的一行就是,第44、120、228、291列是1,其余列是0。

(5,8)中填的是4,转成矩阵的一行就是,第44、121、229、292列是1,其余列是0。

(5,8)中填的是5,转成矩阵的一行就是,第44、122、230、293列是1,其余列是0。

(5,8)中填的是6,转成矩阵的一行就是,第44、123、231、294列是1,其余列是0。

(5,8)中填的是7,转成矩阵的一行就是,第44、124、232、295列是1,其余列是0。

(5,8)中填的是8,转成矩阵的一行就是,第44、125、233、296列是1,其余列是0。

(5,8)中填的是9,转成矩阵的一行就是,第44、126、234、297列是1,其余列是0。

把这9行插入到矩阵中。由于这9行的第44列都是1(不会有其他行的44列会是1),也就是说这9行中必只有1行(有且只有1行)选中(精确覆盖问题的定义,每列只能有1个1),是最后解的一部分。这就保证了最后解在(5,8)中只有1个数字。

 

这样,从数独的格子依次转换成行(1行或者9行)插入到矩阵中。完成了数独问题到精确覆盖问题的转换。

接下来求解精确覆盖问题就交给舞蹈链(Dancing Links)算法,详情参看“”

 

Public 
Interface 
I_Sudoku 
    
Function SetLine(
ByVal Row 
As 
Integer
ByVal 
ParamArray Value() 
As 
Integer
As 
Boolean 
    
Function Calculate() 
As 
String 
    
Sub Init() 
End 
Interface 
Public 
Class 
clsSudokuDLX 
    
Implements 
I_Sudoku 
    
Private _Dance 
As 
clsDancingLinks 
    
Private _Num(80) 
As 
Integer 
    
Public 
Sub 
New() 
        Init() 
    
End 
Sub 
    
Public 
Function SetLine(Row 
As 
Integer
ParamArray Value() 
As 
Integer
As 
Boolean 
Implements 
I_Sudoku.SetLine 
        
Dim I 
As 
Integer 
        
For I = 0 
To IIf(Value.Length < 10, Value.Length - 1, 8) 
            _Num(Row * 9 - 9 + I) = Value(I) 
        
Next 
        
Return 
True 
    
End 
Function 
    
Public 
Function Calculate() 
As 
String 
Implements 
I_Sudoku.Calculate 
        
Dim I 
As 
Integer, J 
As 
Integer 
        
Dim X 
As 
Integer, Y 
As 
Integer 
        
Dim Index 
As 
New 
List(
Of 
Integer), Value 
As 
New 
List(
Of 
Integer
        
Dim C1 
As 
Integer, C2 
As 
Integer, C3 
As 
Integer, C4 
As 
Integer 
        
For I = 0 
To 80 
            X = Int(I / 9) 
            Y = I 
Mod 9 
            
If _Num(I) > 0 
Then 
                C1 = X * 9 + Y + 1 
                C2 = X * 9 + _Num(I) + 81 
                C3 = Y * 9 + _Num(I) + 162 
                C4 = (Int(X / 3) * 3 + Int(Y / 3)) * 9 + _Num(I) + 243 
                _Dance.AppendLineByIndex(C1, C2, C3, C4) 
                Index.Add(I) 
                Value.Add(_Num(I)) 
            
Else 
                C1 = X * 9 + Y + 1 
                C2 = X * 9 + 1 + 81 
                C3 = Y * 9 + 1 + 162 
                C4 = (Int(X / 3) * 3 + Int(Y / 3)) * 9 + 1 + 243 
                _Dance.AppendLineByIndex(C1, C2, C3, C4) 
                Index.Add(I) 
                Value.Add(1) 
                
For J = 2 
To 9 
                    _Dance.AppendLineByIndex(C1, C2 + J - 1, C3 + J - 1, C4 + J - 1) 
                    Index.Add(I) 
                    Value.Add(J) 
                
Next 
            
End 
If 
        
Next 
        
Dim P() 
As 
Integer = _Dance.Dance 
        
For I = 0 
To 80 
            _Num(Index.Item(P(I) - 1)) = Value.Item(P(I) - 1) 
        
Next 
        
Dim V 
As 
String = 
"" 
        
For I = 0 
To 80 
            V = V & _Num(I) & 
"  " 
            
If I 
Mod 9 = 8 
Then V &= vbNewLine 
        
Next 
        
Return V 
    
End 
Function 
    
Public 
Sub Init() 
Implements 
I_Sudoku.Init 
        _Dance = 
New 
clsDancingLinks(324) 
        
Dim I 
As 
Integer 
        
For I = 0 
To 80 
            _Num(I) = 0 
        
Next 
    
End 
Sub 
End 
Class

上面的代码给出了clsSudokuDLX的代码,通过调用clsDancingLinks类来求解数独。I_Sudoku接口没什么特殊意义,仅仅是为了测试方便而已。clsDancingLinks类的代码这里就不贴了,在“”里有

 

对三个数独问题求解来对比算法的效率

先看看三个数独

数独一:简单的数独

 

数独二:有点难度的数独

 

数独三:高难度的数独。虽然和数独二比较仅仅差了一个数字的位置,但是求解的难度提高了不止一个等级。

 

 

时间效率的对比

 

我们分别对三个数独进行百次的求解,剔除明显异于平均的时间,再取平均值

 

暴力破解法

数独一:0.114毫秒

数独二:0.238毫秒

数独三:15.706毫秒

 

舞蹈链(Dancing Links)算法

数独一:876.161毫秒(这个差距有点大,近乎7700倍,和我的期望值差距比较大)

数独二:775839.5毫秒=775秒840毫秒≈12.93分钟(我只做了三次测试,第一次等了5分钟,没结果,就退出了;第二次777348毫秒;第三次774331毫秒)

数独三:只做了一次测试,时间约40分钟,还没结果,就退出了

 

从上面的测试结果来看,舞蹈链(Dancing Links)算法从时间效率的角度来看,是完败于暴力破解法的

 

空间效率的对比

 

暴力破解法

数独一:在求解的过程中,一路唯一数单元格到底,没有缓存数据。故空间占用81字节。

数独二:在求解的过程中,最多向栈Q缓存了12步的数据。故占用空间81+12*81=972字节

数独三:在求解的过程中,最多向栈Q缓存了21步的数据。故占用空间81+21*81=1782字节

 

舞蹈链(Dancing Links)算法

数独一:题目提供了32个数字,则矩阵一共有32*1+(81-32)*9=473行,每行4个节点,则一共有473*4+324+1=2217个节点。每个节点6个分量,则一共要13302个字节。另程序在每行额外提供2个字节缓存相关信息。故一共要11844+473*2=14248字节

数独二:题目提供了21个数字,则矩阵一共有21*1+(81-21)*9=561行,每行4个节点,则一共有561*4+324+1=2569个节点。每个节点6个分量,则一共要15414个字节。另程序在每行额外提供2个字节缓存相关信息。故一共要15414+561*2=16536字节

数独三:题目提供了21个数字,则矩阵一共有21*1+(81-21)*9=561行,每行4个节点,则一共有561*4+324+1=2569个节点。每个节点6个分量,则一共要15414个字节。另程序在每行额外提供2个字节缓存相关信息。故一共要15414+561*2=16536字节

 

以上的分析,舞蹈链(Dancing Links)算法从空间效率的角度来看,是完败于暴力破解法的

 

做分析做到这,结果出乎我的意料。虽然我估计舞蹈链(Dancing Links)算法不见得优于暴力破解法,但没想到差距会那么大。不过,也可以理解,舞蹈链(Dancing Links)算法仅仅是利用了十字双向循环链的数据结构解决了缓存和回溯的难题,但本质上还是回溯法,还是暴力破解法。

 

 

针对该数独问题进行优化舞蹈链(Dancing Links)算法

 

回顾前文“”,可以发现,在Dance(K)函数调用的时候,是直接调用_Head.Right来获得未求解列。由于精确覆盖问题是要求每个列都要覆盖到,因此,在算法中调用未求解列的先后顺序那就不是最重要了。假如,现在有两个未求解列C1和C2,C1列有8个元素,C2列有4个元素。最坏的情况,从C1列求解,需要调用8次Dance(K+1),而从C2列求解,需要调用4次Dance(K+1)。感觉上从C2列求解比从C1列求解效率要高些。因此,在Dance(K)函数调用的时候,先找寻列元素最少的未求解列,再依次求解,可能效率会高点。我们把这个称之为改进的舞蹈链(Improve Dancing Links)算法

 

给每个列首元素(除却Head元素)添加一个Count分量,表示这个列首所在列的其他元素的个数。

因此,在原算法的基础上,把C1=Head.Right改成获得Count分量最少的列首元素。代码贴于下方,修改的部分用红色标示

Public 
Class 
clsDancingLinksImprove 
    
Private Left() 
As 
Integer, Right() 
As 
Integer, Up() 
As 
Integer, Down() 
As 
Integer 
    
Private Row() 
As 
Integer, Col() 
As 
Integer 
    
Private _Head 
As 
Integer 
    
Private _Rows 
As 
Integer, _Cols 
As 
Integer, _NodeCount 
As 
Integer 
    
Private Count() As Integer 
    
Private Ans() 
As 
Integer 
    
Public 
Sub 
New(
ByVal Cols 
As 
Integer
        
ReDim Left(Cols), Right(Cols), Up(Cols), Down(Cols), Row(Cols), Col(Cols), Ans(Cols) 
        
ReDim Count(Cols) 
        
Dim I 
As 
Integer 
        Up(0) = 0 
        Down(0) = 0 
        Right(0) = 1 
        Left(0) = Cols 
        
For I = 1 
To Cols 
            Up(I) = I 
            Down(I) = I 
            Left(I) = I - 1 
            Right(I) = I + 1 
            Col(I) = I 
            Row(I) = 0 
            Count(I) = 0 
        
Next 
        Right(Cols) = 0 
        _Rows = 0 
        _Cols = Cols 
        _NodeCount = Cols 
        _Head = 0 
    
End 
Sub 
    
Public 
Sub AppendLine(
ByVal 
ParamArray Value() 
As 
Integer
        _Rows += 1 
        
If Value.Length = 0 
Then 
Exit Sub 
        
Dim I 
As 
Integer, K 
As 
Integer = 0 
        
For I = 0 
To Value.Length - 1 
            
If Value(I) = 1 
Then 
                _NodeCount += 1 
                
ReDim 
Preserve Left(_NodeCount) 
                
ReDim 
Preserve Right(_NodeCount) 
                
ReDim 
Preserve Up(_NodeCount) 
                
ReDim 
Preserve Down(_NodeCount) 
                
ReDim 
Preserve Row(_NodeCount) 
                
ReDim 
Preserve Col(_NodeCount) 
                
ReDim 
Preserve Ans(_NodeCount) 
                
If K = 0 
Then 
                    Left(_NodeCount) = _NodeCount 
                    Right(_NodeCount) = _NodeCount 
                    K = 1 
                
Else 
                    Left(_NodeCount) = _NodeCount - 1 
                    Right(_NodeCount) = Right(_NodeCount - 1) 
                    Left(Right(_NodeCount - 1)) = _NodeCount 
                    Right(_NodeCount - 1) = _NodeCount 
                
End 
If 
                Down(_NodeCount) = I + 1 
                Up(_NodeCount) = Up(I + 1) 
                Down(Up(I + 1)) = _NodeCount 
                Up(I + 1) = _NodeCount 
                Row(_NodeCount) = _Rows 
                Col(_NodeCount) = I + 1 
                
Count(I + 1) += 1 
            
End 
If 
        
Next 
    
End 
Sub 
    
Public 
Sub AppendLineByIndex(
ByVal 
ParamArray Index() 
As 
Integer
        _Rows += 1 
        
If Index.Length = 0 
Then 
Exit Sub 
        
Dim I 
As 
Integer, K 
As 
Integer = 0 
        
ReDim 
Preserve Left(_NodeCount + Index.Length) 
        
ReDim 
Preserve Right(_NodeCount + Index.Length) 
        
ReDim 
Preserve Up(_NodeCount + Index.Length) 
        
ReDim 
Preserve Down(_NodeCount + Index.Length) 
        
ReDim 
Preserve Row(_NodeCount + Index.Length) 
        
ReDim 
Preserve Col(_NodeCount + Index.Length) 
        
ReDim 
Preserve Ans(_NodeCount + Index.Length) 
        
For I = 0 
To Index.Length - 1 
            _NodeCount += 1 
            
If I = 0 
Then 
                Left(_NodeCount) = _NodeCount 
                Right(_NodeCount) = _NodeCount 
            
Else 
                Left(_NodeCount) = _NodeCount - 1 
                Right(_NodeCount) = Right(_NodeCount - 1) 
                Left(Right(_NodeCount - 1)) = _NodeCount 
                Right(_NodeCount - 1) = _NodeCount 
            
End 
If 
            Down(_NodeCount) = Index(I) 
            Up(_NodeCount) = Up(Index(I)) 
            Down(Up(Index(I))) = _NodeCount 
            Up(Index(I)) = _NodeCount 
            Row(_NodeCount) = _Rows 
            Col(_NodeCount) = Index(I) 
            
Count(Index(I)) += 1 
        
Next 
    
End 
Sub 
    
Public 
Function Dance() 
As 
Integer() 
        
Return IIf(Dance(0) = 
True, Ans, 
Nothing
    
End 
Function 
    
Private 
Function Dance(
ByVal K 
As 
Integer
As 
Boolean 
        
If (Right(_Head) = _Head) 
Then 
            
ReDim 
Preserve Ans(K - 1) 
            
Return 
True 
        
End 
If 
        Dim P As Integer, C1 As Integer 
        P = Right(_Head) 
        C1 = P 
        Do While P <> _Head 
            If Count(P) < Count(C1) Then C1 = P 
            P = Right(P) 
        Loop 
        If Count(C1) < 1 Then Return False 
        RemoveCol(C1) 
        
Dim I 
As 
Integer, J 
As 
Integer 
        I = Down(C1) 
        
Do 
While I <> C1 
            Ans(K) = Row(I) 
            J = Right(I) 
            
Do 
While J <> I 
                RemoveCol(Col(J)) 
                J = Right(J) 
            
Loop 
            
If Dance(K + 1) 
Then 
Return 
True 
            J = Left(I) 
            
Do 
While J <> I 
                ResumeCol(Col(J)) 
                J = Left(J) 
            
Loop 
            I = Down(I) 
        
Loop 
        ResumeCol(C1) 
        
Return 
False 
    
End 
Function 
    
Public 
Sub RemoveCol(
ByVal ColIndex 
As 
Integer
        Left(Right(ColIndex)) = Left(ColIndex) 
        Right(Left(ColIndex)) = Right(ColIndex) 
        
Dim I 
As 
Integer, J 
As 
Integer 
        I = Down(ColIndex) 
        
Do 
While I <> ColIndex 
            J = Right(I) 
            
Do 
While J <> I 
                Up(Down(J)) = Up(J) 
                Down(Up(J)) = Down(J) 
                
Count(Col(J)) -= 1 
                J = Right(J) 
            
Loop 
            I = Down(I) 
        
Loop 
    
End 
Sub 
    
Public 
Sub ResumeCol(
ByVal ColIndex 
As 
Integer
        Left(Right(ColIndex)) = ColIndex 
        Right(Left(ColIndex)) = ColIndex 
        
Dim I 
As 
Integer, J 
As 
Integer 
        I = Up(ColIndex) 
        
Do 
While (I <> ColIndex) 
            J = Right(I) 
            
Do 
While J <> I 
                Up(Down(J)) = J 
                Down(Up(J)) = J 
                
Count(Col(J)) += 1 
                J = Right(J) 
            
Loop 
            I = Up(I) 
        
Loop 
    
End 
Sub 
End 
Class

这样修改后还有一个好处是,如果Count分量最少的列首元素的Count分量是0的话,那么说明当前无解(说明没有行能覆盖该列首元素所在的列),直接返回False,省掉调用Dance(K+1)的步骤。

 

看看改进的舞蹈链(Improve Dancing Links)算法的效率

 

时间效率

数独一:6.31毫秒

数独二:8.50毫秒

数独三:11.34毫秒

 

空间效率

数独一:题目提供了32个数字,则矩阵一共有32*1+(81-32)*9=473行,每行4个节点,则一共有473*4+324+1=2217个节点。每个节点6个分量,则一共要13302个字节。另程序在每行额外提供2个字节缓存相关信息,每个列要增加Count分量。故一共要13302+473*2+325=14573字节

数独二:题目提供了21个数字,则矩阵一共有21*1+(81-21)*9=561行,每行4个节点,则一共有561*4+324+1=2569个节点。每个节点6个分量,则一共要15414个字节。另程序在每行额外提供2个字节缓存相关信息。每个列要增加Count分量。故一共要15414+561*2+325=16861字节

数独三:题目提供了21个数字,则矩阵一共有21*1+(81-21)*9=561行,每行4个节点,则一共有561*4+324+1=2569个节点。每个节点6个分量,则一共要15414个字节。另程序在每行额外提供2个字节缓存相关信息。每个列要增加Count分量。故一共要15414+561*2+325=16861字节

 

以上的分析,改进的舞蹈链(Improve Dancing Lonks)算法在空间效率上还是完败。但是时间效率上从看,在低难度的数独问题上,虽然和暴力破解法还是有差距,但是差距比没有优化前要小了很多;在高难度的数度问题上,时间效率比暴力破解法要高。

 

 

舞蹈链(Dancing Links)算法针对数独问题还能再优化。我们来看看第二个优化的方向

 

在求解精确覆盖问题中,返回的答案实际上是行的集合,集合的一个特性是无序性。也就意味着,如果答案是唯一的话,改变行在矩阵中的顺序,不影响最后答案的输出,无论这行换到什么位置,最后的答案始终包含着这行(如果答案不是唯一的,也没啥太大的影响)。也就是说,行的顺序不影响最终答案的求解。

 

我们就从这个方向入手

在构造矩阵的时候,先遍历数独的格子,先把有数字的格子转换为行,插入到矩阵中。很显然,这些行一定会被选中(想想看么,原问题中(4,2)填的是7,如果该行没选中,结果出现了(4,2)填的是9,那不是一件很搞笑的事么)。

 

由于是精确覆盖问题,每列只能有1个1,而上面的插入的几行一定会被选中。那么,在接下来插入的行如果和上面的行相冲的话(两个行有相同的列有1),那么,后插入的行是个无效的行(肯定不会被选中)。这些无效的行插入到矩阵中,虽然不会影响最终的结果,但是肯定影响求解的效率(空间和时间都有所损耗),而这样的无效行其实有不少。

 

我们要采用特殊的手法,来避免这些无效的行插入到矩阵中。分两步走

1、先遍历数独的格子,把那些有数字的格子转换为行,插入到矩阵中。在插入的同时,把包含1的列的列首元素的Count分量设置为-1(起到后面判别的作用)。

由于这些行一定能被选中,是答案的一部分,那么把这些行的行号置入到答案列表中,并把这些列的列首元素从水平双向链中移除(手动移除比调用RemoveCol方法快)

2、在遍历没有数字的格子,转换为若干行(1个格子9行)插入到矩阵中。在插入到矩阵的时候,判断包含1的列的列首元素的Count分量。如果是-1,说明新插入的行和第1步中的某些行相冲,是个无效行,没有必要插入到矩阵中;如果不是-1,说明是个有效行,插入到矩阵中。

经过这个优化,能大大减少矩阵的规模(列不变,行减少了不少),我们称之为数独的舞蹈链(Sudoku Dancing Links)算法

 

  
Public 
Class 
clsSudokuDLXBySudoku 
    
Implements 
I_Sudoku 
    
Private _Dance 
As 
clsDancingLinksSudoku 
    
Private _Num(80) 
As 
Integer 
    
Public 
Sub 
New() 
        Init() 
    
End 
Sub 
    
Public 
Function SetLine(Row 
As 
Integer
ParamArray Value() 
As 
Integer
As 
Boolean 
Implements 
I_Sudoku.SetLine 
        
Dim I 
As 
Integer 
        
For I = 0 
To IIf(Value.Length < 10, Value.Length - 1, 8) 
            _Num(Row * 9 - 9 + I) = Value(I) 
        
Next 
        
Return 
True 
    
End 
Function 
    
Public 
Function Calculate() 
As 
String 
Implements 
I_Sudoku.Calculate 
        
Dim I 
As 
Integer, J 
As 
Integer 
        
Dim X 
As 
Integer, Y 
As 
Integer 
        
Dim Index 
As 
New 
List(
Of 
Integer), Value 
As 
New 
List(
Of 
Integer
        
Dim C1 
As 
Integer, C2 
As 
Integer, C3 
As 
Integer, C4 
As 
Integer 
        
For I = 0 
To 80 
            X = Int(I / 9) 
            Y = I 
Mod 9 
            
If _Num(I) > 0 
Then 
                C1 = X * 9 + Y + 1 
                C2 = X * 9 + _Num(I) + 81 
                C3 = Y * 9 + _Num(I) + 162 
                C4 = (Int(X / 3) * 3 + Int(Y / 3)) * 9 + _Num(I) + 243 
                _Dance.AppendLineByIndex(C1, C2, C3, C4) 
                Index.Add(I) 
                Value.Add(_Num(I)) 
            
End 
If 
        
Next 
        _Dance.CompleteInsertMustSelectRow() 
        
For I = 0 
To 80 
            X = Int(I / 9) 
            Y = I 
Mod 9 
            
If _Num(I) = 0 
Then 
                C1 = X * 9 + Y + 1 
                C2 = X * 9 + 1 + 81 
                C3 = Y * 9 + 1 + 162 
                C4 = (Int(X / 3) * 3 + Int(Y / 3)) * 9 + 1 + 243 
                
If _Dance.AppendLineByIndex(C1, C2, C3, C4) = 
True 
Then 
                    Index.Add(I) 
                    Value.Add(1) 
                
End 
If 
                
For J = 2 
To 9 
                    
If _Dance.AppendLineByIndex(C1, C2 + J - 1, C3 + J - 1, C4 + J - 1) = 
True 
Then 
                        Index.Add(I) 
                        Value.Add(J) 
                    
End 
If 
                
Next 
            
End 
If 
        
Next 
        
Dim P() 
As 
Integer = _Dance.Dance 
        
For I = 0 
To 80 
            _Num(Index.Item(P(I) - 1)) = Value.Item(P(I) - 1) 
        
Next 
        
Dim V 
As 
String = 
"" 
        
For I = 0 
To 80 
            V = V & _Num(I) & 
"  " 
            
If I 
Mod 9 = 8 
Then V &= vbNewLine 
        
Next 
        
Return V 
    
End 
Function 
    
Public 
Sub Init() 
Implements 
I_Sudoku.Init 
        _Dance = 
New 
clsDancingLinksSudoku(324) 
        
Dim I 
As 
Integer 
        
For I = 0 
To 80 
            _Num(I) = 0 
        
Next 
    
End 
Sub 
End 
Class 
Public 
Class 
clsDancingLinksSudoku 
    
Private Left() 
As 
Integer, Right() 
As 
Integer, Up() 
As 
Integer, Down() 
As 
Integer 
    
Private Row() 
As 
Integer, Col() 
As 
Integer 
    
Private _Head 
As 
Integer 
    
Private _Rows 
As 
Integer, _Cols 
As 
Integer, _NodeCount 
As 
Integer 
    
Private Count() 
As 
Integer 
    
Private Ans() 
As 
Integer 
    
Private _HadInsertMustSelectRow 
As 
Integer 
    
Public 
Sub 
New(
ByVal Cols 
As 
Integer
        
ReDim Left(Cols), Right(Cols), Up(Cols), Down(Cols), Row(Cols), Col(Cols), Ans(Cols) 
        
ReDim Count(Cols) 
        
Dim I 
As 
Integer 
        Up(0) = 0 
        Down(0) = 0 
        Right(0) = 1 
        Left(0) = Cols 
        
For I = 1 
To Cols 
            Up(I) = I 
            Down(I) = I 
            Left(I) = I - 1 
            Right(I) = I + 1 
            Col(I) = I 
            Row(I) = 0 
            Count(I) = 0 
        
Next 
        Right(Cols) = 0 
        _Rows = 0 
        _Cols = Cols 
        _NodeCount = Cols 
        _Head = 0 
        _HadInsertMustSelectRow = 0 
    
End 
Sub 
    
Public 
Function AppendLine(
ByVal 
ParamArray Value() 
As 
Integer
As 
Boolean 
        
Dim V 
As 
New 
List(
Of 
Integer
        
Dim I 
As 
Integer 
        
For I = 0 
To Value.Length - 1 
            
If Value(I) = 1 
Then V.Add(I + 1) 
        
Next 
        
Return AppendLineByIndex(V.ToArray) 
    
End 
Function 
    
Public 
Function AppendLineByIndex(
ByVal 
ParamArray Index() 
As 
Integer
As 
Boolean 
        
Dim I 
As 
Integer, K 
As 
Integer = 0 
        
If _HadInsertMustSelectRow > 0 
Then 
            
If Index.Length = 0 
Then 
                _Rows += 1 
                
Return 
True 
            
Else 
                
For I = 0 
To Index.Length - 1 
                    
If Count(Index(I)) = -1 
Then 
Return 
False 
                
Next 
            
End 
If 
        
Else 
            
If Index.Length = 0 
Then 
Return 
False 
        
End 
If 
        _Rows += 1 
        
ReDim 
Preserve Left(_NodeCount + Index.Length) 
        
ReDim 
Preserve Right(_NodeCount + Index.Length) 
        
ReDim 
Preserve Up(_NodeCount + Index.Length) 
        
ReDim 
Preserve Down(_NodeCount + Index.Length) 
        
ReDim 
Preserve Row(_NodeCount + Index.Length) 
        
ReDim 
Preserve Col(_NodeCount + Index.Length) 
        
ReDim 
Preserve Ans(_NodeCount + Index.Length) 
        
For I = 0 
To Index.Length - 1 
            _NodeCount += 1 
            
If I = 0 
Then 
                Left(_NodeCount) = _NodeCount 
                Right(_NodeCount) = _NodeCount 
            
Else 
                Left(_NodeCount) = _NodeCount - 1 
                Right(_NodeCount) = Right(_NodeCount - 1) 
                Left(Right(_NodeCount - 1)) = _NodeCount 
                Right(_NodeCount - 1) = _NodeCount 
            
End 
If 
            Down(_NodeCount) = Index(I) 
            Up(_NodeCount) = Up(Index(I)) 
            Down(Up(Index(I))) = _NodeCount 
            Up(Index(I)) = _NodeCount 
            Row(_NodeCount) = _Rows 
            Col(_NodeCount) = Index(I) 
            
If _HadInsertMustSelectRow > 0 
Then 
                Count(Index(I)) += 1 
            
Else 
                Count(Index(I)) = -1 
            
End 
If 
        
Next 
        
Return 
True 
    
End 
Function 
    
Public 
Sub CompleteInsertMustSelectRow() 
        
Dim I 
As 
Integer 
        
For I = 1 
To _Cols 
            
If Count(I) = -1 
Then 
                Left(Right(I)) = Left(I) 
                Right(Left(I)) = Right(I) 
            
End 
If 
        
Next 
        
For I = 1 
To _Rows 
            Ans(I - 1) = I 
        
Next 
        _HadInsertMustSelectRow = _Rows 
    
End 
Sub 
    
Public 
Function Dance() 
As 
Integer() 
        
Return IIf(Dance(_HadInsertMustSelectRow) = 
True, Ans, 
Nothing
    
End 
Function 
    
Private 
Function Dance(
ByVal K 
As 
Integer
As 
Boolean 
        
If (Right(_Head) = _Head) 
Then 
            
ReDim 
Preserve Ans(K - 1) 
            
Return 
True 
        
End 
If 
        
Dim P 
As 
Integer, C1 
As 
Integer 
        P = Right(_Head) 
        C1 = P 
        
Do 
While P <> _Head 
            
If Count(P) < Count(C1) 
Then C1 = P 
            P = Right(P) 
        
Loop 
        
If Count(C1) < 1 
Then 
Return 
False 
        RemoveCol(C1) 
        
Dim I 
As 
Integer, J 
As 
Integer 
        I = Down(C1) 
        
Do 
While I <> C1 
            Ans(K) = Row(I) 
            J = Right(I) 
            
Do 
While J <> I 
                RemoveCol(Col(J)) 
                J = Right(J) 
            
Loop 
            
If Dance(K + 1) 
Then 
Return 
True 
            J = Left(I) 
            
Do 
While J <> I 
                ResumeCol(Col(J)) 
                J = Left(J) 
            
Loop 
            I = Down(I) 
        
Loop 
        ResumeCol(C1) 
        
Return 
False 
    
End 
Function 
    
Public 
Sub RemoveCol(
ByVal ColIndex 
As 
Integer
        Left(Right(ColIndex)) = Left(ColIndex) 
        Right(Left(ColIndex)) = Right(ColIndex) 
        
Dim I 
As 
Integer, J 
As 
Integer 
        I = Down(ColIndex) 
        
Do 
While I <> ColIndex 
            J = Right(I) 
            
Do 
While J <> I 
                Up(Down(J)) = Up(J) 
                Down(Up(J)) = Down(J) 
                Count(Col(J)) -= 1 
                J = Right(J) 
            
Loop 
            I = Down(I) 
        
Loop 
    
End 
Sub 
    
Public 
Sub ResumeCol(
ByVal ColIndex 
As 
Integer
        Left(Right(ColIndex)) = ColIndex 
        Right(Left(ColIndex)) = ColIndex 
        
Dim I 
As 
Integer, J 
As 
Integer 
        I = Up(ColIndex) 
        
Do 
While (I <> ColIndex) 
            J = Right(I) 
            
Do 
While J <> I 
                Up(Down(J)) = J 
                Down(Up(J)) = J 
                Count(Col(J)) += 1 
                J = Right(J) 
            
Loop 
            I = Up(I) 
        
Loop 
    
End 
Sub 
End 
Class

通过_HadInsertMustSelectRow来决定插入行的数据。如果_HadInsertMustSelectRow=0说明当前插入行为必选行,设置Count(J)的值为-1。如果_HadInsertMustSelectRow>0说明当前行为可选行,判断和之前的必选行是否有冲突,如果有,说明本行必不可选,不比再插入到矩阵里了。通过CompleteInsertMustSelectRow方法来修改_HadInsertMustSelectRow参数,来决定行的性质

 

数独的舞蹈链(Sudoku Dancing Links)算法的效率

 

时间效率

数独一:1.31毫秒

数独二:2.81毫秒

数独三:5.56毫秒

 

空间效率

数独一:矩阵一共有164行,每行4个节点,则一共有164*4+324+1=981个节点。每个节点6个分量,则一共要5886个字节。另程序在每行额外提供2个字节缓存相关信息,每个列要增加Count分量。故一共要5886+164*2+325=6539字节

数独二:矩阵一共有276行,每行4个节点,则一共有276*4+324+1=1429个节点。每个节点6个分量,则一共要8574个字节。另程序在每行额外提供2个字节缓存相关信息。每个列要增加Count分量。故一共要8574+276*2+325=9451字节

数独三:矩阵一共有275行,每行4个节点,则一共有275*4+324+1=1425个节点。每个节点6个分量,则一共要8550个字节。另程序在每行额外提供2个字节缓存相关信息。每个列要增加Count分量。故一共要8550+275*2+325=9425字节

 

可以看出,数独的舞蹈链(Sudoku Dancing Links)算法改进的舞蹈链算法(Improve Dancing Links)算法,无论是时间效率上还是空间效率上都有了很大的改进。但是和暴力破解法相比,在简单的数独问题上,时间和空间都不占优势,在高难度的数独问题上,数独的舞蹈链算法还是在时间上占有一点优势的。这还是说明了一点,舞蹈链(Dancing Links)算法本质上也是暴力破解法,只是利用巧妙的数据结构实现了高效的缓存和回溯。

 

以上是我对用舞蹈链(Dancing Links)算法求解数独问题的分析,经过两次优化后,数独的舞蹈链(Sudoku Dancing Links)算法已经达到比较好的效果。但能不能再优化呢?能优化到全面超越暴力破解法?目前我没有看出其他的优化方向,如有,望网友不吝赐教,大家共同进步。

 

最后,给出三个数独的解

数独一:

 

数独二:

 

数独三:

    本文转自万仓一黍博客园博客,原文链接:http://www.cnblogs.com/grenet/p/3163550.html,如需转载请自行联系原作者

你可能感兴趣的文章
【Demo】 生成二维码 和 条形码
查看>>
在update语句中使用子查询
查看>>
win8.1 开机慢 快速解决
查看>>
对vi编辑器的总结
查看>>
ssl信息和如何在openssl自建一个CA服务器
查看>>
lamp环境搭建mysql5.1+httd2.2+php5.3
查看>>
form 表单,点击按钮,自动刷新提交的bug
查看>>
Elephantbird介绍
查看>>
黑马程序员-IO流读取文件中的内容
查看>>
将shiro作为插件整合到jfinal,在jfinal里读取shiro的注解
查看>>
文件系统管理
查看>>
使用sar进行性能分析
查看>>
Android特效源码分享,看了你就赚啦!
查看>>
Android手机模拟器旋转快捷键
查看>>
Linux 修改IP地址
查看>>
shell
查看>>
如何使用Office Deployment Tool离线安装office 365
查看>>
Linux常用指令
查看>>
重发布、路由策略、PBR策略路由、路径优选
查看>>
SVN使用
查看>>