移位距离假设
(A,B)---m*n*k---(1,0)(0,1)
用神经网络分类A和B,把参与分类的A和B中的数字看作是组成A和B的粒子,分类的过程就是让A和B中的粒子互相交换位置,寻找最短移位路径的过程。而熵H与最短移位距离S成正比,迭代次数n与S成反比。
移位规则汇总
移位距离就是等位点数值差的绝对值的和S=Σ|a-b|
如对一组3*3的矩阵
S=s0+s1+,…,+s8=|a0-b0|+|a1-b1|+,…,+|a8-b8|
(AB , C )---m*n*k---(1,0)(0,1)
如果一个训练集里有两张图片,一个训练集里只有1张图片。这个网络的迭代次数依然符合移位假设吗?
(AB , C )---2*4*2---(1,0)(0,1)
做一个网络来分类AB和C,让A是(0, 1),B为(1, 1),C是(0, 1).网络结构是2*4*2.输入只有2个节点。首先让A和C迭代,再让B和C迭代,不断重复直到收敛。在收敛误差一致的情况下统计迭代次数。这个网络简记为01*11*01。
共进行10组实验
01*11*01 |
01*10*11 |
01*11*11 |
10*11*11 |
01*10*01 |
01*10*10 |
01*01*11 |
11*11*01 |
01*01*10 |
01*11*10 |
得到的迭代次数为
δ |
0.01 |
0.001 |
9.00E-04 |
8.00E-04 |
7.00E-04 |
|
01*11*01 |
迭代次数n |
9032.397 |
90425.22 |
101844 |
116066.1 |
135622.8 |
01*10*11 |
迭代次数n |
13090.89 |
86782.35 |
95818.05 |
105586.1 |
122018.8 |
01*11*11 |
迭代次数n |
8406.095 |
69204.37 |
75918.46 |
87127.38 |
99695.94 |
10*11*11 |
迭代次数n |
8452.266 |
69044.21 |
77609.65 |
85774.66 |
98321.27 |
01*10*01 |
迭代次数n |
6562.407 |
49626.37 |
53976.52 |
62830.33 |
70601 |
01*10*10 |
迭代次数n |
6598.779 |
49677.57 |
55886.44 |
61773.39 |
69684.19 |
01*01*11 |
迭代次数n |
4492.035 |
26777.36 |
29753.34 |
32949.8 |
37123.12 |
11*11*01 |
迭代次数n |
4503.588 |
27240.86 |
29794.58 |
33117.16 |
36974.64 |
01*01*10 |
迭代次数n |
3456.523 |
22841.7 |
25195.83 |
28372.41 |
31827.38 |
01*11*10 |
迭代次数n |
2946.296 |
16381.41 |
16983.82 |
19169.93 |
22057.13 |
其中01*11*01的迭代次数最大,当收敛误差为7e-4时为135622.8,而01*11*10的迭代次数最小为22057,几乎只有01*11*01的1/6.
01*11*11 |
迭代次数n |
8406.095 |
69204.37 |
75918.46 |
87127.38 |
99695.94 |
10*11*11 |
迭代次数n |
8452.266 |
69044.21 |
77609.65 |
85774.66 |
98321.27 |
其中01*11*11和10*11*11的迭代次数是相同的,体现的这两组训练集内在结构的对称性。
统计移位距离,比如第一组01*11*01.这个网络的进样顺序是(0,1),(0,1)和(1,1),(0,1).按照移位假设(0,1),(0,1)这组等位点数值差的绝对值的和为0,因此移位距离为0。(1,1),(0,1)这组的移位距离S=|1-0|=1.因此01*11*01的移位距离为S=0+1=1
.
因为这次只有3张图片,为了方便得到的数据和多张图片的网络数据相互比较,统计移位距离的平均值S=S/2=0.5
.
同样的办法01*01*11的移位距离就是1.因为(0,1),(1,1)的移位距离是1因此总的移位距离S=(1+1)/2=1.
而01*01*10的移位距离就是2.因为(0,1)(1,0)的移位距离S=|1-0|+|0-1|=2.因此总的移位距离S=(2+2)/2=2.
比较01*01*11和01*01*10,对这两组因为A和B是相同的,因此就相当于分类单张图片A:01 ,C:11和A:01,C:10
S |
δ |
0.01 |
0.001 |
9.00E-04 |
8.00E-04 |
7.00E-04 |
|
1 |
01*01*11 |
迭代次数n |
4492.035 |
26777.36 |
29753.34 |
32949.8 |
37123.12 |
2 |
01*01*10 |
迭代次数n |
3456.523 |
22841.7 |
25195.83 |
28372.41 |
31827.38 |
观察这两组数据,迭代次数和移位距离的反比关系明显。
用同样的办法统计其余各组的移位距离
S平均 |
S |
δ |
0.01 |
0.001 |
9.00E-04 |
8.00E-04 |
7.00E-04 |
|||
0.5 |
2 |
1 |
17 |
01*11*01 |
迭代次数n |
9032.397 |
90425.22 |
101844 |
116066.1 |
135622.8 |
1 |
2 |
2 |
16 |
01*10*11 |
迭代次数n |
13090.89 |
86782.35 |
95818.05 |
105586.1 |
122018.8 |
0.5 |
2 |
1 |
19 |
01*11*11 |
迭代次数n |
8406.095 |
69204.37 |
75918.46 |
87127.38 |
99695.94 |
0.5 |
2 |
1 |
19 |
10*11*11 |
迭代次数n |
8452.266 |
69044.21 |
77609.65 |
85774.66 |
98321.27 |
1 |
2 |
2 |
14 |
01*10*01 |
迭代次数n |
6562.407 |
49626.37 |
53976.52 |
62830.33 |
70601 |
1 |
2 |
2 |
13 |
01*10*10 |
迭代次数n |
6598.779 |
49677.57 |
55886.44 |
61773.39 |
69684.19 |
1 |
2 |
2 |
11 |
01*01*11 |
迭代次数n |
4492.035 |
26777.36 |
29753.34 |
32949.8 |
37123.12 |
1 |
2 |
2 |
21 |
11*11*01 |
迭代次数n |
4503.588 |
27240.86 |
29794.58 |
33117.16 |
36974.64 |
2 |
2 |
4 |
10 |
01*01*10 |
迭代次数n |
3456.523 |
22841.7 |
25195.83 |
28372.41 |
31827.38 |
1.5 |
2 |
3 |
18 |
01*11*10 |
迭代次数n |
2946.296 |
16381.41 |
16983.82 |
19169.93 |
22057.13 |
因为由于对称关系01*11*11=10*11*11 ,01*10*01=01*10*10,01*01*11=11*11*01,因此不重复的数据只有7组
S平均 |
S |
δ |
0.01 |
0.001 |
9.00E-04 |
8.00E-04 |
7.00E-04 |
|||
0.5 |
2 |
1 |
17 |
01*11*01 |
迭代次数n |
9032.397 |
90425.22 |
101844 |
116066.1 |
135622.8 |
1 |
2 |
2 |
16 |
01*10*11 |
迭代次数n |
13090.89 |
86782.35 |
95818.05 |
105586.1 |
122018.8 |
0.5 |
2 |
1 |
19 |
01*11*11 |
迭代次数n |
8406.095 |
69204.37 |
75918.46 |
87127.38 |
99695.94 |
1 |
2 |
2 |
14 |
01*10*01 |
迭代次数n |
6562.407 |
49626.37 |
53976.52 |
62830.33 |
70601 |
1 |
2 |
2 |
11 |
01*01*11 |
迭代次数n |
4492.035 |
26777.36 |
29753.34 |
32949.8 |
37123.12 |
2 |
2 |
4 |
10 |
01*01*10 |
迭代次数n |
3456.523 |
22841.7 |
25195.83 |
28372.41 |
31827.38 |
1.5 |
2 |
3 |
18 |
01*11*10 |
迭代次数n |
2946.296 |
16381.41 |
16983.82 |
19169.93 |
22057.13 |
观察平均移位距离S的曲线和当收敛误差为7e-4时的迭代次数曲线,个别数据的判断上确实会有问题,但如果将这些问题理解为观测误差,这条平均移位距离曲线仍然总体的反映了迭代次和移位距离之间的反比关系,对多数数据之间的大小关系判断仍然会给出正确的结果。