Loss function的收敛情况如下:
得到的权重W是一个 785x10 的矩阵,其中10表示有10个不同的类别。
单独拿出其中某一行矩阵,拿掉最后一列bias,是一个784维的向量\(w_c\),即是对应于该行数字的预测权重。
这个权重在机器视觉上有何种意义呢?
下面变一个小魔术,如果你还记得我们的MNIST数据中的单个训练数据\(x_i\),是将一张28x28的数字图片,转换成一个784维的向量得到的。于是我们这里反过来把784维的\(w_c\)转换成28x28的图片,得到了以下的10张图片:
分别对应0~9这10个数字,从中依稀可以辨别出来。所以,这里分类字符的原理,其实可以看作是模板匹配(template matching),训练过程是为了从训练集中综合出最合适的数字模板。
时段 | 个数 |
---|---|
{{f.startingTime}}点 - {{f.endTime}}点 | {{f.fileCount}} |