神经网络入门

神经网络入门

我: 老师,用数据集去训练模型是为了去估算权重和阈值,是这样的吗?

老师: 对,权重和阈值就是网络参数。把参数用训练数据求解出来,然后对新数据进行处理和预测。

我: 我们需要做的是什么呢? 选择一个合适的神经网络模型吗?

老师: 设计网络结构,构造训练数据,拿数据训练网络,即求解参数,最后拿训练好的网络处理新的数据。

感知器(perceptron)

接收多个输入产生一个输出 # 权重与阈值(weight and threshold)

  • 每个决定输出的因素都带有权重(weight),代表它们的重要性。
  • 当各种决定输出因素的权重(weight)之和大于阈值(threshold)时输出为真, 否则输出为假。

决策模型

  • 底层感知器接收外部输入,作出判断之后,再发出信号,作为上层感知器的输入。
  • RNN(Recurrent Neural Network) 递归神经网络(信号发生循环传递)

矢量化

  • 外部因素x1, x2, x3 写成矢量<x1, x3, x3>, 简写为 x
  • 权重w1, w2, w3 写成矢量(w1, w2, w3), 简写为 w
  • 定义b等于负的阈值, b = -threshold

感知器模型的数学表达如下:

搭建神经网络的三个条件

  • 输入和输出
  • 权重(w)和阈值的相反数(b)
  • 多层感知器结构

模型的训练

通过试错法,不断尝试对w和b的值进行微小变动, 直到得到对应最精确输出的那组 w 和 b, 这个过程称为模型的训练。

输出的连续性

1
2
z = wx + b //感知器的计算结果
σ(z) = 1 / (1 + e^(-z)) //将结果变成sigmoid function化
  • σ(z) → 1 感知器强烈匹配
  • σ(z) → 0 感知器强烈不匹配

参考链接

http://www.ruanyifeng.com/blog/2017/07/neural-network.html