机器学习之神经网络介绍

神经网络可以用来解决特征特别多的机器学习问题,普通的解决方法在这儿显得无能为力,主要是特征向量太多的时候就会出现无数种特征向量的组合产生假设函数的无数项,这对于计算来说不现实。

表示

  1. 层: 输入层、隐藏层、输出层
  2. 仍然使用sigmoid函数
    3.
    基本形式

    • aij: 第j层的第i个元素
    • Θ(j): j层到j+1层的权重映射矩阵

      如果网络在j层有sj个单元,j+1层有sj+1个单元,那么Θ(j)的维度为sj+1×(sj+1)

  3. 向量化
    对于中间层的计算,我们可以定义Z使得
    变形为
    进行向量化之后

    也就是说