Neural network基础架构

Nertal network（NN）的概念其实很早就发明出来了，但直到1986年backpropagation应用在NN做出很好的结果之後才开始被大家重视，今天就来讲一下NN的基本架构：

基本来说NN主要会有三层架构：input, hidden layer, output。input也就是我们放入的训练资料，以上图来说资料有四个features(predictors)，hidden layer是整个NN的核心，我们可以自由决定要有多少层hidden layer以及每一层要有几个nodes，以上图来说我们只有一层hidden layer，之中有三个nodes(h[0],h[1],h[2])，最後的output就是我们的预测值（y hat）。

在每一个hidden layer里都会包含linear和non-linear的方程序（你可以把它想像成一个三明治，间单只看一个结的的话就会长的如下左图：

z的部分就是linear，而sigma则是non-linear。wT是transpose，可以把它当成简写就好，全部展开就是z= w1x1 + w2x2 + w3x3 + b;non-linear又称为active function所以很常简写为a，在非线性的部分我们可以有很多选择，像是tahn, sigmoid, Relu, leaky Relu，可以发现如果选择sigmoid的话每个node就会是一个logistic regression～