简单神经网络

概述

简单神经网络是深度学习的基础，通常指包含一个或少数几个隐藏层的前馈神经网络，是理解复杂神经网络架构的起点。

主要特点

前馈结构：信息从输入层单向流向输出层
全连接：相邻层的神经元全部连接
非线性激活：使用激活函数引入非线性

基本结构

1. 输入层 (Input Layer)

接收原始特征数据
节点数量等于特征维度

2. 隐藏层 (Hidden Layer)

提取数据特征
可以有多个隐藏层
节点数量影响模型容量

3. 输出层 (Output Layer)

产生最终预测结果
节点数量取决于任务类型

激活函数

常用激活函数

Sigmoid：将输出映射到(0,1)区间
Tanh：将输出映射到(-1,1)区间
ReLU：修正线性单元，max(0,x)

训练过程

1. 前向传播

计算各层输出
得到预测结果

2. 计算损失

使用损失函数衡量预测误差
常用均方误差、交叉熵等

3. 反向传播

计算梯度
更新权重和偏置

应用领域

分类问题
回归问题
模式识别
函数逼近

GitHub