神经网络 - 标签 - 子非鱼的技术博客

机器学习基础（四）自然语言处理

子非鱼 — Wed, 26 Feb 2025 10:47:26 +0800

通过 one-hot 编码来表示单词有两个缺陷：

所以基于此提出了词嵌入技术。将一个维数为所有词的数量的高维空间（one-hot 形式表示的词）“嵌入”到一个维数低得多的连续向量空间中，每个单词或词组被映射为实数域上的向量

word2vec 是训练词嵌入的训练方法，其输入为 one-hot 编码，通过一个隐藏层输出单词（CBOW）或者上下文（Skip-gram）的one-hot 编码。其模型结构为 y=softmax(wx+b)

子非鱼 — Sun, 26 Jan 2025 14:15:43 +0800

对于序列数据（文本，语音等），使用标准神经网络存在以下问题：

a表示第n时间步最后一层隐藏层的输出，同时也是n+1时间步输入的一部分

y-hat表示第n时间步的输出（通过与a全连接得到）

子非鱼 — Mon, 20 Jan 2025 10:19:16 +0800

竖向堆叠起来的输入特征被称作神经网络的输入层（the input layer）。

神经网络的隐藏层（a hidden layer）。“隐藏”的含义是在训练集中，这些中间节点的真正数值是无法看到的。

输出层（the output layer）负责输出预测值。