<rss xmlns:atom="http://www.w3.org/2005/Atom" version="2.0">
    <channel>
        <title>神经网络 - 标签 - 子非鱼的技术博客</title>
        <link>http://localhost:1313/tags/%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C/</link>
        <description>神经网络 - 标签 - 子非鱼的技术博客</description>
        <generator>Hugo -- gohugo.io</generator><language>zh-cn</language><lastBuildDate>Wed, 26 Feb 2025 10:47:26 &#43;0800</lastBuildDate><atom:link href="http://localhost:1313/tags/%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C/" rel="self" type="application/rss+xml" /><item>
    <title>机器学习基础（四）自然语言处理</title>
    <link>http://localhost:1313/posts/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E5%9F%BA%E7%A1%80%E5%9B%9B%E8%87%AA%E7%84%B6%E8%AF%AD%E8%A8%80%E5%A4%84%E7%90%86/</link>
    <pubDate>Wed, 26 Feb 2025 10:47:26 &#43;0800</pubDate>
    <author>子非鱼</author>
    <guid>http://localhost:1313/posts/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E5%9F%BA%E7%A1%80%E5%9B%9B%E8%87%AA%E7%84%B6%E8%AF%AD%E8%A8%80%E5%A4%84%E7%90%86/</guid>
    <description><![CDATA[<h2 id="词嵌入word-embedding">词嵌入（word embedding）</h2>
<p>通过 <strong>one-hot 编码</strong>来表示单词有两个缺陷：</p>
<ol>
<li><strong>词维度过高</strong>，使得模型更加复杂，训练成本高</li>
<li><strong>词与词之间无法表示关联</strong>（其余弦相似度为0）</li>
</ol>
<p>所以基于此提出了词嵌入技术。将一个维数为所有词的数量的高维空间（one-hot 形式表示的词）“嵌入”到一个维数低得多的连续向量空间中，每个单词或词组被映射为实数域上的向量</p>
<h2 id="word2vec词嵌入的训练方法">word2vec（词嵌入的训练方法）</h2>
<p>word2vec 是训练词嵌入的训练方法，其<strong>输入为 one-hot 编码</strong>，通过一个隐藏层输出单词（CBOW）或者上下文（Skip-gram）的<strong>one-hot 编码</strong>。其模型结构为 y=softmax(wx+b)</p>]]></description>
</item>
<item>
    <title>机器学习基础（三）循环神经网络</title>
    <link>http://localhost:1313/posts/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E5%9F%BA%E7%A1%80%E4%B8%89%E5%BE%AA%E7%8E%AF%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C/</link>
    <pubDate>Sun, 26 Jan 2025 14:15:43 &#43;0800</pubDate>
    <author>子非鱼</author>
    <guid>http://localhost:1313/posts/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E5%9F%BA%E7%A1%80%E4%B8%89%E5%BE%AA%E7%8E%AF%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C/</guid>
    <description><![CDATA[<h2 id="背景标准神经网络的局限">背景（标准神经网络的局限）</h2>
<p>对于<strong>序列数据（文本，语音等）</strong>，使用标准神经网络存在以下问题：</p>
<ul>
<li>对于不同的示例，<strong>输入和输出可能有不同的长度</strong>，因此输入层和输出层的神经元数量无法固定</li>
<li>从输入文本的<strong>不同位置学到的同一特征无法共享</strong></li>
<li>模型中的<strong>参数太多</strong>，计算量太大（如果用基于词汇表的one-hot编码）</li>
</ul>
<h2 id="rnn循环神经网络">RNN（循环神经网络）</h2>
<h3 id="网络结构">网络结构</h3>
<p>a&lt;n&gt;表示第n时间步最后一层隐藏层的输出，同时也是n+1时间步输入的一部分</p>
<p>y-hat&lt;n&gt;表示第n时间步的输出（通过与a&lt;n&gt;全连接得到）</p>]]></description>
</item>
<item>
    <title>机器学习基础（二）神经网络</title>
    <link>http://localhost:1313/posts/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E5%9F%BA%E7%A1%80%E4%BA%8C%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C/</link>
    <pubDate>Mon, 20 Jan 2025 10:19:16 &#43;0800</pubDate>
    <author>子非鱼</author>
    <guid>http://localhost:1313/posts/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E5%9F%BA%E7%A1%80%E4%BA%8C%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C/</guid>
    <description><![CDATA[<h2 id="基础">基础</h2>
<p>竖向堆叠起来的输入特征被称作神经网络的<strong>输入层（the input layer）</strong>。</p>
<p>神经网络的<strong>隐藏层（a hidden layer）</strong>。“隐藏”的含义是<strong>在训练集中</strong>，这些中间节点的真正数值是无法看到的。</p>
<p><strong>输出层（the output layer）</strong>负责输出预测值。</p>]]></description>
</item>
</channel>
</rss>
