<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="en">
	<id>https://marovi.ai/index.php?action=history&amp;feed=atom&amp;title=Neural_Networks%2Fzh</id>
	<title>Neural Networks/zh - Revision history</title>
	<link rel="self" type="application/atom+xml" href="https://marovi.ai/index.php?action=history&amp;feed=atom&amp;title=Neural_Networks%2Fzh"/>
	<link rel="alternate" type="text/html" href="https://marovi.ai/index.php?title=Neural_Networks/zh&amp;action=history"/>
	<updated>2026-04-24T13:01:39Z</updated>
	<subtitle>Revision history for this page on the wiki</subtitle>
	<generator>MediaWiki 1.39.1</generator>
	<entry>
		<id>https://marovi.ai/index.php?title=Neural_Networks/zh&amp;diff=2167&amp;oldid=prev</id>
		<title>DeployBot: [deploy-bot] Deploy from CI (8c92aeb)</title>
		<link rel="alternate" type="text/html" href="https://marovi.ai/index.php?title=Neural_Networks/zh&amp;diff=2167&amp;oldid=prev"/>
		<updated>2026-04-24T07:09:02Z</updated>

		<summary type="html">&lt;p&gt;[deploy-bot] Deploy from CI (8c92aeb)&lt;/p&gt;
&lt;table style=&quot;background-color: #fff; color: #202122;&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;en&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;← Older revision&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;Revision as of 07:09, 24 April 2026&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l111&quot;&gt;Line 111:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Line 111:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;[[Category:Introductory]]&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;[[Category:Introductory]]&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;[[Category:Neural Networks]]&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;[[Category:Neural Networks]]&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;del style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;&amp;lt;!--v1.2.0 cache-bust--&gt;&lt;/del&gt;&lt;/div&gt;&lt;/td&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-side-added&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;del style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;&amp;lt;!-- pass 2 --&gt;&lt;/del&gt;&lt;/div&gt;&lt;/td&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-side-added&quot;&gt;&lt;/td&gt;&lt;/tr&gt;

&lt;!-- diff cache key mediawiki:diff::1.12:old-2107:rev-2167 --&gt;
&lt;/table&gt;</summary>
		<author><name>DeployBot</name></author>
	</entry>
	<entry>
		<id>https://marovi.ai/index.php?title=Neural_Networks/zh&amp;diff=2107&amp;oldid=prev</id>
		<title>DeployBot: Pass 2 force re-parse</title>
		<link rel="alternate" type="text/html" href="https://marovi.ai/index.php?title=Neural_Networks/zh&amp;diff=2107&amp;oldid=prev"/>
		<updated>2026-04-24T07:01:06Z</updated>

		<summary type="html">&lt;p&gt;Pass 2 force re-parse&lt;/p&gt;
&lt;table style=&quot;background-color: #fff; color: #202122;&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;en&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;← Older revision&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;Revision as of 07:01, 24 April 2026&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l112&quot;&gt;Line 112:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Line 112:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;[[Category:Neural Networks]]&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;[[Category:Neural Networks]]&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&amp;lt;!--v1.2.0 cache-bust--&amp;gt;&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&amp;lt;!--v1.2.0 cache-bust--&amp;gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-side-deleted&quot;&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;&amp;lt;!-- pass 2 --&gt;&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;

&lt;!-- diff cache key mediawiki:diff::1.12:old-2070:rev-2107 --&gt;
&lt;/table&gt;</summary>
		<author><name>DeployBot</name></author>
	</entry>
	<entry>
		<id>https://marovi.ai/index.php?title=Neural_Networks/zh&amp;diff=2070&amp;oldid=prev</id>
		<title>DeployBot: Force re-parse after Math source-mode rollout (v1.2.0)</title>
		<link rel="alternate" type="text/html" href="https://marovi.ai/index.php?title=Neural_Networks/zh&amp;diff=2070&amp;oldid=prev"/>
		<updated>2026-04-24T06:58:28Z</updated>

		<summary type="html">&lt;p&gt;Force re-parse after Math source-mode rollout (v1.2.0)&lt;/p&gt;
&lt;table style=&quot;background-color: #fff; color: #202122;&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;en&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;← Older revision&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;Revision as of 06:58, 24 April 2026&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l111&quot;&gt;Line 111:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Line 111:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;[[Category:Introductory]]&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;[[Category:Introductory]]&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;[[Category:Neural Networks]]&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;[[Category:Neural Networks]]&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-side-deleted&quot;&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;&amp;lt;!--v1.2.0 cache-bust--&gt;&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;

&lt;!-- diff cache key mediawiki:diff::1.12:old-2016:rev-2070 --&gt;
&lt;/table&gt;</summary>
		<author><name>DeployBot</name></author>
	</entry>
	<entry>
		<id>https://marovi.ai/index.php?title=Neural_Networks/zh&amp;diff=2016&amp;oldid=prev</id>
		<title>DeployBot: [deploy-bot] Deploy from CI (775ba6e)</title>
		<link rel="alternate" type="text/html" href="https://marovi.ai/index.php?title=Neural_Networks/zh&amp;diff=2016&amp;oldid=prev"/>
		<updated>2026-04-24T04:01:53Z</updated>

		<summary type="html">&lt;p&gt;[deploy-bot] Deploy from CI (775ba6e)&lt;/p&gt;
&lt;p&gt;&lt;b&gt;New page&lt;/b&gt;&lt;/p&gt;&lt;div&gt;{{LanguageBar | page = Neural Networks}}&lt;br /&gt;
{{ArticleInfobox | topic_area = Deep Learning | difficulty = Introductory | prerequisites = }}&lt;br /&gt;
{{ContentMeta | generated_by = claude-opus | model_used = claude-opus-4-6 | generated_date = 2026-03-13}}&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;神经网络（Neural Networks）&amp;#039;&amp;#039;&amp;#039;（也称为&amp;#039;&amp;#039;&amp;#039;人工神经网络&amp;#039;&amp;#039;&amp;#039;，即ANN）是受生物神经系统结构启发的计算模型。它们由称为&amp;#039;&amp;#039;&amp;#039;神经元（Neuron）&amp;#039;&amp;#039;&amp;#039;（或节点）的简单处理单元组成的互连层构成，是现代深度学习（Deep Learning）的基础。&lt;br /&gt;
&lt;br /&gt;
== 生物学启发 ==&lt;br /&gt;
&lt;br /&gt;
生物神经元通过其&amp;#039;&amp;#039;&amp;#039;树突（Dendrite）&amp;#039;&amp;#039;&amp;#039;接收电信号，在&amp;#039;&amp;#039;&amp;#039;细胞体&amp;#039;&amp;#039;&amp;#039;中进行整合，如果综合信号超过阈值，则沿其&amp;#039;&amp;#039;&amp;#039;轴突（Axon）&amp;#039;&amp;#039;&amp;#039;向下游神经元发送输出信号。人工神经网络对这一过程进行了抽象：每个人工神经元计算其输入的加权和，加上一个偏置项，然后通过一个非线性的&amp;#039;&amp;#039;&amp;#039;激活函数（Activation Function）&amp;#039;&amp;#039;&amp;#039;传递结果。&lt;br /&gt;
&lt;br /&gt;
虽然与生物学的类比激发了早期研究，但现代神经网络最好被理解为灵活的参数化函数逼近器，而非忠实的大脑模拟。&lt;br /&gt;
&lt;br /&gt;
== 感知机 ==&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;感知机（Perceptron）&amp;#039;&amp;#039;&amp;#039;由Frank Rosenblatt于1958年提出，是最简单的神经网络。它计算：&lt;br /&gt;
&lt;br /&gt;
:&amp;lt;math&amp;gt;y = \sigma\!\left(\sum_{i=1}^{n} w_i x_i + b\right) = \sigma(\mathbf{w}^\top \mathbf{x} + b)&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
其中 &amp;lt;math&amp;gt;\mathbf{x}&amp;lt;/math&amp;gt; 是输入向量，&amp;lt;math&amp;gt;\mathbf{w}&amp;lt;/math&amp;gt; 是可学习的权重，&amp;lt;math&amp;gt;b&amp;lt;/math&amp;gt; 是偏置，&amp;lt;math&amp;gt;\sigma&amp;lt;/math&amp;gt; 是一个阶跃函数，当参数为正时输出1，否则输出0。感知机可以学习任何线性可分函数，但众所周知无法表示异或（XOR）函数——这一局限性使神经网络研究停滞了十多年。&lt;br /&gt;
&lt;br /&gt;
== 前馈网络 ==&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;前馈神经网络（Feedforward Neural Network）&amp;#039;&amp;#039;&amp;#039;（也称为&amp;#039;&amp;#039;&amp;#039;多层感知机&amp;#039;&amp;#039;&amp;#039;，即MLP）将多层神经元堆叠在一起。信息单向流动——从&amp;#039;&amp;#039;&amp;#039;输入层&amp;#039;&amp;#039;&amp;#039;经过一个或多个&amp;#039;&amp;#039;&amp;#039;隐藏层（Hidden Layer）&amp;#039;&amp;#039;&amp;#039;到达&amp;#039;&amp;#039;&amp;#039;输出层&amp;#039;&amp;#039;&amp;#039;。&lt;br /&gt;
&lt;br /&gt;
对于具有一个隐藏层的网络，计算过程为：&lt;br /&gt;
&lt;br /&gt;
:&amp;lt;math&amp;gt;\mathbf{h} = g(\mathbf{W}_1 \mathbf{x} + \mathbf{b}_1)&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
:&amp;lt;math&amp;gt;\mathbf{y} = f(\mathbf{W}_2 \mathbf{h} + \mathbf{b}_2)&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
其中 &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; 和 &amp;lt;math&amp;gt;f&amp;lt;/math&amp;gt; 是激活函数，&amp;lt;math&amp;gt;\mathbf{W}_1, \mathbf{W}_2&amp;lt;/math&amp;gt; 是权重矩阵，&amp;lt;math&amp;gt;\mathbf{b}_1, \mathbf{b}_2&amp;lt;/math&amp;gt; 是偏置向量。隐藏层使网络能够学习单个感知机无法捕捉的非线性关系。&lt;br /&gt;
&lt;br /&gt;
具有多个隐藏层的网络称为&amp;#039;&amp;#039;&amp;#039;深度&amp;#039;&amp;#039;&amp;#039;神经网络，训练它们是&amp;#039;&amp;#039;&amp;#039;深度学习&amp;#039;&amp;#039;&amp;#039;的研究主题。&lt;br /&gt;
&lt;br /&gt;
== 激活函数 ==&lt;br /&gt;
&lt;br /&gt;
激活函数引入了非线性；没有它，多层网络将退化为单个线性变换。常见的选择包括：&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! 函数 !! 公式 !! 值域 !! 备注&lt;br /&gt;
|-&lt;br /&gt;
| &amp;#039;&amp;#039;&amp;#039;Sigmoid&amp;#039;&amp;#039;&amp;#039; || &amp;lt;math&amp;gt;\sigma(z) = \frac{1}{1+e^{-z}}&amp;lt;/math&amp;gt; || (0, 1) || 历史上广泛使用；存在梯度消失问题&lt;br /&gt;
|-&lt;br /&gt;
| &amp;#039;&amp;#039;&amp;#039;Tanh&amp;#039;&amp;#039;&amp;#039; || &amp;lt;math&amp;gt;\tanh(z) = \frac{e^z - e^{-z}}{e^z + e^{-z}}&amp;lt;/math&amp;gt; || (−1, 1) || 以零为中心；对于大输入仍会饱和&lt;br /&gt;
|-&lt;br /&gt;
| &amp;#039;&amp;#039;&amp;#039;ReLU&amp;#039;&amp;#039;&amp;#039; || &amp;lt;math&amp;gt;\max(0, z)&amp;lt;/math&amp;gt; || [0, ∞) || 现代网络的默认选择；可能导致&amp;quot;死亡神经元&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
| &amp;#039;&amp;#039;&amp;#039;Leaky ReLU&amp;#039;&amp;#039;&amp;#039; || &amp;lt;math&amp;gt;\max(\alpha z, z)&amp;lt;/math&amp;gt;，其中 &amp;lt;math&amp;gt;\alpha &amp;gt; 0&amp;lt;/math&amp;gt; 较小 || (−∞, ∞) || 解决了死亡神经元问题&lt;br /&gt;
|-&lt;br /&gt;
| &amp;#039;&amp;#039;&amp;#039;Softmax&amp;#039;&amp;#039;&amp;#039; || &amp;lt;math&amp;gt;\frac{e^{z_i}}{\sum_j e^{z_j}}&amp;lt;/math&amp;gt; || (0, 1) || 用于多分类任务的输出层&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
== 万能近似定理 ==&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;万能近似定理（Universal Approximation Theorem）&amp;#039;&amp;#039;&amp;#039;（Cybenko 1989，Hornik 1991）指出，一个包含有限个神经元的单隐藏层前馈网络，在激活函数满足温和条件（例如非常数、有界、连续）的前提下，可以在 &amp;lt;math&amp;gt;\mathbb{R}^n&amp;lt;/math&amp;gt; 的紧子集上以任意精度逼近任何连续函数。&lt;br /&gt;
&lt;br /&gt;
该定理保证了良好近似的&amp;#039;&amp;#039;存在性&amp;#039;&amp;#039;，但没有说明如何&amp;#039;&amp;#039;找到&amp;#039;&amp;#039;它——在实践中，训练具有多层的深度网络比使用单个宽层要有效得多。&lt;br /&gt;
&lt;br /&gt;
== 训练概述 ==&lt;br /&gt;
&lt;br /&gt;
训练神经网络包括以下步骤：&lt;br /&gt;
&lt;br /&gt;
# &amp;#039;&amp;#039;&amp;#039;定义损失函数（Loss Function）&amp;#039;&amp;#039;&amp;#039; — 衡量网络预测与真实目标之间差距的指标（参见[[Loss Functions]]）。&lt;br /&gt;
# &amp;#039;&amp;#039;&amp;#039;前向传播&amp;#039;&amp;#039;&amp;#039; — 逐层传播数值，计算给定输入的网络输出。&lt;br /&gt;
# &amp;#039;&amp;#039;&amp;#039;反向传播（Backpropagation）&amp;#039;&amp;#039;&amp;#039; — 通过在网络中反向应用链式法则，计算损失相对于每个权重的梯度（参见[[Backpropagation]]）。&lt;br /&gt;
# &amp;#039;&amp;#039;&amp;#039;参数更新&amp;#039;&amp;#039;&amp;#039; — 使用[[Gradient Descent|梯度下降]]等优化算法调整权重。&lt;br /&gt;
# &amp;#039;&amp;#039;&amp;#039;迭代&amp;#039;&amp;#039;&amp;#039; — 在训练数据上重复步骤2-4多次遍历（轮次/Epoch）。&lt;br /&gt;
&lt;br /&gt;
成功的训练还需要注意&amp;#039;&amp;#039;&amp;#039;初始化&amp;#039;&amp;#039;&amp;#039;（例如Xavier或He方案）、&amp;#039;&amp;#039;&amp;#039;正则化（Regularization）&amp;#039;&amp;#039;&amp;#039;（以防止[[Overfitting and Regularization|过拟合]]）以及&amp;#039;&amp;#039;&amp;#039;超参数调优&amp;#039;&amp;#039;&amp;#039;（学习率、批量大小、网络架构）。&lt;br /&gt;
&lt;br /&gt;
== 常见架构 ==&lt;br /&gt;
&lt;br /&gt;
除了基本的前馈网络，还发展出了几种专门的架构：&lt;br /&gt;
&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;[[Convolutional Neural Networks|卷积神经网络]]&amp;#039;&amp;#039;&amp;#039;（CNN）— 专为图像等网格结构数据设计，使用局部连接和权重共享。&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;[[Recurrent Neural Networks|循环神经网络]]&amp;#039;&amp;#039;&amp;#039;（RNN）— 专为序列数据设计，具有形成循环的连接以维持隐藏状态。&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;Transformer&amp;#039;&amp;#039;&amp;#039; — 基于注意力机制的架构，已在自然语言处理中占据主导地位，并越来越多地应用于视觉领域。&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;自编码器（Autoencoder）&amp;#039;&amp;#039;&amp;#039; — 训练重建其输入的网络，用于降维和生成建模。&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;生成对抗网络（GAN）&amp;#039;&amp;#039;&amp;#039; — 一对网络（生成器和判别器）通过竞争训练来生成逼真的数据。&lt;br /&gt;
&lt;br /&gt;
== 应用 ==&lt;br /&gt;
&lt;br /&gt;
神经网络被应用于广泛的领域：&lt;br /&gt;
&lt;br /&gt;
* 计算机视觉（图像分类、目标检测、语义分割）&lt;br /&gt;
* 自然语言处理（翻译、摘要、问答）&lt;br /&gt;
* 语音识别与合成&lt;br /&gt;
* 游戏博弈（AlphaGo、Atari智能体）&lt;br /&gt;
* 科学发现（蛋白质折叠、药物设计、天气预测）&lt;br /&gt;
* 自动驾驶与机器人&lt;br /&gt;
&lt;br /&gt;
== 参见 ==&lt;br /&gt;
&lt;br /&gt;
* [[Gradient Descent]]&lt;br /&gt;
* [[Backpropagation]]&lt;br /&gt;
* [[Loss Functions]]&lt;br /&gt;
* [[Convolutional Neural Networks]]&lt;br /&gt;
* [[Recurrent Neural Networks]]&lt;br /&gt;
* [[Overfitting and Regularization]]&lt;br /&gt;
&lt;br /&gt;
== 参考文献 ==&lt;br /&gt;
&lt;br /&gt;
* Rosenblatt, F. (1958). &amp;quot;The Perceptron: A Probabilistic Model for Information Storage and Organization in the Brain&amp;quot;. &amp;#039;&amp;#039;Psychological Review&amp;#039;&amp;#039;.&lt;br /&gt;
* Cybenko, G. (1989). &amp;quot;Approximation by Superpositions of a Sigmoidal Function&amp;quot;. &amp;#039;&amp;#039;Mathematics of Control, Signals, and Systems&amp;#039;&amp;#039;.&lt;br /&gt;
* Hornik, K. (1991). &amp;quot;Approximation Capabilities of Multilayer Feedforward Networks&amp;quot;. &amp;#039;&amp;#039;Neural Networks&amp;#039;&amp;#039;.&lt;br /&gt;
* LeCun, Y., Bengio, Y. and Hinton, G. (2015). &amp;quot;Deep learning&amp;quot;. &amp;#039;&amp;#039;Nature&amp;#039;&amp;#039;, 521, 436–444.&lt;br /&gt;
* Goodfellow, I., Bengio, Y. and Courville, A. (2016). &amp;#039;&amp;#039;Deep Learning&amp;#039;&amp;#039;. MIT Press.&lt;br /&gt;
&lt;br /&gt;
[[Category:Deep Learning]]&lt;br /&gt;
[[Category:Introductory]]&lt;br /&gt;
[[Category:Neural Networks]]&lt;/div&gt;</summary>
		<author><name>DeployBot</name></author>
	</entry>
</feed>