<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="en">
	<id>https://marovi.ai/index.php?action=history&amp;feed=atom&amp;title=Decoupled_Weight_Decay_Regularization%2Fpaper%2Fzh</id>
	<title>Decoupled Weight Decay Regularization/paper/zh - Revision history</title>
	<link rel="self" type="application/atom+xml" href="https://marovi.ai/index.php?action=history&amp;feed=atom&amp;title=Decoupled_Weight_Decay_Regularization%2Fpaper%2Fzh"/>
	<link rel="alternate" type="text/html" href="https://marovi.ai/index.php?title=Decoupled_Weight_Decay_Regularization/paper/zh&amp;action=history"/>
	<updated>2026-04-27T17:00:13Z</updated>
	<subtitle>Revision history for this page on the wiki</subtitle>
	<generator>MediaWiki 1.39.1</generator>
	<entry>
		<id>https://marovi.ai/index.php?title=Decoupled_Weight_Decay_Regularization/paper/zh&amp;diff=12898&amp;oldid=prev</id>
		<title>DeployBot: Batch translate Decoupled Weight Decay Regularization/paper unit 143 → zh</title>
		<link rel="alternate" type="text/html" href="https://marovi.ai/index.php?title=Decoupled_Weight_Decay_Regularization/paper/zh&amp;diff=12898&amp;oldid=prev"/>
		<updated>2026-04-27T07:58:27Z</updated>

		<summary type="html">&lt;p&gt;Batch translate Decoupled Weight Decay Regularization/paper unit 143 → zh&lt;/p&gt;
&lt;table style=&quot;background-color: #fff; color: #202122;&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;en&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;← Older revision&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;Revision as of 07:58, 27 April 2026&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l391&quot;&gt;Line 391:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Line 391:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;|}&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;|}&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;br/&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;br/&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;del style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;&amp;lt;div class=&amp;quot;mw-translate-fuzzy&amp;quot;&amp;gt;&lt;/del&gt;&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;其中 &amp;lt;math display=&amp;quot;inline&amp;quot;&amp;gt;\eta_{m\hspace{0pt}i\hspace{0pt}n}^{(i)}&amp;lt;/math&amp;gt; 与 &amp;lt;math display=&amp;quot;inline&amp;quot;&amp;gt;\eta_{m\hspace{0pt}a\hspace{0pt}x}^{(i)}&amp;lt;/math&amp;gt; 是乘子的取值范围，&amp;lt;math display=&amp;quot;inline&amp;quot;&amp;gt;T_{c\hspace{0pt}u\hspace{0pt}r}&amp;lt;/math&amp;gt; 表示自上次 restart 以来已完成的 epoch 数。&amp;lt;math display=&amp;quot;inline&amp;quot;&amp;gt;T_{c\hspace{0pt}u\hspace{0pt}r}&amp;lt;/math&amp;gt; 在每个 batch 迭代 &amp;lt;math display=&amp;quot;inline&amp;quot;&amp;gt;t&amp;lt;/math&amp;gt; 处更新，因此不限于整数值。在每次第 &amp;lt;math display=&amp;quot;inline&amp;quot;&amp;gt;i&amp;lt;/math&amp;gt; 次 restart 时调整（例如减小）&amp;lt;math display=&amp;quot;inline&amp;quot;&amp;gt;\eta_{m\hspace{0pt}i\hspace{0pt}n}^{(i)}&amp;lt;/math&amp;gt; 与 &amp;lt;math display=&amp;quot;inline&amp;quot;&amp;gt;\eta_{m\hspace{0pt}a\hspace{0pt}x}^{(i)}&amp;lt;/math&amp;gt;（亦可参见 Smith（[[#bib.bib18|2016]]&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;））有可能进一步改善性能，但此处我们不考虑这一选项，以避免引入额外的超参数。当 &lt;/ins&gt;&amp;lt;math display=&amp;quot;inline&amp;quot;&amp;gt;\eta_{m\hspace{0pt}a\hspace{0pt}x}^{(i)} = 1&amp;lt;/math&amp;gt; 且 &amp;lt;math display=&amp;quot;inline&amp;quot;&amp;gt;\eta_{m\hspace{0pt}i\hspace{0pt}n}^{(i)} = 0&amp;lt;/math&amp;gt; 时，可将公式（[[#A2.E14|14]]）简化为&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;其中 &amp;lt;math display=&amp;quot;inline&amp;quot;&amp;gt;\eta_{m\hspace{0pt}i\hspace{0pt}n}^{(i)}&amp;lt;/math&amp;gt; 与 &amp;lt;math display=&amp;quot;inline&amp;quot;&amp;gt;\eta_{m\hspace{0pt}a\hspace{0pt}x}^{(i)}&amp;lt;/math&amp;gt; 是乘子的取值范围，&amp;lt;math display=&amp;quot;inline&amp;quot;&amp;gt;T_{c\hspace{0pt}u\hspace{0pt}r}&amp;lt;/math&amp;gt; 表示自上次 restart 以来已完成的 epoch 数。&amp;lt;math display=&amp;quot;inline&amp;quot;&amp;gt;T_{c\hspace{0pt}u\hspace{0pt}r}&amp;lt;/math&amp;gt; 在每个 batch 迭代 &amp;lt;math display=&amp;quot;inline&amp;quot;&amp;gt;t&amp;lt;/math&amp;gt; 处更新，因此不限于整数值。在每次第 &amp;lt;math display=&amp;quot;inline&amp;quot;&amp;gt;i&amp;lt;/math&amp;gt; 次 restart 时调整（例如减小）&amp;lt;math display=&amp;quot;inline&amp;quot;&amp;gt;\eta_{m\hspace{0pt}i\hspace{0pt}n}^{(i)}&amp;lt;/math&amp;gt; 与 &amp;lt;math display=&amp;quot;inline&amp;quot;&amp;gt;\eta_{m\hspace{0pt}a\hspace{0pt}x}^{(i)}&amp;lt;/math&amp;gt;（亦可参见 Smith（[[#bib.bib18|2016]]&lt;del style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;)）有可能进一步改善性能，但此处我们不考虑这一选项，以避免引入额外的超参数。当 &lt;/del&gt;&amp;lt;math display=&amp;quot;inline&amp;quot;&amp;gt;\eta_{m\hspace{0pt}a\hspace{0pt}x}^{(i)} = 1&amp;lt;/math&amp;gt; 且 &amp;lt;math display=&amp;quot;inline&amp;quot;&amp;gt;\eta_{m\hspace{0pt}i\hspace{0pt}n}^{(i)} = 0&amp;lt;/math&amp;gt; 时，可将公式（[[#A2.E14|14]]）简化为&lt;/div&gt;&lt;/td&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-side-added&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;del style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;&amp;lt;/div&amp;gt;&lt;/del&gt;&lt;/div&gt;&lt;/td&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-side-added&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;br/&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;br/&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;{| id=&amp;quot;A4.EGx6&amp;quot; class=&amp;quot;wikitable&amp;quot;&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;{| id=&amp;quot;A4.EGx6&amp;quot; class=&amp;quot;wikitable&amp;quot;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;

&lt;!-- diff cache key mediawiki:diff::1.12:old-12883:rev-12898 --&gt;
&lt;/table&gt;</summary>
		<author><name>DeployBot</name></author>
	</entry>
	<entry>
		<id>https://marovi.ai/index.php?title=Decoupled_Weight_Decay_Regularization/paper/zh&amp;diff=12883&amp;oldid=prev</id>
		<title>DeployBot: Batch translate Decoupled Weight Decay Regularization/paper unit 71 → zh</title>
		<link rel="alternate" type="text/html" href="https://marovi.ai/index.php?title=Decoupled_Weight_Decay_Regularization/paper/zh&amp;diff=12883&amp;oldid=prev"/>
		<updated>2026-04-27T07:33:48Z</updated>

		<summary type="html">&lt;p&gt;Batch translate Decoupled Weight Decay Regularization/paper unit 71 → zh&lt;/p&gt;
&lt;a href=&quot;https://marovi.ai/index.php?title=Decoupled_Weight_Decay_Regularization/paper/zh&amp;amp;diff=12883&quot;&gt;Show changes&lt;/a&gt;</summary>
		<author><name>DeployBot</name></author>
	</entry>
</feed>