EBGAN
2024-09-06 02:17:53
Zhao J., Mathieu M. & LeCun Y. Energy-based generative adversarial networks. ICLR, 2017.
概
基于能量的一个解释.
主要内容
本文采用了与GAN不同的损失, 判别器\(D\)和生成器\(G\)分别最小化下面的损失:
\[\mathcal{L}_D (x, z) = D(x) + [m-D(G(z))]^+ \\
\mathcal{L}_G(z) = D(G(z))
\]
\mathcal{L}_G(z) = D(G(z))
\]
需要注意的是, 这里的判别器\(D\)的输出已经不是普通GAN中判别器的真假概率了, 而是能量, 能量越低,即\(D(x)\)越小, 越真.
用\(V(G, D)= \int_{x, z} \mathcal{L}_D(x, z) p_{data}(x) p_g(z) \mathrm{d}x\mathrm{d}z\), 用\(U(G,D) = \int_{z} \mathcal{L}_G(z) p_g(z)\mathrm{d}z\), 考虑如下纳什均衡
\[V(G^*, D^*) \le V(G^*, D), \quad \forall D \\
U(G^*, D^*) \le U(G, D^*), \quad \forall G.
\]
U(G^*, D^*) \le U(G, D^*), \quad \forall G.
\]
第一个需要考虑的问题是, 这样的纳什均衡解会有什么好的性质呢?
定理1: \((G^*, D^*)\)为纳什均衡解, 则\(p_{G^*}=p_{data}, \: a.e.\), \(V(G^*, D^*)=m\).
proof:
\[V(G, D) = \int_{x} D(x) p_{data} (x)\mathrm{d}x + \int_z [m-D(G(z))]^+ p_G(z) \mathrm{d}z = \int_{x} D(x) p_{data} (x)\mathrm{d}x + \int_x [m-D(x)]^+ p_G(x) \mathrm{d}x.
\]
\]
故需要考虑
\[\min \quad D(x) p_{data}(x) + [m-D(x)]^+ p_{G^*}(x),
\]
\]
可得
\[D(x) = \left \{
\begin{array}{ll}
m, & p_{data} < p_{G^*} \\
0, & p_{data} > p_{G^*} \\
[0, m], & else.
\end{array} \right.
\]
\begin{array}{ll}
m, & p_{data} < p_{G^*} \\
0, & p_{data} > p_{G^*} \\
[0, m], & else.
\end{array} \right.
\]
所以
\[\begin{array}{ll}
V(G^*, D^*) & = \int_{p_{data} < p_{G^*}} m p_{data}(x) \mathrm{d}x + \int_{p_{data} > p_{G^*}} mp_{G^*}(x)\mathrm{d}x + \int_{p_{data}=p_{G^*}} G^*(x) p_{data}(x) \mathrm{d}x \\
& \le m + m \int_{p_{data} < p_{G^*}} m [p_{data}(x) - p_{G^*}(x)] \mathrm{d}x \le m.
\end{array}
\]
V(G^*, D^*) & = \int_{p_{data} < p_{G^*}} m p_{data}(x) \mathrm{d}x + \int_{p_{data} > p_{G^*}} mp_{G^*}(x)\mathrm{d}x + \int_{p_{data}=p_{G^*}} G^*(x) p_{data}(x) \mathrm{d}x \\
& \le m + m \int_{p_{data} < p_{G^*}} m [p_{data}(x) - p_{G^*}(x)] \mathrm{d}x \le m.
\end{array}
\]
另一方面,
\[U(G,D^*) = \int_x D^*(x) p_{G}(x) \mathrm{d} x \ge \int_{x} D^* (x) p_{G^*}(x) \mathrm{d}x
\]
\]
所以
\[V(G^*, D^*) \ge \int_x (D^*(x) + [m-D^*(x)]^+)p_{G^*}(x) \mathrm{d}x \ge m.
\]
\]
所以\(V(G^*, D^*)=m\), 且\(p_{G^*}=p_{data}, \: a.e.\)
下一个问题是, 这个纳什均衡存在吗, 文中的定理二给出了这个答案, 不过需要一个额外的条件, 这里不多赘述.
文中最后采用的是下面的框架:
即能量函数\(D\)的选择为
\[D(x) = \|Dec(Enc(x)) - x\|.
\]
\]
最新文章
- 设计模式之六大原则——接口隔离原则(ISP)
- HDU 4746 莫比乌斯反演+离线查询+树状数组
- 2015年第12本(英文第8本):the Old Man and the Sea 老人与海
- mysql数据库导入外键约束问题
- SQLite操作(C# )
- e+开发中的各种问题
- MFC下的aero效果学习笔记
- 分布式文件系统GlusterFS
- 201521123040《Java程序设计》第12周学习总结
- Spring MVC的优势
- #033 信安培训基础题Python解决网络安全实验室|网络信息安全攻防学习平台
- VisualStudio移动开发(C#、VB.NET)Smobiler开发平台——BarcodeView控件的使用方式,.Net移动开发
- 通过一篇YAML来学习YAML
- C语言中类型转换#大写字母转小写字母和小写字母转大写字母案例。
- 关于mysql中like查询是否通过索引的测试
- 02:MongoDB操作
- Mongodb Windows 集群
- Ubuntu下使用face_recognition进行人脸识别
- 获取验证码效果和后台代码(js+html+cs)
- 【Asp.net入门16】第一个ASP.NET 应用程序-总结