CycleGAN[9]是“莫奈春醒”、“马变斑马”、“四季变”背后的模型。它的论文开头非常漂亮,引人入胜。首先,它公布了这些令人印象深刻的结果;;与此同时,他用在博物馆里四处展示的语气写下了《简介》:“当莫奈站在河边,在一个温暖的春天的早晨画下这幅画时,他面前是什么样的场景?”如果莫奈站在一个清爽的夏日清晨,他会看到什么样的场景,会画出什么样的作品?“作者的写作技巧可见一斑。
以此开头,作者引出一个动机:虽然我们不能真正穿越时间空和袖手旁观·莫奈去看他当时所看到的,但我们可以通过他的画来想象当时的场景;同时,根据他的作品(以及他的画风),你可以想象他画的其他场景会是什么样子。也就是说,我们可以在没有配对数据的情况下实现这种“翻译”或映射。那么,我们也可以让机器来做吗?
我们人类之所以能做到这一点,是因为作者假设两个字段(X,Y)之间存在一种潜在的关系,或者说是一种隐含的关联——这种隐含的关联可能是同一事物有两种不同的映射表达式,所以这两种表达式是同一事物的一种关联。如果我们只用一个映射来放g: x->: Y单向映射,那么我们不能保证这个g是单个的。或者说,我们不能保证x域的所有样本x和y域的所有样本y都合理对应。这就导致了模式同质化的问题。对于这个问题的描述,在CycleGAN中,作者使用了有意义这个词;在DiscoGAN中,作者强调我们要的是一对一的映射,比多对一的映射要好。
通过这样的分析,很容易看出,一个自然的解决方案是,我们不仅需要单向映射,还需要双向映射。在CycleGAN中,这个问题形式化为:我们有g:x->;Y,F:Y->;x两个映射或翻译器,我们希望f (g (x)) ≈ x,g (f (y)) ≈ y .在DiscoGAN中,作者直接用GAN中的生成器来表示这个映射,所以为了实现这个双向映射,DiscoGAN指出我们需要两个g,让G1(G2(x)) = x尽量,反之亦然。DualGAN的形式化类似于DiscoGAN。然而,这三篇论文使用了三个不同的术语来实现这样的约束或目标。在CycleGAN中,作者使用了在视觉中多次使用的循环一致性损失,因此得名CycleGAN。DiscoGAN用双射映射来解释,因为它直接强调一对一映射。DualGAN是受去年NIPS 2016双学习针对MT的论文启发,所以是从闭环的角度写的。因为CycleGAN的模型图比较简单,这里我们以它为例:
转载声明:此文转载自《节目元套路》。搜索“少女hocode”关注。
集智QQ群| 292641157
商业合作| zhangqian@swarma.org
投稿转载| wangting@swarma.org
◆ ◆ ◆
搜微信官方账号:志志社
加入“无墙研究院”
让苹果砸得更厉害!
1.《深入浅出 深入浅出 GAN·原理篇文字版(完整)| 干货》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《深入浅出 深入浅出 GAN·原理篇文字版(完整)| 干货》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/yule/1468358.html