时装业是人工智能领域很有前景的领域。研究人员可以开发具有一定实用价值的应用。我已经在这里展示了我对这个领域的兴趣,在那里我开发了一个来自Zalando在线商店的推荐和标记服装的解决方案。

在这篇文章中,我们会开发一个提取连衣裙的应用。它输入原始的图像(从网络上下载或用智能手机拍照),并提取图像中的连衣裙。分割的难点在于原始图像中存在了大量的噪声,但是我们会在预处理期间通过一个技巧来解决这个问题。

最后,您还可以尝试将此解决方案与之前引用的解决方案合并。这允许您通过外出和拍摄时拍摄的照片,开发一个实时推荐和标记服装的系统。

数据集

最近有一项关于服装视觉分析和分割的Kaggle比赛。这是一个非常有趣的比赛,但它并不适合我们。我们的目标是从图像中提取连衣裙,因此这个数据集不太适合我们,因为它包含了比较多的冗余。我们需要的是包含连衣裙的图像,因此最好自己来构建数据集。

我收集了网络上的一些图片,其中包含了在不同场景穿着不同类型的连衣裙的人。然后需要创建蒙版,它在每个对象分割任务中都是必要的。

下面是我们的数据样本。我从互联网上收集了一些原始图像,经过进一步剪切,将人与衣服分开。

图像分割示例

因为我们要将背景、皮肤和连衣裙进行分离,首先要将它们区分出来。背景和皮肤是本问题中最相关的噪声源,我们要尽量减少它们的干扰。

通过手动分割来创建蒙版,如下图所示,简单的对蒙版进行二值化。

蒙版示例

最后一步,我们将所有的蒙版图像合并为三维的单个图像。这张照片表示了原始图像的相关特征。我们的目的主要是分离背景,皮肤和连衣裙,因此这个图像非常适合!

最终蒙版

我们对数据集中的每个图像重复这个过程,为每个原始图像提供三维的对应蒙版。

模型

我们可以很容易的建立模型,过程非常简单:

我们需要训练这样一个模型,该模型输入原始图像,可以输出它的三维蒙版,即分离皮肤、背景和衣服。训练完成之后,当一个新的图像输入时,我们就可以将它分成三个不同的部分:背景、皮肤和衣服。我们只关注感兴趣区域(连衣裙),这样蒙版结合原始图像,就可以裁剪出我们需要的连衣裙。

我们使用UNet建立该模型,它经常用于类似的分割任务,而且很容易在Keras中实现。

在开始训练之前,要对所有的原始图像进行均值标准化。

结果和预测

在预测期间,当遇到高噪声的图像(背景或皮肤模糊等)时,模型开始动荡。这种问题可以简单地通过增加训练图像的数量进行解决。但我们也开发了一个巧妙的方法来避免这种问题。

我们使用 OpenCV 提供的 GrubCut 算法。该算法利用高斯混合模型分离前景和背景。通过它可以帮助我们找到图像中的人物。

我们只实现了简单的功能。假设感兴趣的人站在图像的中间。

python def cut(img): img = cv.resize(img,(224,224)) ¨K5K

执行GrubCut结果

下面是结合使用GrubCut和UNet之后的结果:

GrubCut与UNet相结合得到了优秀的结果。

总结

在这篇文章中,我们为连衣裙分割开发了一套解决方案。为了达到这个目的,我们使用了GrubCut和UNet。我们计划在真实照片中使用这个解决方案,并根据它构建一个视觉推荐系统。

原文链接:
https://towardsdatascience.com/dress-segmentation-with-autoencoder-in-keras-497cf1fd169a

欢迎关注磐创博客资源汇总站:

http://docs.panchuang.net/

欢迎关注PyTorch官方中文教程站:

http://pytorch.panchuang.net/

最新文章

  1. vnc远程运行3D游戏
  2. Map接口,Map.Entry,hashMap类,TreeMap类,WeakHashMap。
  3. hashlib 和 hmac
  4. TRACERT命令
  5. RDLC An unexpected error occurred while compiling expressions. Native compiler return value: '-1073741511'
  6. ArrayList和LinkedList的几种循环遍历方式及性能对比分析(转)
  7. PHP报错: Can't use method return value in write context
  8. 第五篇、HTML标签类型
  9. iOS 延迟执行代码
  10. iOS平台在ffmpeg中使用librtmp
  11. 心急的C小加(两种解法)
  12. poj1565---(数论)skew binary
  13. GNU自动补全模块readline解析
  14. Java 多态、内部类、异常、包
  15. [区块链] 密码学中Hash算法(基础)
  16. 1.Qt字符编码
  17. visual studio单项目一次生成多框架类库、多框架项目合并
  18. Beta阶段敏捷冲刺五
  19. Saltstack-API(十二)
  20. JSP中利用JSTL标签对日期格式化

热门文章

  1. [红日安全]Web安全Day5 - 任意文件上传实战攻防
  2. 如何看待Java是世界上最好的语言?
  3. Ubutun18.04安装Python3.7.6
  4. prometheus服务发现机制
  5. http面试问题集锦
  6. 聊一聊关于MySQL的count(*)
  7. 差分放大电路的CMRR与输入电阻分析
  8. sf-git机制
  9. 一文深入了解史上最强的Java堆内缓存框架Caffeine
  10. css 实现九宫格