长篇社会家庭伦理小说 一键换装神器爆火,老黄换上抱抱脸 T 恤,CEO 本东谈主:我被替代了,和他争 CEO 职位争不外
发布日期:2024-10-08 21:34 点击次数:132笑不活长篇社会家庭伦理小说,最新捏造试穿神器被网友们玩坏了。黄院士、马斯克、阿尔特曼、史小姐等一众大佬穿戴集体被扒。
前有老黄卸下皮衣套上糖果包装袋:
后有阿尔特曼大秀花臂穿 GUCCI:
再有老马酿成了蛛蛛侠:
好莱坞巨星史小姐也格调大变:
但说回盘考自己,确乎正经八百的盘考。
名为 IDM–VTON,由来自韩国科学工夫院和 OMNIOUS.AI 公司的盘考团队基于扩散模子打造。
当今官方放出了 demo,大伙儿不错试玩,推理代码已开源。
除了来源所展示的,抱抱脸盘考员也玩得不亦乐乎,给老黄换上了专属战袍。其 CEO 连忙转发玩笑:
我被替代了,没法和他争 CEO。
看吵杂的网友亦然叹惜,进程这样多年,终于无须再记挂我方“手残”了(AI 帮你责罚)。
来玩啊~咱们也赶快上手体验了一把。demo 通盘这个词页面是这样的:
操作起来亦然曲常肤浅。
率先上传东谈主物图,不错手动或者自动聘用要修改的区域。然后,上传要换的穿戴。
获胜点击 Try-on长篇社会家庭伦理小说,会自动生成掩模图和换装后的图:
上头这张自动生成的掩模把手也选进去了,是以临了生成的左手成果不好。
咱们手动录取涂抹一下,同期东谈主和穿戴全部都用咱们我方的图。
此次成果大伙儿认为奈何?
再来展示一波网友的试玩制品图。DeepMind 连合首创东谈主苏莱曼穿上了浅笑面具修格斯联名款 T 恤:
致使不少网友真念念要这件穿戴。
阿尔特曼再次被网友当成模特:
固然也有翻车的时候,比如马斯克穿的即是盗窟 CUCCI。
看完成果后,接着来看 IDM–VTON 在工夫上是奈何兑现的。
基于扩散模子工夫方面,IDM–VTON 基于扩散模子,通过盘算推算细致的把稳力模块来素养服装图像的一致性,并生成真确的捏造试穿图像。
模子架构偶然包含三部分:
TryonNet:主 UNet,处理东谈主物图像。
IP-Adapter:图像指示适配器,编码服装图像的高等语义。
GarmentNet:并行 UNet,索求服装的初级特征。
在为 UNet 提供输入时,盘考东谈主员将东谈主物图片的含噪声潜在特征、分割掩模、带装扮的图片和 Densepose 数据整合在一皆。
他们还会为服装添加剧视描写,举例 [V] 示意“短袖圆领 T 恤”。这个描写随后用作 GarmentNet(举例,“一张 [V] 的相片”)和 TryonNet(举例,“模特正在穿 [V]”)的输入指示。
TryonNet 和 GarmentNet 产生的中间特征进行了澌灭,随后传递至自我把稳力层。盘考东谈主员只使用了来自 TryonNet 的输出的前半部分。这些输出与文本编码器和 IP-Adapter 的特征一皆,通过交叉把稳力层进行和会。
ai换脸刘涛最终,盘考东谈主员对 TryonNet 和 IP-Adapter 模块进行了细致调度,并锁定了模子的其它部分。
现实阶段,他们使用 VITON-HD 数据集磨真金不怕火模子,并在 VITON-HD、DressCode 和里面网罗的 In-the-Wild 数据集上进行评估。
IDM–VTON 在定性和定量上都优于先前的方法。
IDM-VTON 不错生成真确的图像并保留服装的细粒度细节。
更多细节,感深嗜深嗜的家东谈主们不错稽察原论文。
技俩流畅:
[1]https://idm-vton.github.io/?continueFlag=589fb545dbbb123446456b65a635d849
[2]https://arxiv.org/abs/2403.05139
[3]https://huggingface.co/spaces/yisol/IDM-VTON?continueFlag=589fb545dbbb123446456b65a635d849
参考流畅:
[1]https://twitter.com/multimodalart/status/1782508538213933192
[2]https://twitter.com/fffiloni/status/1783158082849108434
[3]https://twitter.com/ClementDelangue/status/1783179067803533577
本文来自微信公众号:量子位 (ID:QbitAI),作家:西风
告白声明:文内含有的对外跳转流畅(包括不限于超流畅、二维码、口令等步地)长篇社会家庭伦理小说,用于传递更多信息,勤俭甄选时分,甩掉仅供参考,IT之家通盘著作均包含本声明。