DragGAN 是一個直觀的圖像編輯工具,用戶只需要控制圖像中的像素點和方向,就可以快速調整照片主體的位置、姿態、表情、大小和角度等。這種工具的潛力主要表現在,從文本生成圖像的人工智能并不總是能輸出你想要的結果,所以用戶可以在生成圖像之后再進行重新編輯,而不必重新生成一個新的圖像。
研究論文中展示了一些演示案例,包括增加山峰的高度,改變模特的姿勢和衣服的長度和形狀,張開或閉合獅子的嘴巴,以及將一個人的表情從平淡變成微笑。
研究人員表示,他們的方法在基于 GAN 的操作中優于 SOTA,并為圖像編輯開辟了新方向。在接下來的幾個月里,他們希望將基于點的編輯擴展到 3D 生成模型。
雖然公布了源代碼,但源代碼有嚴格的限制:
本作品及其任何衍生作品只能用于或打算用于非商業用途。盡管有上述規定,英偉達公司及其附屬機構可以在商業上使用該作品和任何衍生作品。在此,"非商業" 是指僅用于研究或評估目的。
關鍵詞: