Технологічний вбивця Photoshop: DragGAN — AI фотошоп за допомогою функції перетягування
Уявіть світ, де будь-хто міг би вивчити Adobe Photoshop, без необхідності мати справу з технічними нюансами, пов’язаними з ним. Новий інструмент, який використовує потужність генеративного ШІ, дозволяє людям робити саме це. Познайомтеся з DragGAN!
DragGAN — зручний інструмент, який дозволяє користувачам вносити значні зміни в зображення за допомогою простих елементів керування, наведення і перетягування. Як зазначено в статті дослідників з Google, Інституту інформатики Макса Планка та MIT CSAIL, DragGAN дозволяє користувачам опускати точку на зображенні, змінюючи структуру та цілі пікселі. Це відрізняє його від інших популярних інструментів створення зображень AI, таких як Dall-E та Midjourney, які, хоча й здатні обробляти дуже специфічні підказки, не можуть точно виводити бажані пози чи макети.
Приклади в статті демонструють такі зміни. Наприклад, зображення лева, де його паща закрита та проведені маніпуляції з якою відкривають його пащу. Фотографія автомобіля, видозмінена так, що здається, що вона знята під зовсім іншим кутом, і гору, подовжену вдвічі за висоту. Попри такі значні зміни, зображення продовжує виглядати справжнім.
Окрім разючих можливостей, найбільша перевага DragGAN – простота та інтуїтивно зрозумілий інтерфейс. За лічені секунди користувачі можуть зрозуміти всі функціональні можливості програми, без необхідності вивчення технології.
Інтерфейс передбачає додавання початкової та кінцевої точок до зображення. Наприклад, щоб створити посмішку на обличчі людини, користувачі можуть додати дві точки в куточках рота та дві додаткові точки трохи далі. Після цього натиснути кнопку «Пуск», і інструмент анімовано розширить рот від початкових до кінцевих точок. А генеративний штучний інтелект усуне будь-які прогалини та недоліки, зберігаючи реалістичність.
«Наш підхід може створювати галюцинації закритого вмісту, наприклад, додати зуби в розкритій пащі лева, а також може деформуватися внаслідок жорсткості об’єкта, як, наприклад, згинання ноги коня».
DragGAN має функцію маскування, яка дозволяє користувачам виділяти певні частини зображення, які вони хочуть змінити, залишаючи решту незмінною
Але чим цей інструмент відрізняється від чинних зараз інструментів, які можуть змінювати вираз обличчя та інші риси? Окрім функцій видозмін, DragGAN дозволяє користувачам змінювати кут, під яким робиться фотографія. Програми для редагування, на кшталт Snapseed, дозволяють налаштувати тільки «Перспективу», але це лише корекція спотворень. Тим часом DragGAN створює реальні галюцинації цих зображення, спритно генеруючи пікселі з повітря, заповнюючи прогалини, які раніше вимагали б багато роботи з Photoshop, щоб довести їх до досконалості.
Загалом, DragGAN може усунути найбільший недолік інструментів для створення зображень – їх випадковий характер. Якщо DragGAN поєднати з інструментами генерації зображень, користувачі зможуть отримати більш точні та бажані результати Інструмент наразі демонстраційний, але буде цікаво побачити його застосування, коли він стане загальнодоступним.
💬 Дизайн-чат