Midjourney v5 та v4: у чому різниця?

Midjourney є лідером галузі генеративного мистецтва штучного інтелекту. З кожною новою версією їй вдається все більше стирати межі між реальністю та фантазією. Завдяки постійному розвитку алгоритмів, які покращують фотореалізм і динамічний діапазон, серед багатьох інших рис і функцій, Midjourney продовжує вражати своїх користувачів з кожним новим оновленням.

Midjourney v5 була випущена в бета-версії 16 березня 2023 року. Отримати доступ до Midjourney можна за допомогою Discord. Існуючі користувачі Midjourney можуть отримати доступ до v5, ввівши /Settings, а потім натиснувши MJ версії 5 у меню, як показано нижче.

Якщо ж ви новачок і раніше не користувалися Midjourney, спочатку ви отримаєте безкоштовну пробну версію, яка пропонує вам загалом 25 зображень. Якщо ви зацікавлені в продовженні використання Midjourney на основі передплати, всього є три тарифні плани. Для початку рекомендуємо Стандарт.

Особливості Midjourney v5

Ширший стилістичний діапазон

З’явився набагато ширший діапазон стилістичних варіантів, які можна легко застосувати для майбутніх зображень. Він також буде краще реагувати на підказки. Подивімось деякі зображення з презентації версії 5 Midjourney.

Вища роздільна здатність

Неймовірні покращення якості зображення — із колосальним двократним збільшенням роздільної здатності та динамічного діапазону! На цей час не існує програми підвищення масштабування V5, і вона успадковує таку саму роздільну здатність від покращеної V4, завдяки чому всі зображення виглядають чіткішими. Завдяки збільшенню кількості модераторів і кращим інструментам модерування очікуємо більш реалістичних зображень у Midjourney V5.

Більша ясність і точність

Тепер ми можемо отримувати більш детальні зображення, без зайвого тексту. Також значно покращилось відображення обличчя та рук. А також покращення узгодженості.

Ширші параметри співвідношення сторін

У новій версії Midjourney V5 користувачі можуть використовувати співвідношення сторін більше 2:1. У — v 5 ви можете створювати набагато ширші та набагато вужчі розміри полотна. Спробуйте будь-яке співвідношення сторін, яке вам подобається.

Підказка [— iw]

За допомогою — iw ви можете налаштувати відносну важливість URL-адресу зображень порівняно з простим текстом. За замовчуванням значення дорівнює 0,25, але ви можете контролювати його вручну, включивши — iw у свій командний рядок. Використання вищих значень — iw може значно змінити якість готового продукту, оскільки на нього сильніше впливатиме початкове зображення.

Практичне порівняння Midjourney v5 та v4

Відображення рук у Midjourney

Поліпшення функції, яке викликає найбільший інтерес, це руки. Midjourney v5, безумовно, є кращим у порівнянні з v4, особливо коли йдеться про правильний підрахунок пальців. Але є ще кілька недоліків, які потрібно розв'язати, перш ніж ми зможемо сказати, що Midjourney впорався з цим багом. Подивімось, як v4 обробляє руки в портретах, використовуючи підказку «портрет старого чоловіка зі складеними руками на колінах»:

Ось як впорався з цим Midjourney v5

У п'ятій версії знадобилося зробити чотири спроби, щоб досягти результату, прийнятного для реалістичних складених рук (зображення внизу праворуч). Та й то руки теж не складаються. За іронією долі, ви часто побачите значні покращення рук на зображеннях, де руки конкретно не згадуються в підказці. Тепер порівняйте підказку «Портрет старого в повний зріст» між Midjourney v4 і v5.

Midjourney v4:

Midjourney v5:

У таких випадках руки в Midjourney v5 виглядають набагато природніше, не перетворюючись на палиці, як це сталося у прикладі v4. Є ще кілька важливих відмінностей між Midjourney v4 і Midjourney v5.

Створення унікальних і реалістичних людей з нуля

Однією з головних переваг для користувачів Midjourney є можливість створювати реалістичних персонажів на основі простих текстових підказок. Відмінності між Midjourney v4 і v5 досить значні для цих типів запитів. Ось ще одне пряме порівняння за допомогою підказки «художниця у своїй майстерні».

Midjourney v4:

Midjourney v5:

Візуалізація знаменитостей

Так само Midjourney v5 переможно протистоїть своєму попереднику v4, коли справа доходить до підказок зі знаменитостями. Ось наступне швидка підказка «кольоровий портрет Тома Круза, студійне стробоскопічне освітлення».

Midjourney v4:

Midjourney v5:

Роздільна здатність і швидкість масштабування

Ще дві помітні зміни між версіями Midjourney v4 і v5 — підвищення роздільної здатності та швидший час обробки для масштабування. Підвищення роздільної здатності можна побачити як у деталях (особливо тканинах), так і в розмірах файлів. Ось два попередні зображення Тома.

Midjourney v4:

PNG file size is 1.22 MB.
Midjourney v5:

Розмір файлу PNG становить 1,30 Мб.
Підвищення швидкості Midjourney v5 для масштабування відбувається завдяки тому, що Midjourney створює покращені версії одночасно з обробкою початкового запиту. Отже, коли ви натиснете на одне із зображень, щоб збільшити масштаб, результат зазвичай з’являється відразу, якщо у вас не так багато завдань у черзі.

У всіх попередніх версіях потрібно було чекати, поки оновлений запит буде оброблено з самого початку. Одна лише ця зміна могла б заощадити деяким користувачам Midjourney v5 години щомісяця на виконання обов’язків по розширенню.

Повсякденні предмети

Об’єкти також отримали більшу реалістичність, якщо це, звичайно, було метою. Подивімось на дві інтерпретації "баскетбольного м'яча".

Midjourney v4:

Midjourney v5:

Повсякденні речі – ахіллесова п’ята для Midjourney нарівні з руками. Жодна з версій не надто добре впоралася, коли справа дійшла до простої підказки, як «молоток».

Midjourney v4:

Midjourney v5:

Якщо метою зображення був реалізм, то v5 впорався неперевершено. Але де Midjourney v5 точно перевершить v4, це коли ви застосуєте більш детальні підказки, які ми розглянемо далі.

Складні підказки


Найкращі результати в Midjourney зазвичай досягаються завдяки детальній і ретельно розробленій підказці. Крім додавання вагових коефіцієнтів і доданих модифікаторів, упаковка великої кількості описів, розділених комами, здається, є найкращою практикою, якої дотримуються багато досвідчених користувачів Midjourney.

Очікується, щоMidjourney v5 оброблятиме ці підказки навіть краще, ніж у попередніх версіях. Давайте подивимося, чи правда це. Ми використаємо цю підказку, щоб перевірити кожну версію: «Самотня людина навпроти озера, птахи літають над головою, гора блищить на тлі неба вдалині, частково хмарне небо, рибальський човен посеред озера, у стиль Марка Шагала».

Midjourney v4:

Midjourney v5:

У цьому прикладі Midjourney v4 впорався непогано. Насправді v4 блискавично працює у створенні творчих ландшафтів і обробці абстрактних запитів. Але Midjourney v5 виконує цю роботу все таки набагато краще, як у відповідних деталях, так і в імітації стилю відомого художника.

Висновки

Midjourney v5 дійсно випереджає свого попередника v4 у загальному візуальному досвіді. У версії 5 ми повністю втрачаємо «вигляд Midjourney». Новий v5 легко можна вважати іншим всесвітом, як з точки зору фотореалізму, так і з точки зору деталей. Одним із ключових факторів є збільшення динамічного діапазону, яке широко представлене в зображеннях Midjourney v5. Майже справедливо було б назвати Midjourney v4 плоским у порівнянні, як різницю між фотографією гірського пейзажу, зробленою на старому фотоапараті камерою та один, зроблений камерою за 10 000 доларів США.

Midjourney покращується з кожною ітерацією. Цілком ймовірно, що Midjourney і подібні компанії повністю революціонізують те, як ми створюватимемо цифрове мистецтво.

Джерело

🖤
Якщо тобі сподобався цей матеріал, підпишись на наші соціальні мережі Instagram / Facebook / Linkedin / Telegram. Там ти знайдеш більше цікавих матеріалів про дизайн.

💬 Дизайн-чат