Перейти к содержимому

Deep hd как использовать

  • автор:

Как улучшить качество видео c помощью искусственного интеллекта

Среди пользователей соцсетей видео пользуется гораздо большим успехом, чем картинки или текст. С развитием скорости и качества подключения к интернету растет популярность онлайн-контента и потоковых видеосервисов: YouTube, Netflix, Hulu, HBO Go, Amazon Prime. Поэтому бренды и отдельные медиаперсоны, подхватив эту тенденцию, начали активно выпускать визуальный контент в высоком качестве, чтобы соответствовать требованиям аудитории.

Для медиасферы важно то, что изображения или видео в формате Ultra HD можно редактировать без потери качества картинки. Кстати, о технологии улучшения изображений мы уже писали в предыдущей статье . Но как же старые фильмы в низком разрешении, рекламные ролики, домашнее видео? Можно ли улучшить их качество для комфортного просмотра на современных экранах? Давайте это выясним.

Как повысить качество видео за счет разрешения

Для начала перечислим наиболее распространенные типы разрешения и термины. Разрешение обычно приводится в формате ширина х высота экрана в пикселях:

1920 x 1080: Full HD (High Definition)
2048 x 1080: 2K (Digital Cinema)
3840 x 2160: 4K (UHD — Ultra High Definition)
4096 x 2160: 4K (Digital Cinema)
7680 x 4320: 8K (UHD)
15360 x 8640: 16K (UHD)

На сегодня общепринятый стандарт разрешения — 4K, и мы движемся в сторону 8K экранов. Youtube начал поддерживать 4K для загрузки видео еще в 2010 году — тогда многие производители начали выпускать недорогие камеры в этом формате. С тех пор дисплеи и смарт-телевизоры с поддержкой 4K значительно упали в цене и завоевали популярность. Несмотря на то, что человеческий глаз вряд ли физически может заметить разницу в картинке с качеством свыше 4K, гонка за более высоким разрешением продолжается.

Наиболее полно ощутить возможности своих экранов владельцы Ultra HD дисплеев могут при просмотре нативного 4K контента. А видео с более низким разрешением приходится растягивать на целый экран ведь, например, изображения в 1080p (Full HD) содержат всего четверть пикселей от картинки в 4K. Масштабировать изображение можно сразу на смарт-телевизоре, в медиаплеере или использовать специальные программы, чтобы улучшить качество видео.

Что умеет программа для улучшения качества видео?

В двух словах, улучшение видео (Video Enhancement) — это процесс повышения качества видеозаписи. Профессиональные видеоредакторы обычно поддерживают следующие функции:

— масштабирование (апскейл);
— улучшение освещения;
— стабилизация;
— шумоподавление;
— регулировка яркости;
— обрезка (кроп), поворот видео, зеркальное отражение;
— фильтры;
— эффекты и анимация.

Видеоредактор для улучшения качества может подарить вашей старой записи вторую жизнь.

Увеличение видео (апскейлинг) — это процесс преобразование медиа с более низким разрешением в более высокое. Базовое масштабирование — это способ «растянуть» изображение более низкого разрешения на больший экран, что обычно сопровождается ухудшением качества и потерей деталей. Чтобы увеличить HD-изображение на 4K экран, придется заполнить дополнительные 6 миллионов пикселей. Поэтому программа для апскейла должна определить, что будет отображать каждый из этих новых пикселей, исходя из того, что показывают соседние (интерполяция).

Инструменты улучшения качества видео

Улучшаем видео с помощью AI: cупер-разрешение

Хотя различные алгоритмы дают разное качество изображения, интерполяция, как правило, улучшает картинку в низком разрешении. Но попытка «дорисовать» недостающие пиксели в большинстве случаев бросается в глаза. В результате изображение занимает весь 4K экран, но может выглядеть размытым или приглушенным, или иметь артефакты (шумовые ореолы, квадратики). При увеличении разрешения видео с помощью искусственного интеллекта используется совершенно другой подход.

Получая картинку в низком разрешении, алгоритм глубокого обучения (обычно это генеративная нейронная сеть) предсказывает изображение более высокого разрешения, которое после сжатия бы выглядело, как наш оригинал на входе. Чтобы достичь такого уровня точности, нейронные сети должны быть предварительно обучены на миллионах изображений. При обработке видео низкого разрешения ИИ-модель может «дорисовать» потерянные пиксели, анализируя каждый кадр и повышая качество экспоненциально. Это дает невероятную четкость и детальность картинки, которые не сможет воссоздать ни один традиционный апскейлер: от реалистичных деталей до более чистого и плавного воспроизведения движений.

Модели AI постоянно совершенствуются, и их точность растет с каждым циклом обучения. Кроме того, различные модели глубокого обучения могут применяться для улучшения разных типов видеоматериалов. А еще нейронные сети можно комбинировать: порой это дает поразительные результаты.

Так, искусственный интеллект помог увеличить знаменитое « Прибытие поезда на вокзал Ла-Сьота» (L’arrivée d’un train en gare de La Ciotat) до 4К . Это французский короткометражный черно-белый документальный фильм 1896 года, снятый братьями Люмьер. Несмотря на то, что исходное изображение было увеличено на 600%, алгоритм на основе AI (DAIN и Topaz Gigapixel AI) смог выдать четкое и чистое изображение без видимого зерна, артефактов и искажений. Кажется, что запись современная — только черно-белая.

Обработка видео нейросетью. Краткий обзор программ

В отличие от традиционных (не основанных на искусственном интеллекте) инструментов повышения качества видео — более сложных и порой требующих профессиональных навыков редактирования — алгоритмы искусственного интеллекта могут автоматически улучшить качество ваших видеоматериалов. Приведем несколько примеров таких решений.

DVDFab Enlarger AI — супер-разрешение с помощью нейронок

Этот сервис для улучшения видео использует технологию супер-разрешения на основе глубокого обучения и может повысить качество видео с 480p (SD) до 1080p (Full HD), и с 1080p до 4K. AI-движок на основе глубокого обучения (deep learning) изучает и анализирует видео низкого разрешения покадрово и может создавать и заполнять идентичные соседние пиксели, увеличивая кадр на 300%. В программе также используются интеллектуальные алгоритмы цветокоррекции.

DVDFab Enlarger AI основан на фреймворке TensorFlow. Для обучения нейросетей были использованы миллионы видео, фильмов и телепередач. Кроме того, программа использует новейшие технологии GPU-ускорения CUDA и cuDNN на базе графических карт NVIDIA.

PicaVue (GDFLab Video Upscaler) — восстановление видео и разрешение до 16K

GDFLab Video Upscaler — это облачный сервис для улучшения качества видео. Разработчики обещают апскейл видео и изображений до 16K за счет одновременного увеличения разрешения и качества:

  • 270p ~ 360p до 720p или FHD;
  • 540p до 4K UHD;
  • 4K FHD до 16K.

Искусственный интеллект используется для устранения шумов и восстановления деталей, недостаточно четких на исходном изображении. Кроме того, с помощью GDFLab Video Upscaler можно восстановить старые видео — с более чистой картинкой и в лучшем разрешении. Программа может применяться для видео с камер наблюдения, съемок, социальных сетей, а также в любых сферах, связанных з видеозаписью. Пользователи могут загружать свои изображения и видео одновременно на все основные платформы: YouTube, Facebook, LinkedIn, Twitch и другие.

Topaz Video Enhance AI — реалистичные детали, сгенерированные нейросетью

Мы упоминали об этом видеоредакторе, когда писали о восстановлении документального фильма 1896 года до 4K. Topaz Video Enhance AI считается одной из лучших программ для улучшения качества видео. Он может повысить разрешение до 8K, сохраняя реалистичность деталей и плавность движений.

Video Enhance AI может увеличивать разрешение с DVD, DSLR, игр и HD. Вы также можете улучшить качество старого видео для современного использования, например, рекламных роликов, музыкальных клипов, фильмов или записей с YouTube.

Topaz Video Enhance AI использует глубокое изучение для экстраполяции деталей из видеоматериала. Работает на основе обучения нейросети: она анализирует тысячи пар видео, чтобы установить, каким образом при сжатии теряются детали изображения. Нейросеть может сгенерировать недостающие детали и создать реалистичную картинку на основе информации из отдельно взятого видео.

Вместо вывода

Увеличение и улучшение видео с помощью AI создают эффект, который, наверное, можно сравнить с ощущениями близорукого человека, надевшего очки: оказывается, мир полон деталей, у деревьев есть листья, а дорожные знаки, вывески и номера автобусов можно легко прочитать. На данный момент Full HD и 4K — все еще самые популярные форматы разрешения для просмотра видео в интернете и на ТВ, но верхний предел качества картинки пока не установлен.

У команды Evergreen есть многолетний опыт использования TensorFlow — системы машинного обучения с открытым исходным кодом — для создания и внедрения проектов на базе AI во многих областях бизнеса.

Мы специализируемся на разработке персонализированных решений для клиентов и можем построить MVP (минимально жизнеспособный продукт) быстро и экономически эффективно, который в будущем можно развивать и масштабировать в полноценный продукт.

Если вы заинтересованы в разработке надежного решения на основе современных технологий и AI-алгоритмов для решения ваших бизнес-задач, мы готовы вам помочь. Просто позвоните нам или заполните форму , и наши специалисты свяжутся с вами для консультации.

Используем искусственный интеллект для улучшения качества видео 11

×

Технология Deep HD: нейросеть Яндекса научилась перерисовывать старые фильмы и «мультики», улучшая качество картинки

Если Вы еще не знаете об этом – компания Яндекс экспериментирует с технологией автоматического улучшения видеоконтента за счет использования искусственного интеллекта на базе нейронных сетей. Технология, получившая название Deep HD, была успешно задействована для повышения разрешения, яркости, четкости и насыщения деталями видеоизображения в нескольких старых, снятых на плёнку советских фильмах и мультфильмах студии «Союзмультфильм».

17 октября 2018, среда 00:08
Kutuz [ ] для раздела Блоги

реклама

Если Вы еще не знаете об этом – компания Яндекс уже вовсю экспериментирует с технологией автоматического улучшения видеоконтента за счет использования искусственного интеллекта на основе нейронной сети. Ключевое слово здесь «автоматического». То есть, искусственный интеллект сам берет видематериал в плохом качестве, оцифрованный со старой пленки, и, буквально, «дорисовывает» его вручную. Если конечно слово «вручную» применимо в том случае, когда речь идет о работе ИИ. В любом случае, будущее, если оно ещё не наступило, сделало очередной шаг в нашем направлении. Или мы сделали шаг к нему.

реклама

Технология, получившая название Deep HD, была успешно задействована для повышения разрешения, яркости, четкости и насыщения деталями изображения в нескольких старых советских фильмах и мультфильмах студии «Союзмультфильм», которые были сняты на аналоговые носители и оцифрованы с них значительно позже. В результате этого, они стали доступны пользователям Интернет, но в не достаточно хорошем качестве.

В фильмах, предварительно обученная на большой выборке видеоконтента, нейросеть сделала кадр более четким и насытила его мелкими деталями, такими как фактура одежды, мимические морщины на лицах героев, повышение четкости и контраста изображения в целом и так далее. Были улучшены (и уже доступны на КиноПоиске) несколько фильмов, в основном, относящихся к тематике Великой Отечественной Войны, среди которых «Радуга» (1943), «Летят Журавли» (1957), «Дорогой мой человек» (1958), «Судьба человека» (1959), «Иваново детство» (1962), «Отец солдата» (1964), «Танго нашего детства» (1985). Вместе с тем, как на представленном ниже изображении из фильма «Отец Солдата» Резо Чхеидзе, наряду с повышением качества проработки мелких деталей одежды и черт лица актера, был «вытянут» и задний план, до этого бывший размытым и засвеченным. Последнее уже получило неоднозначную оценку со стороны критиков и служит причиной интересных дискуссий на тему того, не нарушают ли такие улучшения и доработки оригинального видеоконтента изначальной художественной задумки построения кадра и операторской работы с планом, глубиной резкости и светом. Да и вообще — не ставится ли под удар «соответствие» улучшенного произведения оригинальному?

Как улучшить изображение с помощью нейросетей: 12 сервисов

Нейросети делают жизнь проще: обрабатывают фотографии, увеличивают их разрешение, убирают лишнее. Алгоритмы на основе машинного обучения позволяют автоматически и за пару кликов сделать то, на что раньше уходили силы и время. Вот полезные сервисы, которые можно использовать для обработки изображений.

Для улучшения качества

VanceAI Image Enlarger

Сервис, увеличивающий исходный размер изображения вплоть до восьми раз. В бесплатной версии можно обработать три фотографии

Для улучшения качества

Pixel Cut

Бесплатный сайт, который отлично улучшает рисунки. Разрешение можно увеличить в два или в четыре раза

Для улучшения качества

Neural Love

Позволяет улучшить качество не только фото, но и видео: сервис повышает разрешение до 4К и увеличивает FPS до 120. Доступно окрашивание черно-белых изображений

Для редактирования

Cleanup.pictures

Сайт, который «стирает» лишние объекты и текст с фото. Пригодится, если надо убрать из хорошей фотографии случайный объект, попавший в кадр

Для редактирования

Remove.bg

Удаляет фон изображения и оставляет только нужное. Пригодится дизайнерам и фотографам
Для редактирования

Unscreen

Убирает фон из видео и гифок. Полученный результат можно вставить в изображение с зеленым экраном, чтобы подставить свой фон

Для фильтров

Prisma

Приложение, где фотографию можно превратить в картину одним кликом. В платной версии есть сотни фильтров на выбор. Доступно на iOS и Android

Для фильтров

PortraitAI

Стилизует фотографии под портреты в стиле эпохи Ренессанса. Можно сделать хорошую аватарку для соцсетей

Для фильтров

Me in Comics

Самый простой и популярный сервис по превращению себя в персонажа аниме. Генерирует случайные результаты

Для развлечений

ruDALL-e

Создает изображения по текстовому запросу. Есть удобный телеграм-бот и генерация эмодзи по тексту
Для развлечений

Quick, Draw!

Сервис распознает рисунки и дает им описание. Поможет угадать, что же нарисовали ваши дети
Для развлечений

Deep Nostalgia

Сайт, который анимирует портреты на фотографиях. Можно «оживить» кого угодно, включая исторических личностей

Больше рекомендаций

В нашем потоке «Технологии». Рассказываем, как меняется интернет, что происходит с соцсетями и как в многообразии приложений и сервисов найти интересные и полезные

Читать статьи

Как упростить жизнь с помощью нейросетей

Расскажем в бесплатном курсе Учебника Т⁠—⁠Ж. За десять уроков разберетесь, как превратить ChatGPT и Midjourney в помощников на работе, в учебе и в быту

Хочу учиться

Еще подборки полезных приложений и сервисов:

Мы постим кружочки, красивые карточки и новости о технологиях и поп-культуре в нашем телеграм-канале. Подписывайтесь, там классно: @t_technocult.

Deep hd как использовать

Открывает наш топ интересных нейросетей нашумевшая DALL-E 2. Эта программа была анонсирована в апреле 2022 года, разработчиком выступила исследовательская лаборатория искусственного интеллекта OpenAI.

Что умеет:

  • Генерировать изображения по текстовому описанию на английском языке;
  • «Дорисовать» картину, расширив изображение за его исходные пределы;
  • Вносить изменения, добавляя объекты;
  • Создавать несколько вариантов похожих изображений на основе оригинала.

Как пользоваться: чтобы получить доступ к DALL-E 2, нужно пройти регистрацию через электронную почту, а затем подтвердить номер телефона.

Возможности DALLE-2

Стоит отметить, что нейросеть не работает на территории России. То есть для работы из России потребуется VPN (список качественных VPN-сервисов можно посмотреть здесь), а также купить номер телефона страны для подтверждения (например, здесь).

В первый месяц доступно 50 кредитов, одна операция (например, генерация изображения по запросу) стоит один кредит. Каждый последующий месяц пользователю доступны 15 кредитов.

Если нет желания включать VPN и настраивать иностранный номер, можно протестировать российскую DALL-E от от SberDevices и Sber AI. Российская программа не требует регистрации, бесплатна и генерирует изображения по запросу на русском и других языках.

Генерация Kandinsky по запросу «Собака в самолете пьет шампанское»

Генерация Kandinsky по запросу «Собака в самолете пьет шампанское»

Stable Diffusion

Нейросеть Stable Diffusion достаточно популярна за счет качества и реалистичности сгенерированных изображений и точно входит в список бесплатных нейросетей, которые стоит попробовать.

Stable Diffusion — это ПО с открытым исходным кодом, его релиз состоялся в 2022 году. В разработке приняли участие группа компаний CompVis, Runway, EleutherAI и LAION.

Что умеет: генерировать изображения по текстовому описанию на английском языке.

Как пользоваться: сервис представляет собой классический веб-сайт с кратким описанием функций и полем для описания изображения. Достаточно ввести нужный текст или воспользоваться предложенными вариантами и нейросеть меньше чем за минуту сгенерирует четыре варианта изображения.

Генерация Stable Diffusion по запросу «Собака сидит в самолете и пьет шампанское»

Генерация Stable Diffusion по запросу «Собака сидит в самолете и пьет шампанское»

Stable Diffusion не требует регистрации и полностью бесплатна. Обратите внимание, что из-за высокой популярности сервис может выдавать ошибку при генерации изображения — возможно попытку придется повторить несколько десятков раз.

Midjourney

Midjourney входит в тройку самых популярных нейросетей для генерации изображений. Автор программного обеспечения — научный сотрудник NASA и основатель Leap Motion Дэвид Хольц, проект стал доступен широкому кругу пользователей в июле 2022 года.

Что умеет:

  • Генерировать изображения по текстовому описанию на английском языке;
  • Объединять несколько изображений в одно;
  • Создавать аватары в разных стилях.

Как пользоваться: сейчас нейросеть доступна в виде чат-бота в Discord, поэтому, чтобы начать ей пользоваться, потребуется зайти в свой аккаунт или завести новый.

Генерация MidJourney по запросу

Генерация MidJourney по запросу «Собака сидит в самолете и пьет шампанское»

После входа в Discord нужно нажать на кнопку «Присоединиться к бета-версии» на сайте нейросети — сайт автоматически перенаправит на нужный канал. Обратите внимание, что бот по умолчанию публичный и другие пользователи также будут видеть ваши изображения (при желании бота можно добавить на личный сервис).

Картинки генерируются в специальных комнатах Newcomer rooms — нужно выбрать любую и перейти в чат.

  • В поле ввода указать /setting, нажать Enter — базовые настройки уже будут применены по умолчанию;
  • В поле ввода указать /imagine, нажать Enter — написать любое слово на английском языке — отправить в чат;
  • Принять настройки.

После этих шагов пользователь может начать генерировать собственные изображения. Каждому новому юзеру выдается 25 бесплатных кредитов — один кредит на один запрос.

У бота большое количество команд и программ, полное руководство стоит изучить на сайте нейросети в специальном разделе.

Gnod

Gnod — проект немецкого специалиста по искусственному интеллекту Марека Гибни. Сам создатель описал его как самообучающуюся систему рекомендаций, которая «общается с каждым, кто заходит на сайт, пытаясь понять его картину мира». Gnod точно входит в список нейросетей, которые отлично подойдут для досуга.

Сервис специализируется на четырех основных направлениях — фильмах, изобразительном искусстве, литературе и музыке, и на основе уже знакомых и любимых подбирает похожие, новые для пользователя лица и произведения.

Что умеет:

  • Gnod Music рекомендует музыкальных исполнителей;
  • Gnod Art рекомендует художников;
  • Gnod Literature рекомендует авторов;
  • Gnod Movies рекомендует фильмы;
  • Gnod Search помогает сравнивать поисковые системы.

Как пользоваться: интерфейс сервиса полностью на английском языке. Для начала пользователю нужно выбрать интересующую его сферу — допустим, фильмы. После этого потребуется ввести три любимых фильма, на их основе нейросеть предложит кинокартину. Если ответ Gnod не устроил пользователя, можно нажать «мне не нравится» и она выдаст новую рекомендацию.

Обратите внимание, что могут возникнуть проблемы с десктопной версией сайта, рекомендуем пользоваться мобильной версией.

Imaginary soundscape

Imaginary soundscape — нейросеть от команды ученых Токийского университета, разработанная в 2018 году. Проект можно описать как звуковую инсталляцию, где зрители могут передвигаться по Google Street View и погружаться в воображаемые звуковые ландшафты, созданные с помощью моделей глубокого обучения.

Что умеет:

  • Озвучивать случайное место на земле на Google Map;
  • Озвучивать изображения.

Как пользоваться: чтобы озвучить изображение, достаточно загрузить его в соответствующее окно на сайте — в базе нейросети более 52 тысяч звуков.

При открытии Google Street View пользователь попадает на случайную точку на карте — редактор RB в первый раз очутилась на улочке Камбоджи, а во второй раз — на службе в кафедральном соборе. После этого можно остаться на локации и исследовать ее, переключиться на случайную новую или вбить в поисковую строку нужное место.

Autodraw

Инструмент для рисования Autodraw был разработан Дэном Мотценбекером и Кайлом Филлипсом в Google Creative Lab. Как заявлено на сайте самого проекта, «он сочетает машинное обучение с рисунками талантливых художников, чтобы помочь каждому создавать что-то креативное».

Что умеет: дорисовывает и преображает изначальный рисунок пользователя.

Как пользоваться: интерфейс сервиса напоминает упрощенный Paint. Из кнопок есть кисть, автокисть, текст, заполнение, фигуры и выбор цвета. Пользователь выбирает автокисть и начинает рисовать фигуру — программа автоматически пытается «угадать», что имеет в виду юзер, и предлагает похожие готовые фигурки.

Рисунок на Autodraw

Рисунок на Autodraw

Готовые фигуры можно двигать, перекрашивать, закрашивать, менять в размере и создавать из них цельные изображения. Пожалуй, главный минус этой программы — в ней не предусмотрен ластик.

ThisPersonDoesNotExist

Самые интересные нейросети иногда бывают еще и одними из самых пугающих. Сайт разработчика Uber Филиппа Ванга ThisPersonDoesNotExist точно можно отнести к последним.

Что умеет: раз в несколько секунд генерирует человеческое лицо, картину, лошадь, кошку или химическую решетку.

Как пользоваться: на сайте нет кнопок, разделов и тому подобного — по умолчанию, когда пользователь открывает сервис, он видит только сгенерированное человеческое лицо. Лицо человека, которого в реальной жизни не существует. Чтобы сгенерировать новое — нужно просто обновить страницу.

Коллаж из сгенерированных лиц нейросетью ThisPersonDoesnotExist

Коллаж из сгенерированных лиц нейросетью ThisPersonDoesnotExist

В нижнем углу при посещении сайта появится всплывающее окно — в нем можно будет перейти на генератор картин, кошек, лошадей, химических решеток или изучить исходный код на GitHub.

Ostagram

Ostagram — достаточно популярный сервис для обработки изображений. Программа работает на основе сверточных нейронных сетей Cпециальная архитектура искусственных нейронных сетей, нацеленная на эффективное распознавание образов. Входит в состав технологий глубокого обучения и алгоритма художественного стиля Леона Гатиса, Александра Эккера и Матиаса Бетге.

Что умеет: объединяет стили двух разных изображений и генерирует на их основе одно новое.

Как пользоваться: для обработки своих изображений потребуется пройти регистрацию. Далее в разделе «Изображения» нужно загрузить картинку для обработки (за раз можно обработать до 10 штук), а затем выбрать один из предложенных фильтров или добавить свой вариант. Дополнительно можно регулировать масштаб и вес стиля — от этого зависит глубина наложения фильтра.

Обработка фото в Ostagram

Обработка фото в Ostagram

Бесплатная обработка фотографии занимает от одной до нескольких минут. Есть платная версия, которая позволяет ускорить процесс и получить качество в HD.

Посмотреть работы других пользователей можно в ленте сервиса.

GauGAN

Нейросеть GauGAN — проект американской технологической компании NVIDIA. Первую версию компания представила еще в 2019 году, вторую презентовала в 2021. Чтобы выдавать качественным результат, нейросеть была натренирована на 10 миллионах фотографий видов природы.

Что умеет:

  • Генерирует изображения по текстовому запросу;
  • Генерирует изображения на основе эскиза.

Как пользоваться: если пользователь хочет получить сгенерированное изображение по текстовому запросу, нужно выполнить следующие действия:

  • Принять условия и положения внизу страницы (без этого будет невозможно выполнять какие-либо действия);
  • В Input visualization выбрать все варианты;
  • В Input utilization выбрать только «текст»;
  • В строке ввода текста на английском языке (весь интерфейс сервиса англоязычный) указать нужное описание, допустим, rainy forest;
  • Нажать на стрелку render output;
  • Нейросеть выдаст сгенерированное изображение, оно будет полностью меняться, если использовать разные стили.

Понятный и подробный гайд можно посмотреть здесь.

Генерация изображения по эскизу

Генерация изображения по эскизу

Если пользователь хочет получить изображение на основе скетча, нужно выполнить все те же шаги, в input utilization указать «скетч» и нарисовать набросок в левом окне.

«Балабоба»

Генератор фраз и предложений «Балабоба» — сервис на основе языковой модели YaLM, разработанной «Яндексом». Другие модели семейства компания использует в «Яндекс.Поиске», умной колонке «Алисе» и множестве других проектов.

Что умеет: «дописывает» начатое предложение в разных стилях: инструкциях, рецептах, предсказаниях и так далее.

Генерация текста от «Балабоба»

Генерация текста от «Балабоба»

Как пользоваться: выбрать стиль, допустим, народные мудрости. Начать вводить предложение, нажать «Набалабобить». Обратите внимание, что на некоторые темы, такие как политика, экономика, религия и так далее, нельзя сгенерировать продолжение.

Colorize

Colorize — это российский сервис на основе искусственного интеллекта, который позволяет раскрашивать черно-белые фотографии и видео. По данным сайта, с помощью сервиса раскрасили уже более миллиона фотографий.

Что умеет:

  • Делает черно-белые фото и видео цветными;
  • Реставрирует фотографии.

Как пользоваться: чтобы раскрасить черно-белую фотографию, нужно загрузить файл с ней в соответствующее окно. Реставрировать фотографии можно только платно — стоимость пакета начинается от 600 рублей.

Окрашенное семейное фото с помощью Colorize

Окрашенное семейное фото с помощью Colorize

Deep Nostalgia

Deep Nostalgia — функция генеалогического онлайн-сервиса MyHeritage, которую компания запустила в начале 2021 года. Функция произвела настоящий фурор среди пользователей — за время ее существования было анимировано более 106 миллионов снимков.

Что умеет: улучшает качество фотографий и оживляет лица на снимках.

Как пользоваться: для начала необходимо пройти бесплатную регистрацию на сервисе. После этого нужно загрузить фотографию (цветная или черно-белая — неважно), на которых изображены люди. Анимация одного лица занимает от 10 до 20 секунд.

После обработки пользователь получит видеоролик, на котором лицо с фотографии будет улыбаться, моргать и наклонять голову.

Sketch Metademolab

Список интересных нейросетей пополняет Sketch Metademolab — сервис, который позволяет оживлять детские рисунки. Проект разработан Meta AI* (принадлежит Meta, признанной экстремистской организацией на территории РФ) и находится в бесплатном онлайн-доступе для всех желающих.

Что умеет делать: оживляет скетчи и детские рисунки, анимируя движения изображенных существ.

Как пользоваться: для начала, если пользователь находится на территории России, нужно включить VPN. Потом анимирование происходит в четыре этапа:

  • Загрузка нужного рисунка;
  • Выделение конкретного персонажа на картинке;
  • Отделение персонажа от фона;
  • Выделение точек анимирования.

После этого нейросеть предложит варианты движений персонажа — танец, бег, прыжки и так далее.

Riffusion

Riffusion — музыкальная нейросеть, созданная Сетом Форсгреном и Айком Мартиросом. Для своего проекта Riffusion Форсгрен и Мартирос произвели тонкую настройку Stable Diffusion на спектрограммах — визуальных представлениях звука, показывающих амплитуду различных частот во времени.

Это довольно точное систематическое представление звука, которое можно снова преобразовать в аудио, выполнив тот же процесс в обратном порядке.

Что умеет: генерирует мелодии по текстовым подсказкам.

Как пользоваться: сервис максимально прост в использовании — в строке с текстом нужно описать мелодию, которую хочет услышать пользователь. После того, как она будет сгенерирована, — нажать на play и прослушать.

Интересно, что необязательно описывать музыкальные стили или инструменты. Riffusion сгенерирует мелодию, даже если написать название города или слово «собака».

Guess the Line

Проект-игра от художников-резидентов Google Arts & Culture Lab Эмиля Вальнера и Ромена Казье Guess the Line предлагает пользователю проверить свои навыки рисования, пока робот с ИИ будет угадывать, что изображено.

Что умеет: угадывает, что изображено на рисунке пользователя.

Как пользоваться: пользователю в начале игры выдаются карточки, где описано то, что ему нужно нарисовать, и 60 секунд времени (за каждый отгаданный робот рисунок начисляется дополнительное время).

Интерфейс игры Guess the line

Интерфейс игры Guess the line

После того, как пользователь закончил рисунок, он должен нажать на кнопку «скан», и робот-ассистент попробует угадать, что изображено. Один отгаданный рисунок — один балл. Если рисунок не получается — можно нажать на кнопку «пропустить» и начать рисовать следующий.

Обложка: генерация Midjourney по запросу russian businessmen in anime style

Подписывайтесь на наш Telegram-канал, чтобы быть в курсе последних новостей и событий!

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *