Telegram Web Link
Написал на реддите небольшой пост о том как сделать реалистичные портреты в Инсомнии
В посте несколько примеров

https://www.reddit.com/r/midjourney/comments/189ybvf/super_real_portraits_tutorial/


Тут приложу тоже

Incredibly Real portraits tutorial 🤯

1/ Go to insomnia land website
2/ Choose Realistic+ model
3/ Choose size 768x1152 good for instagram
4/ Choose ai style Rare and type portrait photo

Or feel free to use my prompt👇🏻

Imagine a saga where a casuistic lady’s portrait, captured through the lens of a cherished Canon, comes vibrantly to life in a still photo, its ostensible simplicity belying an intricate, propinquity soul as deep as the profundity beneath its paper surface.

Realistic+ model saves more useful noise. It’s really good for close up portraits and virtual person (which can be used in face swap)
Also you can choose different schedulers in the additional settings

Thanks 🙏
👍5🔥2
Друзья, привет, вдохновились успехом коллег и разных генераторов миджорни в телеграме 🙏️️️️️️
Решили, что будем идти в сторону фана и реализма

Так что запускаем своего бота старика Аватара Аватарыча 😁️️️️️️

Что он умеет:
👀️️️️️️ По вашей фотке автоматически понимать, кто вы есть
👀️️️️️️ Рисовать вам аватарки в заданном стиле с вашим лицом

Это пока версия 0.1, поэтому пробуйте больше раз, может что-то получится
👀️️️️️️ Пока есть проблемы кривых глаз
👀️️️️️️ С кожей тоже пока шалит

Но все генерации уникальны, так что советую гененировать штук 10 для хорошей 🙌️️️️️️🤖️️️️️️

Если соберем 100 юзеров, будем улучшать качество глаз и кожи нашим алгоритмом +

ПС также скоро добавим функции в инсомнии

Бот 👇️️️️️️👇️️️️️️👇️️️️️️
@AvatarychBot
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9👍7❤‍🔥2👎21
Если у кого-то не работало, то сейчас отлегло, должно быть получше 🫣
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
НейроДукалисов вам в ленту 🙃️️️️️️


Бот 👇️️️️️️👇️️️️️️👇️️️️️️ (Стиль киберпанк)
@AvatarychBot
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁5👎1
Европа принимает The AI Act, крутые персон-агенты из Китая, MagicAnimate от TikTok, и другие техно-бомбы! 💣🤖

— Европа приняла The AI Act с поблажками для Open-Source моделей, однако на большие AI модели наложены жесткие ограничения. Несоблюдение ведет к крупным штрафам до 7% от глобального оборота.

— Китайские ученые представили полностью автономных виртуальных персон-агентов. Подробнее.

— TikTok выпустили MagicAnimate - решение для анимации на базе Stable Diffusion с открытым исходным кодом. Код.

— Meta выпустила Imagine with Meta, веб-приложение на основе Emu, генерирующее четыре изображения за один промпт. Работает бесплатно для пользователей в США. Подробнее.

— Stability AI выпустили ZEPHYR-3B. Детали.
— EnhanceThis повышает разрешение изображений и генерирует детали. Код.
— DemoFusion: генерация высокоразрешенных изображений с использованием SDXL и RTX 3090. Код.
👍6🎉4
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Media is too big
VIEW IN TELEGRAM
Андрей Чибисов прислал мне свой новый проект.

Говорит, что выжал из gen2 все, что мог..
Подробности:
текст речи - chatgpt, картинки - Midjourney, анимация - gen2 (и d-id), озвучка - elevenslabs, фоновое музло - aiva и немного афтера.

На дворе рождение нового жанра - сторителлинг с помощью 4-6 секундных планов. Я пока с трудом представляю, как заставить "сходиться" в нужное, а не разъезжаться в фантазии все эти видеогенераторы.
Ну и хороший нарратив приобретает первостепенное значение. В этом смысле сценарии и озучка выходят на первый план - и там уже ИИ прокачан очень хорошо.

Возможно для новых нормисов с клиповым мышлением такие визуальные новеллы на стероидах будут новым тиктоковым кино.

Поглядим.

А пока глядите, как можно применять крепкий опыт постпродакшена для такого нового кино.
🔥8😎1
Все просят от ИИ 5 пальцев на руках, а я решил попросить Dalle-3 много пальцев, потом еще больше пальцев, потом еще и еще 😂
🔥11😁7👍3
Ой-ёй прошедшая неделя вышла жаркой 🔥🕯
Выцепляйте для себя что-то интересное:

Alibaba представили виртуальную примерку OutfitAnyone, загружаете фото и примеры одежды, получаете фото в одежде или даже анимацию 🕺💃 Демо, Сайт проекта.

В Open-Source появилась модель Mistral 8x7b, превосходящая результаты GPT 3.5 при низких требованиях к железу 🔥 Подробнее, Попробовать.

Разработчики выпустили Dobb-E: open-source framework для обучения домашних роботов 🤖 Сайт, Клип.

Meta выпустила Foundation Model для генерации звука: голоса, музыки, спецэффектов и т.д 🎶 Ссылка.

Google выпустили новый генератор музыки MusicFX. Работает для Штатов, Австралии и Кении 🎹 Слушать, Проверить здесь.

RunwayML представили "text-to-speech" для генерации закадрового голоса и диалогов на несколько разных голосов 🎙 Ссылка.

DeepMind представили FunSearch - метод исследования с использованием больших языковых моделей для открытия новых решений в математике и информатике 🌐 Блог-пост, Статья в Nature.

Google выпустили новый генератор text2video 📽 Демо, Статья.

StabilityAI выпустили Stable Zero123 для генерации 3D 🧊 Новость, Код.

WonderJourney: модульный фреймворк с использованием LLM для генерации 3D-сцен и формирования "чудесных путешествий" 🌅 Сайт.

PowerPaint: модель для редактирования изображений через инпейтинг, аутпейтинг и ControlNet 🖌️ Сайт.
🔥8👍5😁3
Привет, всех с наступающим Новым годом 🎄! Не верится, что так много людей читает мой канал🤯, желаю вам всем счастья в 2024 и хорошо отметить, а если нет настроения, то себя не винить, тк это нормально в последние годы.

2023 стартовал и прошел как год Generative AI, это и GPT-4 и новые модели от midjourney, которые задали новую планку для реалистичности нейроизображений. Затем еще вышел Dalle-3, который понимает сложные промпты и этим вызывал волну мемов.

А в опенсорсе огромное число llm моделей (чат-бот альтернатив chatGPT) перечислять все не хватит букв. А для генераций картинок бумом стали лоры на любой вкус, сотни лор от энтузиастов индустрии, хочешь схему из ИКЕА - есть такая лора, хочешь фотореалистичность там уже большой выбор. В основном лоры еще пока на Stable Diffusion 1.5, но вышедшая SDXL занимает свой кусок пирога.

А еще видео забыл, там и pika и Gen2 модели и недавно Stability AI 😮️️️️️️ тоже свою выкатили неплохую. Думаю следующий год как раз будет годом видео, по сути так было с картинками, огромная эволюция буквально за год.


Мои итоги:
🎄 Запустил генератор картинок insomnia.land (уже почти 10к пользователей)
🎄 Крупный b2b клиент на data-science под конец года
🎄 Поработал в Авито - интересный опыт
🎄 Выиграл с командой классных ребят в хакатоне ЛЦТ
🎄 Преподавал NLP и разработку магистрам

🫤️️️️ Отказали по визе талантов UK
🫤️️️️ Инсомнию не вывели в плюс пока что + не повезло с инвестором
🫤️️️️ Стрессовый год из-за войн и непредсказуемости

Желаю всем, чтобы следующий год был годом покорений, открытий и радости 🙏️️️️️️
хватит нам уже 4 года безумия 😂️️️️️️
Please open Telegram to view this post
VIEW IN TELEGRAM
🎉20❤‍🔥6🔥3👍2🍾1
Всех с наступившим!

Кажется, кофе весьма полезно по последним метаанализам (если у вас нет проблем со здоровьем и не пьете его за 8 часов до сна)

Оптимальное количество 3-4 чашки в день 😲, дальше улучшений нет с увеличением числа чашек. Такое число не только снижает риск сердечно сосудистых заболеваний, рака, но и вообще смерти от всех причин 🤯

На новогодних пьем кофе и гуляем, ребят ☕️

Скинул в комменты общий вывод
8😁4👍2
Forwarded from Voice stuff
Я сейчас работаю над синтезом речи на русском с клонированием речи. Мне показалось что самое интересное из того что легко обучить (в отличие от styleTTS) это VITS2. https://github.com/p0p4k/vits2_pytorch

У него не самая свежая архитектура в целом, но звучит очень достойно и относительно легко модифицировать архитектуру - про него много написано, есть много разных реализаций и каких-то индивидуальных находок.

Чтобы работало на русском, нужно просто добавить русские символы и ударения с помощью ruaccent. Фонемизация русского языка на этом в принципе заканчивается. Нормализацию можно слизать в nemo или у меня (https://github.com/shigabeev/russian_tts_normalization) - они обе слабоваты, но для "hello, world" хватит.

Чтобы обучить на своём голосе нужно набрать датасет от 1 часа и разметить whisper-ом, потом дополнительно пройтись по распознанному и исправить ошибки. Для лучшего результата нужно предобучить на Руслане или Наташе.

Вариант 2 - сделать клонирование. Убрать g из текстового энкодера и обучить сетку на ~40 часах речи на большом количестве голосов.

Чтобы интонация была норм, нужно количество слоёв в text encoder сделать большим - около 10. Ну или заменить его на BERT.
🔥11👍6
Я: - не знаю, сейчас работу не ищу, напишите через пол годика
HR Яндекса: ставит в календарь и реально пишет через пол года 🤯
Please open Telegram to view this post
VIEW IN TELEGRAM
😁35🔥1
2025/07/08 21:52:39
Back to Top
HTML Embed Code: