Telegram Web Link
Топ 7 книг написанных ИИ в 2023 🤯
🔥4👍3🤯2💩1
Там совет директоров уволил Сэма Альтмана с поста главы OpenAI, якобы за "недостаточную честность" 😮

Как думаете в чем дело?
Из-за нехватки гпу?
Сливал инфу правительству ?
AGI дсотигнут и Сэм не нужен?
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯6
Посмотрел лекцию Эндрю Ына, кофаундера Coursera и автора мощнейшего курса на ней🫡. В лекции он говорил о преимуществах Generative AI над классическими подходами и какие стартапы сейчас нужны.

Основные мысли:
1) Gen AI сокращает разработку в области ИИ с месяцев до часов !
2) Hardware сейчас нужен как никогда, но со стартапом туда залезть сложно
3) Большая часть стартапов ограничены небольшим рынком и еще часть из них можно заменить тем же GPT
4) Рынок сервисов перегружен конкурентами, к примеру сколько уже стартапов делает ИИ дейтинг или ИИ психолога? не все хорошо, конечно, но пример показательный
5) На примере Эндрю сервисы все еще нужны, но те, в которых больше экспертизы и потребности на рынке (условно не подделаешь одним Gpt). Так их стартап по поиску оптимальных маршрутов для судов хорошо выстрелил, но потребовал погружения в домен

Про инсомнию отразилось конкуренция и то, что большую часть разработок (кроме наших по мл) скопировать не сложно 😞


Лекция:

https://youtu.be/5p248yoa3oE?si=U14mvg4j0gHXFJ3p
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9
В OpenAI что творится 🤯 - все в шоке, а мы в поиске потерянных AI-новостей:

Meta GenAI выпустили Emu Video, 🎦 генерирующий короткие видео по текстовому запросу. Новая модель Emu-Video является SOTA в text-to-video, превосходя Gen-2 в 78.5% и Pika в 98.5% случаев. Сайт проекта / Демо-результаты / Блог Meta GenAI

Meta GenAI также представили Emu Edit 🎨🖌🖼 многозадачную модель для редактирования изображений с помощью промпта. Работает на LLAMA-2-70B, способна на добавление и удаление предметов, замену текстуры, смену фона и другие операции. Сайт / Статья / Тестовый датасет

Krea.ai представили возможность генерации в реальном времени. Krea.ai (waitlist)

Microsoft анонсировали два новых кастомных AI чипа 👾 Maia для обучения и инференса LLM, и Cobalt, экономичный CPU на базе ARM для общих облачных вычислений. Maia имеет преимущество в эффективности с 30% меньшим количеством транзисторов по сравнению с AMD MI300X. Подробнее

Разработчик уместили языковую модель на 15М параметров в микроконтроллер стоимостью ~$80, 👾🔌 пишет со скоростью ~2.5 токена в секунду. GitHub / Автор / Девайс

Music ControlNet 🎹 позволяет контролировать генерацию музыки, принимая описание целевого звучания и аудио референс. Можно использовать для продолжения трека или генерации поверх бита с контролем интенсивности. Сайт
😎5👍32
This media is not supported in your browser
VIEW IN TELEGRAM
Экспериментирую тут с видосами на диффузии, скоро в Инсомнии 👍️️️️️️
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥83👍2
Тут @kopyl натрейнил свою целую модельку по иконкам и логотипам. Получилось очень очень круто 👍, я рад, что помогал 🙌

Смотреть тут:
https://www.tg-me.com/sdicon
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5😎1
This media is not supported in your browser
VIEW IN TELEGRAM
Привет, добавил простой морф в инсомнии, скоро добавим наш алгоритм сглаживания и другие text2video коих появилось очень много недавно и Stablity и Кандинский


Пробовать онлайн без регистрации 👇

https://insomnia.land/#/text2video

(совет - ставьте scale 2-4 и минимализм если хотите как на примере )
Please open Telegram to view this post
VIEW IN TELEGRAM
🆒52
Недельный AI-дайджест для тех кто в танке 😴🤖

Stability AI выпустили Stable Video Diffusion, модель для генерации видео, обгоняющую Gen-2 и Pika по бенчмаркам. Доступна две версии: SDV и SDV-XT. Меняется FPS от 3 до 30, генерируется от 14 до 25 кадров разрешением 576x1024. Веса доступны здесь.
Anthropic выпустили обновленную модель AI - Claude 2.1. Обрабатывает до 200 тысяч токенов, увеличили точность на порядок, добавили доступ к внешним API. Подробнее.
Amazon совместно с PartyRock представили платформу для создания AI-приложений без кода: https://partyrock.aws/
Intel выпустили самую мощную 7B LLM - Mistral 7B СОТУ среди моделей на 7 млрд параметров под лицензией Apache 2.
Kandinsky выпустили Kandinsky 3.0 для генерации изображений и Kandinsky Video для генерации видео. Их статьи можно найти на Хабре: Kandinsky 3.0 и Kandinsky Video. Оценить Kandinsky Video можно на платформе fusionbrain.ai и в Telegram-боте (waitlist)
👍5🔥3
Forwarded from эйай ньюз
🔥Adversarial Diffusion Distillation или SDXL-Turbo

Мои друзья из Stability AI зарелизили новый метод дистилляции для SDXL.

Показывают, что из дистиллированной SD-XL (ADD-XL) теперь можно семплить за 4 шага без существенной потери в качестве.

Судя по метрикам - это новая сота. Может работать и за один шаг семплера, но тогда генерирует меньше деталей и картинка выходит чуть более замыленная.

Как это работает?
Это гибрид GAN-а и диффузии.
Тренировка основана на классическом методе дистилляции, но с дискриминатором! Когда число шагов снижается до одного, дискриминатор сильно добрасывает, ведь он не позволяет генерить полную кашу (это было уже показано в нескольких статьях в этом году).

1. Студент и учитель инициализируется весами SD-XL. Далее между предиктами студента и учителя накладывается L2 лосс. Любопытно, что учитель делает только 1 шаг, но начинает с зашумленного предикта студента, а не из случайного шума.

2. В качестве дискриминатора берутся фичи из ViT-S, натренированного в self-supervised режиме с помощью DINOv2. Затем эти фичи подают в тренируемую голову, которая выдает "Real" или "Fake". Тут важно именно брать сильный претренированный энкодер фичей, типа DINOv2.

Картиночки выглядят хорошо, но ниже 4х шагов - уже не то пальто.

Тренировочный код не выложили, и, кажется, его ждать не стоит.

Статья
Код и веса
Демо на ClipDrop (1 шаг)

@ai_newz
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2
Проверил, что GPT-4 посыпался на моей довольно простой ловушке, исключительно в исследовательских целях 🫣
😁223🤡1
2025/07/09 11:28:04
Back to Top
HTML Embed Code: