It's over.

Просто невозможно на первый взгляд поверить, что эти видосы на самом деле отрисованы при помощи одного несложного AI-инструмента. Конкретно эти — при помощи Arcads AI, который как пишут его создатели существует на рынке уже несколько месяцев, но результаты его работы завирусились только вчера.

Пишешь сценарий, выбираешь одного из 40 «актёров», и через две минуты получаешь готовое видео, где абсолютно рядовая «говорящая голова» из тиктока зачитывает всё что угодно. Можно зарядить в очередь сразу серию роликов.

Создатели даже в 30-секундную
инструкцию по пользованию сервисом плот-твист запихнули. Чёртовы гении!

FWIW, на некоторых из завирусившихся твитов появились пояснения, что видео якобы записывают живые модели, что указано в правилах сервиса. На самом деле в правилах сервиса написано, что видео создаются по предоставленному сценарию на основе роликов, созданными живыми моделями, используя липсинк и клонирование голоса.
Please open Telegram to view this post
VIEW IN TELEGRAM
Ну и вдогонку к предыдущему посту: сегодня же для всех пользователей открылась рекламная платформа Telegram. Как и описано в релизе, зайти «с улицы» можно только при оплате криптой — Toncoin, причём минимальный чек сегодня составляет 20 Toncoin, или примерно 100 долларов по текущему курсу. Чтобы пополнять фиатом, нужно по-прежнему работать через агентства, где минимальный чек для входа на платформу составит 1500 евро.

Да, вот так за месяц с момента анонса открытия рекламной платформы и запуска монетизации каналов вырос Toncoin — с 2,1 до 5,3 доллара. Вот это кто-то сделал экзит — я бы тоже на его месте на время ушёл под лёд.
Forwarded from addmeto (Grigory Bakunov)
Сегодня куча людей, думающих что они умеют читать написали о том, что якобы Amazon только делал видимость магазинов без продавцов, а на самом деле там сидели “тысяча человек в Индии”, которые глазами оценивали каждую покупку и выставляли счета.

Новость как обычно, в жанре “ученый изнасиловал журналиста”, потому что в реальности было вот что: ИИ оценивал каждую покупку и выставлял счета. В тех случаях когда ИИ выставлял оценку, что он “не очень уверен в своей работе” - постфактум подключали живых людей, чтобы проверить и откорректировать работу ИИ, т.е. тупо для разметки данных и коррекции счетов.

Грубо говоря, Амазон использовал людей для поствалидации работы ИИ. Но журналисты и авторы телеграм-каналов - они же не разбираются. Для них “в процессе были люди” означает “вместо ИИ работали тысячи индийцев”. https://gizmodo.com/amazon-reportedly-ditches-just-walk-out-grocery-stores-1851381116
Марк Гурман пишет о новом направлении разработки внутри Apple — домашней робототехнике. Её рассматривают как «next big thing» после провала проекта электромобиля.

Основное:

1. Пока Apple исследует возможность выхода на рынок персональной робототехники.

2. Инженеры изучают возможность создать мобильного робота, который может следовать за пользователями по дому.

3. Apple также разработала продвинутое настольное устройство для дома, которое использует робототехнику для перемещения дисплея.

4. Проекты домашней робототехники находятся на ранней стадии и могут быть отменены или изменены.

5. Компания ищет возможности для диверсификации своего бизнеса в условиях насыщенного рынка смартфонов.

6. Домашняя робототехника даст возможность закрепиться внутри домов пользователей и использовать силу AI. Направлением как раз занимаются как глава Apple по AI Джон Гиннандрея, так и главы подразделений, выпускающих товары для дома типа колонок HomePod.

7. До отмены проекта электромобиля Apple внутри называла три зоны для роста: авто, дом и MR. Авто отменили, шлем Vision Pro запустили — логичен новый фокус на домашнюю технику будущего.
​​Перезапустился AirChat — новая соцсеть от основателя мекки всех стартаперов AngelList Навала Равиканта и бывшего директора по продукту Tinder Брайна Норгарда. Я немного потестил (спасибо @alex_chuck) и максимально кратко описал бы его как «Твиттер для голосовых».

Интересен AirChat тремя вещами:

1. В нём оригинально перепридуманы и пересобраны войсы, кружочки, текстовые посты, социальный граф, система инвайтов, бесконечный аудиопоток и качественная расшифровка на лету.

2. Навал — один из лидеров мнений среди IT-тусовки и стартаперов, AngelList вообще владеет Product Hunt, а глава Product Hunt в своё время инвестировал в Clubhouse. Это одна большая и очень плотно связанная аудитория, сливки Кремниевой долины.

3. Вокруг него сейчас такой же вайб, как у Clubhouse три года назад в самом начале — точно впереди будет взлёт, возможно даже станет нарицательным, но успех не гарантирован.

Как и Clubhouse, AirChat — про голосовое общение, но если в Clubhouse можно было послушать разговоры только онлайн, пока «комната» существует, то в AirChat это можно сделать когда захочется. Как и в Твиттере, сообщения здесь формируют общую ленту, можно реплаить, ставить лайки и делать репосты, из сообщений получаются треды — но всё основано на аудиозаписях речи.

Главная фишка — аудиосообщения сразу расшифровываются и именно в текстовом виде отображаются в ленте. Выглядит как нормальная лента социальной сети, а не как набор непонятных аудиограмм. Обычные голосовые неудобны по многим причинам, но одна из — нельзя сразу понять, внутри что-то содержательное или «Ээээ, короче, ну, я типа имела в виду». Тут же можно сразу оценить пост взглядом, если что — промотать.

Расшифровка очень качественная — прям магия — явно благодаря современному буму нейросетей. В приложении на айфоне написано, что она происходит через встроенную в iOS «Диктовку» и аудио отправляется на сервера Apple, но я заметил, что расшифровка несколько раз меняется — сначала прям совсем каша, потом сообщение становится норм, и чуть позже уже прилетает вылизанная версия с на 99% точными попаданиями, идеальной пунктуацией и орфографией. Такой текст уже сам по себе приятен глазу. А ещё там нет эмодзи.

Контент — пока, конечно, ничего супермегасодержательного: болталка про работу, инвестиции, создание продуктов, «Вы все очень крутые», «Кто чё думает по этому поводу». Правда, и в Clubhouse великих откровений не бывало. Но удобно, что сообщения можно слушать одним потоком — напомнило Zello, где любили общаться дальнобойщики, привыкшие к постоянному трёпу по рации.

Ещё тут можно записывать видеосообщения — как видеокружочки в Telegram или VK Мессенджере, только они не в ленте публикуются, а заменяют собой статичную аватарку. Этого достаточно, чтобы сделать сообщение более персональным, но детали не рассмотришь.

AirChat сейчас работает только по приглашениям: каждый юзер получает два инвайта, причём создатели специально усложнили вход для новичков — в приложении нельзя узнать, кто из твоих знакомых уже зарегистрировался, чтобы попросить у него инвайт. Только те, кто внутри, сами решают, кого приглашать.

Два дня назад приглашения временно закрывали из-за резкого наплыва регистраций — вероятно из-за того, что в AirChat зарегистрировался Сэм Альтман, глава OpenAI. А ещё Навал отдельно попросил добавлять только тех, кого знаешь лично, давно и уверен, что ему вообще есть что сказать.

Аудитория AirChat пока никак не больше пары сотен тысяч человек, а ещё сильно перекошена в сторону Tech, инвестиций и медиа — я вижу это и по своему списку контактов. Даже у Навала и Брайана сейчас всего 10-12 тысяч подписчиков. Но в моей ленте уже очень много обсуждений и даже мемов про AirChat — медийный потенциал тут очень большой.

Чтобы понять, в чём магический эффект AirChat, нужно представить, как бы звучали посты читаемых вами авторов, если бы они их сами зачитали. По иронии, именно так и начался этот канал — в 2016 году я начал использовать его для сброса и упорядочивания мыслей, которые было некогда переводить в текст.

А теперь вот у нас есть целая соцсеть для таких вещей.
​​Технообзорщики похоронили AI-брошь от стартапа Humane. Гвоздь в крышку гроба забил Маркес MKBHD Браунли, из-за видео которого разгорелся отдельный срач.

После презентации AI Pin я писал, что гарантирую Humane полный провал. Так и произошло: на прошлой неделе начали выходить обзоры техноблогеров из первых рук.

Mrwhosetheboss: I tested the Humane AI Pin — It's not good

The Verge: Too-good-to-be-true device

Engadget: The Humane AI Pin solves nothing and makes me feel stupid

Кто-то ждал технологической революции. Кто-то поостыл и просто ожидал новое модное носимое устройство. Но всё оказалось гораздо хуже.

AI Pin медленная: смартфон с более быстрым процессором и подключением к интернету даёт ответы быстрее. Смартфон показывает тебе цветное видео в 60-120 Гц с насыщенностью, глубиной и разрешением 4К, а брошь — только зелёный монохром в 720p. Брошь не решает никакую новую задачу. Оказалось, что смартфоны-то дофига всего умеют, и непросто их превзойти. В отличие от смартфона, у броши нет магазина приложений, её нельзя подключить даже к популярным сервисам. А ещё во время работы у неё так быстро садится батарея и так сильно греется корпус, что для носимой электроники это просто становится опасным.

Маркес Браунли, пожалуй, сильнее прочих влияет на мейнстримную оценку технологических продуктов: у него очень большой запас доверия аудитории и репутация объективного обзорщика (насколько это возможно). Он даже разделил свой ролик на две части: первую посвятил непосредственно тому, как сами разработчики Humane описывали своё устройство и что оно должно делать — и только потом перешёл к своему опыту.

В общем, он оказался очень сильно разочарован и чуть ли не в ступоре от того, насколько бесполезно это устройство, так что озаглавил своё видео «Худший продукт, который я когда-либо обозревал».

Ролик стали критиковать за заголовок: «Это буквально кэнселлинг в техносфере», «Он кликбейтит ради просмотров», «Надо с уважением относиться к чужой работе». Общий тезис: авторы с настолько большой аудиторией не имеют права так говорить о продуктах других компаний, потому что это может одним махом их погубить.

Другие резонно ответили: Маркес работает для своей аудитории, а не для сотрудников производителей техники, аудитории важно его честное мнение, что продукт не оправдал ожиданий. Именно благодаря тому, что аудитория ему доверяет, он и обладает таким влиянием.

Анонсированных AI-устройств — море, и постоянно подвозят новые похожие. Прям сегодня анонсировали очередной AI-кулон под названием Limitless. Производители привлекают значительные инвестиции, ведь устройство выпустить — это тебе не wrapper для ChatGPT написать. А в рецессионном 2023 только под AI-стартапы инвестиции и раздавали, под всё остальное — хрен найдёшь дурака.

Думаю, что создатели и инвесторы отлично понимают, что эти устройства принципиально рынок не революционизируют — по крайней мере, пока. Даже Rabbit R1 (который мне понравился своей Local Action Model, способной не только давать ответы, но и тыкать в кнопки интерфейсов за человека) не будет пользоваться какой-то невероятной востребованностью, даже за 200 долларов. Но тогда зачем их делать?

Вижу только один вариант — перепродать продукт или стартап корпорациям-стратегам: Microsoft, Apple, Google, Amazon и другим крупным игрокам AI-рынка. Даже если продукт не взлетит, компетентную и (что важно) уже собранную команды, врубающуюся как в AI, так и в производство, оторвут с руками. Но сначала этой команде или продукту надо сделать маркетинг, и желательно позитивный пиар.

Такие ребята, как Маркес, своими заголовками осложняют процесс будущего приобретения Humane какой-нибудь Apple (из которой, кстати, вышла половина сотрудников стартапа). Нехорошо это, не к лицу великой компании покупать провалившиеся продукты. Так что, мол, Маркес наш разуважаемый — ты уж, пожалуйста, прикрути фитилёк, и не мешай нам делать деньги на инвестиционной понци-схеме «Найди лоха побогаче».
Знаменитые Boston Dynamics попрощались в трогательном видео с роботом Atlas — мемным андроидом, которого тыкали клюшкой, пинали, заставляли крутить сальтухи и падать, падать, падать. Его разрабатывали более 10 лет, и всего пару месяцев назад компания называла его самым продвинутым человекоподобным роботом в мире, а теперь, по всей видимости, свернула его разработку.

Тем временем OpenAI вступила в партнёрство с Figure AI, разработчиком андроида Figure 01, похоже на бостонского «Атланта». По состоянию на март он уже умеет немало: не только говорить приятным несинтетическим голосом от ChatGPT, но и подавать яблоко, сортировать мусор и убирать посуду, одновременно оценивая успешность своих действий. CEO OpenAI Сэм Альтман постоянно говорит о важности роботов для будущих этапов развития искусственного интеллекта: AGI будет необходимо «подселять» в физическое тело, чтобы он приносил пользу в реальном мире.

Boston Dynamics основана в 1992 году при лаборатории MIT, её корни — в DARPA, программе Минобороны США, и долгие годы она существовала на военные контракты. В 2013 году её купил Google за неизвестную сумму: компанией управлял Энди Рубин, создатель Android. Всего через четыре года Google избавился от роботов в пользу SoftBank: комментаторы тогда сходились во мнении, что это была ошибка, заработать на роботах компании-поисковику нереально, они требуют прорву денег, да и Рубин ушёл из Google. В 2021 году SoftBank, купивший Boston Dynamics за 165 млн долларов, продал его Hyundai по оценке в 1,1 млрд долларов.

Figure создана на 30 лет позже и в Калифорнии. Её основатель — Бретт Эдкок, молодой IT-предприниматель, который успешно продал HR-платформу в 2018 году за 100 млн долларов и запустил Archer Aviation, производителя «летающих такси» — самолётов с вертикальной посадкой. В 2022 он запустил Figure AI, куда сманил разработчиков из Boston Dynamics, Tesla, Google X, Waymo и Apple. Два месяца назад Figure AI получила раунд инвестиций от Microsoft, Nvidia, OpenAI и Джеффа Безоса. Её оценили в 2,6 млрд долларов.

Как кто-то заметил, Boston Dynamics — это Nokia от мира робототехники. Учитывая историю сделок, то же самое можно сказать и про Google, проспавшего и своих роботов, и свою же модель Transformer, на базе которой и создан ChatGPT.

Атлант, до встречи — ты так и не расправил плечи.
Радиорубка Лихачёва
Знаменитые Boston Dynamics попрощались в трогательном видео с роботом Atlas — мемным андроидом, которого тыкали клюшкой, пинали, заставляли крутить сальтухи и падать, падать, падать. Его разрабатывали более 10 лет, и всего пару месяцев назад компания называла…
This media is not supported in your browser
VIEW IN TELEGRAM
Галя, у нас отмена: полчаса назад Boston Dynamics выпустили тизер нового Atlas! Полностью электрический, более лёгкий и мобильный.

Делают акцент, что такие роботы пригодятся на автоматизации производства, и хотя они всё ещё будут человекоподобными, их не будут ограничивать в мобильности, заставляя ходить на двух ногах. Вероятно, если удобнее будет оперировать роботом на колёсах, базу заменят.

Других деталей пока нет, но, в общем, Атлант не умер, а переродился, и это была такая мхатовская пауза для привлечения внимания.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Надпись на билборде: «Всё ещё нанимаете людей?» Звонишь по номеру телефона и ИИ-оператор за минуту доказывает тебе полезность перехода на автоматизированный колл-центр.

Просто хорошо сделанная реклама: и билборд, и видос, разошедшийся на несколько миллионов просмотров. В комментах всё равно малость докопались: мол, и постановочно выглядит, и некоторые позвонили по номеру — им так же гладко робот не отвечал.

Но тем не менее — мощно.
​​Rabbit R1 официально вышел: пару дней назад прошла вечеринка с презентацией, где первые покупатели получили и свои устройства, и вот начали выходить обзоры.

В целом: всё не так круто, как рисовали создатели, но зато и не так плохо, как ожидали злопыхатели. Пока это скорее early access с заявкой на успех — но только заявкой.

Начну с минусов:

1. Он не умеет в LAM: пока этой функциональности просто нет. Обещают позже.

2. Пока поддерживаются интеграции всего с четырьмя сторонними сервисами: Spotify, Doordash, Uber и Midjourney. Это маловато.

3. Его нельзя использовать его как мобильный браузер или как телефон для звонков и SMS.

4. Батарейка может довольно быстро разряжаться, за несколько часов — в ноль.

5. Темпы отгрузки новых юнитов на уровне «ХЗ когда». Куча чуваков уже жалуются на срыв сроков первой поставки устройств. Дальше будет больше.

6. Тихие динамики.

Да и всё. А теперь плюсы:

1. Он работает: задаешь вопросы, получаешь ответы, переводишь иностранную речь, включаешь голосом музыку и так далее, причём реакция довольно быстрая.

2. Само устройство оставляет положительное впечатление: форм-фактор — что-то новенькое, красненький — прикольно, крутить колесо сначала непривычно, но привыкаешь. Приятно держать в руке. Правда, малость широковат для ладони.

3. Нормально работает и визуальный поиск: встроенная камера делает снимок (или видео) и ИИ уже работает, анализируя информацию. Говорят, что это пока самая интересная фича, с которой интересно экспериментировать.

4. Работает с симками 4G, Wi-Fi и Bluetooth-наушниками.

5. Когда нужно что-то ввести текстом, можно вызвать виртуальную клавиатуру на экране — она будет работать как тачскрин. Но во всех остальных случаях тачскрин пока не доступен.

Действительно, никаким удачным убеждением аудитории, что для AI-решений будущего нужно отдельное устройство, пока и не пахнет. Но при этом и хейта нет: ОК, прикольно поиграться за 200 долларов, да ещё и получить доступ к нормальной LLM без подписки, а по технологиям — посмотрим, что будет дальше, всё равно ещё почти никто устройство не получил.

Параллельно с запуском произошло и неприятное для Rabbit: неизвестные якобы слили исходный код R1 и обвинили компанию в обмане потребителей — мол, ничего там внутри из разработок нет, а сам LAM — это просто обёртка для оперсорсного решения Playwright, которое используется для автоматизации тестирования браузеров. Фаундер Джесси Лю от таких обвинений просто отмахнулся, сказав, что всё это неправда и проделки недоброжелателей, но сообщество ему не поверило. Правда, и какого-то видимого ущерба это компании не нанесло.

Едут дальше.
Мои друзья Паша и Макс уже девять лет делают «Не занесли» — самый хитровыдуманный, смешной и талантливый подкаст о поп-культуре: видеоиграх, кино, сериалах, настолках и о чём только не. Но когда столько времени видишь контент высокого уровня, он приедается: ну делают классно, что тут скажешь? Так и получается: сообщество их фанатов очень активное, но относительно компактное.

А на девятилетие ребята решили провести масштабное обновление и выйти за рамки привычного: кроме новой панк-аватарки от великого Вани Ефимова ведущие стали больше уходить в разгоны тем, как любят делать стендаперы (а их стилю юмора завидуют соседние подкасты), а ещё пригласили третьим ведущим фееричного Тёму Леонова. Чего стоит его 12-минутный разгон МХАТовского уровня про то, как его несколько раз вероломно обманул ChatGPT при виртуальной игре в покер.

Дружеская рекомендация (не реклама — мне-то уж точно не занесли!): начать смотреть, слушать или читать и тоже быстро стать фанатом.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Со вчерашнего мероприятия Apple про новые айпады больше всего обсуждений — про то, что новый iPad Pro стал самым тонким из всех устройств Apple, и связанный с этим рекламный ролик под названием «Crush», который запостил у себя в Твиттере даже Тим Кук. Лично мне этот самый ролик показался достаточно логичным — он в тренде вирусных видео про гидравлический пресс, он залипательный и доносит основной маркетинговый посыл. Но вот у доброй половины комментаторов он вызвал другие эмоции.

Apple обвинили в том, что они ненароком запечатлели метафору, мрачное пророчество — тотальное уничтожение прекрасных и уже существующих инструментов для творчества одним-единственным технологическим устройством. Ролик называли tone deaf (бестактным), сделанным мимо ценностей молодого поколения, которое и является основным потребителем креативных инструментов, и даже увидели в нём эффект, обратный их знаменитой рекламе «1984»: тогда Apple разрушала мрачную антиутопию, где корпорация пыталась убить свободу самовыражения — а тут она сама же эту антиутопию и создаёт.

Один из ярких примеров в этой дискуссии — переделанная версия, где всё идёт задом наперёд под песню «I Got You Babe». Действительно оставляет совершенно иное впечатление, хотя и маркетинговый посыл доносит.
2024/05/09 00:15:02
Back to Top
HTML Embed Code: