This media is not supported in your browser
VIEW IN TELEGRAM
Очень мне нравится, как пишут текст диффузионные языковые модели – они в отличие от обычных LLM, синтезируют текст сразу во все стороны; это значит, что они и быстрее, и если "случайный текст" немного повреждать, то можно сделать приятную анимацию того, как модель пытается восстановить его
Натренировал нано-диффузионную модельку поверх Одесских Рассказов Бабеля и запустил с анимацией от древней игры "Жизнь" – нравится как эстетически получилось, хоть смысла и мало
Код брал тут
Натренировал нано-диффузионную модельку поверх Одесских Рассказов Бабеля и запустил с анимацией от древней игры "Жизнь" – нравится как эстетически получилось, хоть смысла и мало
Код брал тут
12❤585 67 62 16 6
И еще поигрался с интересной моделью: TimeCapsuleLLM
С 1800 года по 1875 было опубликовано примерно 175 000 текстов на Английском, которые попали в интернет библиотеки
Если взять текст этих публикаций и натренировать с нуля (важно именно с нуля) языковую модель, то в теории получится усредненная по уровню «размышлений» LLM 19го века
Я запустил модель автора, и попросил ее сделать предсказания на тему будущего – модель сыровата, но небольшие предсказания тем языком способна выдать (перевод сгладил все ошибки):
Результаты интересные, но немного читинг, потому что модель умеет только продолжать текст (чат формата в ней нет) и первые 5-6 слов мои, а продолжение модели
Я связался с автором так как хотел денег задонатить, но он говорит что его уже университет спонсирует и оказалось что он видел какие-то мои GenAI эксперименты, так что может удастся вместе даже что-то поделать
Ждем новую версию в общем, для путешествий во времени с LLM☕️
С 1800 года по 1875 было опубликовано примерно 175 000 текстов на Английском, которые попали в интернет библиотеки
Если взять текст этих публикаций и натренировать с нуля (важно именно с нуля) языковую модель, то в теории получится усредненная по уровню «размышлений» LLM 19го века
Я запустил модель автора, и попросил ее сделать предсказания на тему будущего – модель сыровата, но небольшие предсказания тем языком способна выдать (перевод сгладил все ошибки):
Грядущие способы сообщения соткут невидимые нити из таинственного эфира, охватив весь земной шар и соединив между собой величайшие хранилища знаний, рассеянные по самым далёким уголкам мира. Посредством особых электрических аппаратов учёные мужи смогут отправлять запросы на любые расстояния и в то же мгновение получать ответы, содержащие книги, трактаты и даже новейшие открытия из отдалённых университетов и библиотек. Представьте себе, как джентльмен, пребывая в своём лондонском кабинете, пожелает ознакомиться с неким документом, хранящимся в далёком Гарвардском университете за океаном, и через краткое мгновение невидимая электромагнитная сила доставит содержание этой рукописи прямо к его письменному столу, не прибегая ни к проводам, ни к почтовым дилижансам. Эта поразительная возможность обмена знаниями навсегда изменит природу учёности, открыв двери к невиданному ранее распространению просвещения и [далее следует учёная дискуссия]
Механические мыслительные машины будут созданы на основе принципов вычислительного устройства мистера Бэббиджа, однако их возможности выйдут далеко за рамки арифметики и охватят весь спектр человеческого мышления. Эти искусственные разумы будут оснащены обширными механическими системами памяти, хранящими все известные человечеству знания, и с помощью сложных зубчатых передач и часовых механизмов смогут осуществлять логические выводы, распознавать закономерности и вести интеллектуальные беседы. Получив любой вопрос или проблему, механический мозг будет искать в своей памяти нужную информацию, применять логическое рассуждение через свои механизмы и выдавать осмысленные ответы так, словно это был бы высокообразованный учёный. Подобные искусственные интеллектуальные устройства могли бы выполнять роль механических наставников, консультируя студентов в математике, естественной философии, истории и литературе, работая без устали и обладая совершенной памятью о каждом факте, когда-либо заложенном в их механические хранилища
Результаты интересные, но немного читинг, потому что модель умеет только продолжать текст (чат формата в ней нет) и первые 5-6 слов мои, а продолжение модели
Я связался с автором так как хотел денег задонатить, но он говорит что его уже университет спонсирует и оказалось что он видел какие-то мои GenAI эксперименты, так что может удастся вместе даже что-то поделать
Ждем новую версию в общем, для путешествий во времени с LLM
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
GitHub - haykgrigo3/TimeCapsuleLLM: A LLM trained only on data from certain time periods to reduce modern bias
A LLM trained only on data from certain time periods to reduce modern bias - haykgrigo3/TimeCapsuleLLM
11❤676 81 39 17
Попробовал решить проблему с ChatGPT Atlas браузером и доволен:
Есть у меня такой сервис на сайте, позволяет парсить интернет статьи в формате удобном для LLM:
https://shir-man.com/strip-html/#url
Сервис бесплатный и без регистрации, какой-то чел этим воспользовался и спарсил кучу фигни прикинувшись моим сайтом, потратив $50 баланса – я его не виню, я сознательно забил на защиту в свое время
Понятно стало, что ленится больше не получится и нужно прикрутить в сервису капчу:
1. Сначала я запромтил хорошую модель в чатгпт сделать план-инструкцию, «как в Cloudflare добавляется капча на страницы» (в моем случае была GPT 5 Thinking High)
2. Потом, открыл этот же чат в браузере Atlas и попросил агента пойти в админку Cloudflare настроить мне все что нужно для капчи - секреты, какие-то виджеты: админка выглядит как админка роутера и желания в ней разбираться у меня нет вообще
3. Братишка Atlas, в режиме агента, за пару минут справился – и что-то там завел
4. Дальше я попросил этого же агента, в этом же чате, сделать мне промпт для кодинг агента «Напиши что осталось допрограммировать, чтобы добавить капчу на сайт»
5. Codex кодинг агент (тоже часть ChatGPT) поработал по этому промпту и сделал Pull Request на гитхабе
6. Ссылку на этот Pull Request, с сгенерированным кодом, я принес агенту в Atlas и попросил проверить норм ли все и можно ли вливать, он сказал все оки, поехали
В итоге на странице теперь есть капча
¯\_(ツ)_/¯
Агент буксует иногда и пока плохо видит, но я уже однажды отправил его на час работать и он справился - какие-то задачки он уже сейчас решает нормально
Есть у меня такой сервис на сайте, позволяет парсить интернет статьи в формате удобном для LLM:
https://shir-man.com/strip-html/#url
Сервис бесплатный и без регистрации, какой-то чел этим воспользовался и спарсил кучу фигни прикинувшись моим сайтом, потратив $50 баланса – я его не виню, я сознательно забил на защиту в свое время
Понятно стало, что ленится больше не получится и нужно прикрутить в сервису капчу:
1. Сначала я запромтил хорошую модель в чатгпт сделать план-инструкцию, «как в Cloudflare добавляется капча на страницы» (в моем случае была GPT 5 Thinking High)
2. Потом, открыл этот же чат в браузере Atlas и попросил агента пойти в админку Cloudflare настроить мне все что нужно для капчи - секреты, какие-то виджеты: админка выглядит как админка роутера и желания в ней разбираться у меня нет вообще
3. Братишка Atlas, в режиме агента, за пару минут справился – и что-то там завел
4. Дальше я попросил этого же агента, в этом же чате, сделать мне промпт для кодинг агента «Напиши что осталось допрограммировать, чтобы добавить капчу на сайт»
5. Codex кодинг агент (тоже часть ChatGPT) поработал по этому промпту и сделал Pull Request на гитхабе
6. Ссылку на этот Pull Request, с сгенерированным кодом, я принес агенту в Atlas и попросил проверить норм ли все и можно ли вливать, он сказал все оки, поехали
В итоге на странице теперь есть капча
¯\_(ツ)_/¯
Агент буксует иногда и пока плохо видит, но я уже однажды отправил его на час работать и он справился - какие-то задачки он уже сейчас решает нормально
Denis Shiryaev Projects
Free URL/HTML to Text & Markdown Converter | Offline & Private
Free offline URL/HTML to plain text and Markdown converter. Fetch pages, upload HTML files, or paste markup to get LLM-ready formatting—no data leaves your browser.
9❤456 101 38 13 10
У меня есть и хорошая, и плохая новость, смотря кто читатель – в слепом тесте, в большинстве своем, люди больше не отличают сгенерированные песни в Suno от настоящих
<вы здесь>
<вы здесь>
4 378❤131 72 32 11
