Generative Ai 629 - Telegram Web

Telegram Web Link

Forwarded from Data Science by ODS.ai 🦜

LLaMA: Open and Efficient Foundation Language Models

LLaMA is a set of large language models, ranging from 7B to 65B parameters, that have been trained on publicly available datasets containing trillions of tokens. The LLaMA-13B model performs better than GPT-3 (175B) on most benchmarks, and the LLaMA-65B model is competitive with other state-of-the-art models, such as Chinchilla70B and PaLM-540B. This suggests that it is possible to achieve excellent performance in language modeling without relying on proprietary or inaccessible datasets.

Paper: https://research.facebook.com/publications/llama-open-and-efficient-foundation-language-models/

Code: https://github.com/facebookresearch/llama

A detailed unofficial overview of the paper: https://andlukyane.com/blog/paper-review-llama

#deeplearning #nlp #transformer #sota #languagemodel

❤‍🔥2👍1

673 views23:34

Open source implementation for LLaMA-based ChatGPT training process. Faster and cheaper training than ChatGPT (wip)

https://github.com/nebuly-ai/nebullvm/tree/main/apps/accelerate/chatllama

👍3

762 views09:51

Prompt Engineering Guide

https://github.com/dair-ai/Prompt-Engineering-Guide

GitHub - dair-ai/Prompt-Engineering-Guide at dailydev

🐙 Guides, papers, lecture, notebooks and resources for prompt engineering - GitHub - dair-ai/Prompt-Engineering-Guide at dailydev

718 views11:46

xFormers - Toolbox to Accelerate Research on Transformers

xFormers is: Customizable building blocks: Independent/customizable building blocks that can be used without boilerplate code. The components are domain-agnostic and xFormers is used by researchers in vision, NLP and more.

Research first: xFormers contains bleeding-edge components, that are not yet available in mainstream libraries like pytorch.

Built with efficiency in mind: Because speed of iteration matters, components are as fast and memory-efficient as possible. xFormers contains its own CUDA kernels, but dispatches to other libraries when relevant.

https://github.com/facebookresearch/xformers

GitHub - facebookresearch/xformers: Hackable and optimized Transformers building blocks, supporting a composable construction.

Hackable and optimized Transformers building blocks, supporting a composable construction. - facebookresearch/xformers

👍2

758 viewsedited 15:45

Generative Ai pinned «xFormers - Toolbox to Accelerate Research on Transformers xFormers is: Customizable building blocks: Independent/customizable building blocks that can be used without boilerplate code. The components are domain-agnostic and xFormers is used by researchers…»

15:45

🤗 Diffusers provides pretrained diffusion models across multiple modalities, such as vision and audio, and serves as a modular toolbox for inference and training of diffusion models.

https://github.com/huggingface/diffusers/tree/main/examples/community#magic-mix

778 views15:46

https://www.youtube.com/watch?v=4r-_iW8fmWU

I Built a Secret AI Youtube Channel

I challenged myself to earn $100 in the first 3 days of starting a secret AI generated Youtube channel! I didn't use any of my existing connections to promote the channel and used AI tools like ChatGPT, MidJourney, and D-ID every step of the way to automate…

817 views16:09

InvokeAI: A Stable Diffusion Toolkit

https://github.com/invoke-ai/InvokeAI

❤‍🔥2👍2

839 views19:26

Forwarded from Machinelearning

😊 HugNLP

HugNLP is a unified and comprehensive NLP library based on HuggingFace Transformer.

HugNLP — это новая универсальная NLP библиотека основанная на Hugging Face, для повышения удобства и эффективности работы c текстами.

🖥

Github: https://github.com/wjn1996/hugnlp

⏩

Paprer: https://arxiv.org/abs/2302.14286v1

⭐️

Dataset: https://paperswithcode.com/dataset/clue

⏩

HF for complex text classification: https://huggingface.co/blog/classification-use-cases

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3❤2🔥1

870 views09:30

Forwarded from Machinelearning

Ultra fast ControlNet with 🧨 Diffusers

ControlNet provides a minimal interface allowing users to customize the generation process up to a great extent.

Новый пайплайн StableDiffusionControlNetPipeline, в статье показано, как его можно применять для различных задач. Давайте контролировать!

🤗 Hugging face blog: https://huggingface.co/blog/controlnet

🖥

Colab: https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/controlnet.ipynb

🖥

Github: https://github.com/lllyasviel/ControlNet

⏩

Paprer: https://arxiv.org/abs/2302.05543

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥3👍2

1.01K views11:49

Forwarded from Hacker News

Visual ChatGPT (🔥 Score: 152+ in 2 hours)

Link: https://readhacker.news/s/5zPu5
Comments: https://readhacker.news/c/5zPu5

GitHub - chenfei-wu/TaskMatrix

Contribute to chenfei-wu/TaskMatrix development by creating an account on GitHub.

823 views10:27

Read 56+ Comments

Forwarded from Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

StyleGANEX - Official PyTorch Implementation

Encoder that provides the first-layer feature of the extended StyleGAN in addition to the latent style code.

🖥

Github: https://github.com/williamyang1991/styleganex

⏩

Paper: https://arxiv.org/abs/2303.06146v1

⭐️

Colab: http://colab.research.google.com/github/williamyang1991/StyleGANEX/blob/master/inference_playground.ipynb

💨

Project: https://www.mmlab-ntu.com/project/styleganex/

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3🔥1

810 views10:31

https://crfm.stanford.edu/2023/03/13/alpaca.html

850 views23:04

Forwarded from CGIT_Vines (Marvin Heemeyer)

This media is not supported in your browser

VIEW IN TELEGRAM

Вот эта "неидеальность" со временем уйдёт, а мне так даже заходит больше. А ведь раньше гличи были на пике трендов.

Если хотите погонять свою видяху для создания Multi-frame Video rendering for SD, то вам вот за этой тулзовиной.

❤‍🔥2

867 views07:35

Forwarded from Denis Sexy IT 🤖

Официальный пресс релиз о GPT 4:
https://openai.com/research/gpt-4

Из интересного, она на вход может принимать картинки, не просто текст 🌚 про параметры я еще не почитал сам

Записаться в API вейтлист можно тоже по ссылке выше.

Кстати, если у вас ChatGPT Plus то вам дадут к ней доступ и так

1.1K views17:12

GPT-4 Developer Livestream
https://www.youtube.com/watch?v=outcGtbnMuQ

GPT-4 Developer Livestream

Join Greg Brockman, President and Co-Founder of OpenAI, at 1 pm PT for a developer demo showcasing GPT-4 and some of its capabilities/limitations.

Join the conversation on Discord here: discord.gg/openai. We'll be taking audience input from #gpt4-demo-suggestions.

1.28K views17:17

Forwarded from эйай ньюз

This media is not supported in your browser

VIEW IN TELEGRAM

ModelScope Text-2-Video: Китайский опенсоурс разродился открытой моделькой для генерации видео по тексту

Это первая диффузионная text2video модель с открытым кодом и опуьликованными весами (1.7 млрд параметров).

Отдельный респект идет Шаттерстоку, данные с которого по всей видимотси использовались для тренировки модели 😂.

Чтобы запустить локально потребуется 16 GB RAM и 16 GB VRAM: инструкция. Пока генерит видео только 256x256.

Ну что, давайте побыстрее заполним интернет проклятыми видео!

Demo
Model weights

@ai_newz

👍4

1.32K views14:43

ML-разработчики, хотите создать что-то действительно уникальное? Присоединяйтесь к IT-команде Сбера и приступайте к работе над русской версией ChatGPT 🖥

Чем предстоит заниматься?

• Довести качество русской версии до ChatGPT и даже обогнать его
• Придумывать и реализовывать новые варианты применения LLM
• Находить решения бизнес-задач с помощью технологии Сбера.

Если у вас есть опыт обучения моделей, знание математики, алгоритмов, а еще вы не боитесь экспериментировать — переходите по ссылке, смотрите все условия и откликайтесь на вакансию 💚

❤1

894 views10:06

Forwarded from эйай ньюз

🚀Dolly 2.0 – первая открытая 12B Chat-LLM, которую можно использовать в коммерческих продуктах

Databricks удивили! Ребята заметили, что все опен-соурсные ChatGPT-клоны либо используют LLaMA, в которой некоммерческая лицензия, либо используют данные, которые запрещают коммерческое использование (как например датасет инструкций от Alpaca, сгенерированный с помощью GPT-3).

В чем преимущество OpenAI перед опен-суорсом, если не брать в расчет размер GPU кластера? В данных. Чтобы дообучить ChatGPT было собрано много качественных диалогов и иструкций от реальных людей, ну, и плюс RL from Human Feedback (RLHF), где люди оценивали ответы языковой модели.

Было решено собрать свой датасет. В Databricks работает ≈5000 человек, их всех и попросили написать вручную несколько семплов для обучения клона ChatGPT. Нужно было составить качественные пары Вопрос-Ответ, либо Инструкция-Ответ, на которых можно было бы добучить опенсоурсную авторегрессионную LLM, которая умеет просто продолжать текст, а не вести диалог. В итоге с помощью пряников в виде бонусов за написание лучших примеров, было собран высококачественный датасет на 15000 семплов!

Далее, они взяли свежу языковую модель Pythia-12B от EleutherAI с MIT лицензией и дообучили на своем датасете, получив Dolly 2.0* которую тоже зарелизили под MIT лицензией вместе с кодом и весами. Разве не прелесть?


generatetext = pipeline(model="databricks/dolly-v2-12b", torchdtype=torch.bfloat16, trustremotecode=True, devicemap="auto")

generatetext("Who is Shcmidhuber?")

Умельцы уже кванитизовали Dolly 2.0 в 4 бита и ускорлили для запуска на CPU. Теперь ждём шага от OpenAssistant, которые по слухам зарелизят свою модел в ближайшие дни.

*Dolly 1.0 была обучена на тех же инструкциях, что и Alpaca.

Блогпост про Dolly 2.0

@ai_newz

👎1

879 views14:31

Forwarded from Machinelearning

📝 An open, billion-scale corpus of images interleaved with text.

MultimodalC4 is a multimodal extension of c4 that interleaves millions of images with text.

Открытый миллиардный корпус изображений, чередующихся с текстом.

🖥

Github: https://github.com/allenai/mmc4

⏩

Paper: https://arxiv.org/abs/2304.06939v1

⭐️

Dataset: https://paperswithcode.com/dataset/c4

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2🔥2👍1

1.03K views11:10

2025/07/12 03:09:42
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.bootg.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>