Telegram Web Link
Code Mining pinned a photo
Семинары-семинары!

Помимо радостной новости про Datafest, в ближайшие две недели будет ещё пара интересных семинаров от JetBrains Research, ICTL.


3 июня, 2022 (пятница)
Evolutionary Intelligence for automated test generation

О современных методах и подходах к автоматической генерации тестов.

Спикер: Pouria Derakhshanfar (TU Delft)

Тезисы & регистрация: https://www.meetup.com/ictl-seminar/events/286112645/


10 июня, 2022 (пятница)
Software readability

О сложностях и методах измерения читаемости исходного кода и почему эту метрику не надо путать со сложностью программ.

Спикер: Kirill Bochkarev (JetBrains Research, ICTL)

Тезисы & регистрация: https://www.meetup.com/ictl-seminar/events/286258310/


Рекомендуем посетить, темы отличные!
🔥4
Code Mining
Data Fest Online 3.0 🎉🎉🎉 Абсолютно внезапная для многих новость-молния, в конце недели стартует Data Fest Online, аж 3.0 версии уже. Важное, ODS переезжает из Slack в [Matrix] и сообществу предстоит приличное обновление. Об этом всём мы узнаем 4 июня, где…
Па-бам!

Датафест стартует уже через пару минут.

Следить за стримом можно здесь: https://www.youtube.com/watch?v=7A7UviE-rBg

В 13:00 будет пара слов про наш замечательный кодмайнинг и что вообще происходит, а потом, в Spatial.Chat мы проведем наши знаменитые Собеседования в Никуда в золотом составе менторов :)

О том, как подключаться к эпическому нетворкингу на целый день можно почитать здесь, а его расписание — тут.

До встречи!
👍31
Code Mining pinned «Па-бам! Датафест стартует уже через пару минут. Следить за стримом можно здесь: https://www.youtube.com/watch?v=7A7UviE-rBg В 13:00 будет пара слов про наш замечательный кодмайнинг и что вообще происходит, а потом, в Spatial.Chat мы проведем наши знаменитые…»
StackOverflow Developer Survey 2022

Тут у StackOverflow вышел обзорчик очередной. Какждый в нем найдет своё, но увлекательно посмотреть как смещается фокус у начинающих и профиков, как с точки зрения языков, так и тулинга. Также довольно интересно посмотреть, кто куда смотрит из своего огорода с точки зрения дополнительных навыков.

Облистаться тут: https://survey.stackoverflow.co/2022.
👍4
OpenSource & BugBounty

Если вы вдруг хотели попробовать позаниматься вопросами безопасности, но ваши проекты почему-то не устраивают, то в этом может помочь сервис баг баунти программ huntr.dev, который нацелен строго на Open Source.

Целая платформа и сообщество посвященное поиску уязвимостей в Open Source-пакетах. Можно поднять $$$ за найденные артефакты. Там и лидерборды и возможность пообщаться.

Есть много мировых и не только баг баунти программ, но если вы вдруг знаете именно про Open Source пакеты, будем признательны за коммент.

hackerone не предлагать ;)
🔥5
Последние месяцы мы не очень много чего писали в канал, но будем обязательно исправляться. А пока поделимся результатами последней "работы на конференциях", в рамках пропаганды композиционного анализа программного обеспечения, коим мы активно занимаемся у себя в компании :).
Forwarded from CodeScoring Updates
Наши последние выступления

А пока мы готовим очередной релиз, предлагаем посмотреть наши последние доклады о проблематике композиционного анализа программного обеспечения (да-да, тот самый Software Composition Analysis).

Highload Foundation
Безопасность цепочки поставки Open Source-компонентов
Видео | Презентация

PHDays 11
Актуальные вызовы композиционному анализу ПО
Видео | Презентация

DevOpsConf 2022
Protestware. Как много в этом слове!
Видео | Презентация
🔥5
Diagram as Code for prototyping cloud system architectures

Полезная библиотека/утилита для отрисовки архитектур на python.

Целевая аудитория — архитекторы облачных сервисов, но применимо, мягко говоря, везде, где надо рисовать и версионировать диаграммы. Под капотом Graphviz.

В библиотеке реализована поддержка отображения иконок большинства облачных провайдеров (AWS, Azure, GCP, Kubernetes, DO, OpenStack, Elastic и пр.), также есть набор пиктограмм для отрисовки Flowchart-диаграмм и возможность поставить свои изображения.

Больше примеров.

Сам проект живет здесь:
https://github.com/mingrammer/diagrams.
👍5🔥1
GPT-3 пытается объяснить код

Увлекающий сознание многих Copilot построен на OpenAI Codex, потомке авторегрессионной генеративной модели GPT-3. А что будет если скормить исходники самой GPT-3?

Саймон Уиллисон попробовал и получил (внезапно!) неплохие результаты. Примеры для python & javascript. Вы можете попробовать самостоятельно.

Понятное дело, что именно осмысления машиной здесь нет, только объяснение конструкций, но вот как раз эта функция возможно и была бы полезна самым начинающим разработчикам.
🔥3
BLOOM — autoregressive Large Language Model (LLM)

Не успели мы написать о том как GPT-3 умеет из коробки объяснять код, так вот ещё новость приехала. В открытый доступ выложена новая авторегрессионная мультиязыковая модель BLOOM, BigScience Language Open-science Open-access Multilingual.

https://huggingface.co/bigscience/bloom

И это действительно выглядит как тектонический сдвиг, потому как это первая открытая LLM (176 млрд. параметров) обученная в условиях полной прозрачности.

Что внутри:
- 46 естественных языков
- 13 языков программирования

Немного статистики:
> 900 исследователей
> 50 стран участниц
> 3 мес. обучения (Jean Zay Public Supercomputer)

Про датасет | про железо.

Контекст работы с кодом нам интересен особенно, конечно.

Говорят, что есть: Java, PHP, C, C++, Python, JavaScript, C#, Ruby, Lua, GO, TypeScript, Scala, Rust... perl'a нет ;)

Осталось только добраться и пощупать. Кто у нас тут недавно YaLM 100B поднимал?

PS. Обратим внимание, что модель лицензирована BigScience Responsible AI License v 1.0 (RAIL), которая носит разрешительный характер "при стремлении к ответственному использованию Модели". Вобщем, нужно ещё покурить подробности того, что авторы подразумевают под отвестственным использованием.
1👍1
Если DOOM в Grafana, показался слишком простым, то можно насладиться вот такой 🔥 новостью:
Forwarded from Denis Sexy IT 🤖
This media is not supported in your browser
VIEW IN TELEGRAM
Щас будет сложна, но теперь DOOM можно запустить в DOOM, чтобы играть в DOOM прямо внутри DOOM.

Наконец человечество дошло до сингулярность — после адаптации DOOM под тесты на беременность и прочие калькуляторы, мы пришли к тому, что DOOM запускает сам себя, это как придти туда, откуда вышли.

Ютубер и по совместительству кодер под ником Kgsws использовал уязвимость DOS-версии Doom II, которая заставляет запускать Chocolate Doom (современный порт игры, совместимый с оригинальной DOS-версией игры) внутри оригинала в виде анимированной текстуры.

Если прям совсем технически, то чувак наткнулся на команду «SpawnMapThing», обычно используемую для размещения оружия, врагов и т. д. на уровнях. Определенная часть кода, которая определяет в каком состоянии находится предмет или враг, может быть заменена исполняемым фалом, как например DOS-версии Doom.

Пройдя по тёмным коридорам и убив пару импов, ты садишься в комнату с приглушённым светом, отключаешь HUD. и погружаешься в doom-метаверс.

Код здесь.
🤯6👍1🔥1
The Good, the Bad, and the Ugly: Mining for Patterns in Student Source Code

Многие "серийные" преподаватели наверняка задавались вопросом как бы так сэкономить время на проверку студентческих решений. И мы знаем, что у многих есть свои наработки, и измерить цикломатическую сложность и дубликаты поискать и т. п.

Исследователи из Бельгии порешали эту задачку представив применение их алгоритма FREQTALS, который анализирует абстрактные синтаксические деревья (AST) и находит паттерны плохой разработки.

Все примеры для Python, но авторы думают расшириться на Java, Cobol & C#.

Статья здесь.
🔥5👍2
Process Mining Handbook

Для всех, кто увлекается сабжем. Спрингер открыл свободный доступ Process Mining Handbook. Книга которая должна дать должное погружение для всех желающих и сочувствующих области.

На пяти сотнях страниц изложены основные топики и современные подходы к анализу процессов:
- Process Discovery
- Conformance Checking
- Data Preprocessing
- Process Enhancement and Monitoring
- Assorted Process Mining Topics
- Industrial Perspective and Applications

Забирать здесь.
🔥4
Data Fest Siberia 3 CFP 🎉

Внезапный па-бам! 💣💣💣

Первый ОФФЛАЙН Data Fest Siberia 3 после доооолгого перерыва. Пройдет в Новосибирске в Академгородке 8 октября.

Code Mining будет там, ждем ваших заявок!

Темы секций:
- Reliable ML (Interpretable ML, Causal Inference, A/B testing, ML System Design)
- NLP
- MLOps
- Code Mining
- ML & Security
- LeanDS / DS Processes & Teamleading
- CV
- Open Source
- Medicine
- Process Mining
- ML Trainings

Интерактивы и нетворкинговые активности
- Собеседования в никуда
- Проекты участников
- DS Career панель
- Unconference

Страница конференции.

Подать заявку в форме, если есть что обсудить/уточнить (сомневаетесь, нужен совет и т.п.), то писать @alsmirn.

До встречи на фесте!
6🎉4
PyData Meetup @SPb

И мы продолжаем анонсы предстоящих событий с нашим участием.

В эту субботу, в Санкт-Петербурге пройдет собрание сообщества PyData SPb (@pydata_spb).

Тезисы от организаторов:
На сей раз мы поговорим про питонопакеты и безопасность, про структуры данных и низкий уровень, а также про бигдату. И, возможно, опробуем пару более компанейских форматов.

Собственно "про питонопакеты и безопасность" мы и расскажем.

17 сентября, старт в 17:00 @failoverbar.

Участие бесплатное, регистрация приветствуется.
👍5
Energy Efficiency across Programming Languages

Увлекательное и довольно очевидное по выводам исследование опубликовали коллеги из Португалии в 2017 году.

Рецепт прост: взяли 27 языков, взяли приличный список программ для замера эффективности исполнения (потребление энергии, время, ресурсы памяти), свели результаты в таблички.

Конечно не без выводов, но таблица как бы намекает ;)

Насладиться научным подходом можно здесь.

ЗЫ: только тссс, зелёным не говорите, а то ещё с забастовками против Python будут выходить.
😁8👎1
2025/07/11 18:23:35
Back to Top
HTML Embed Code: