Telegram Web Link
Похоже, что Пифия полностью готова к полету в космос
Техника у нас, товарищи, на грани фантастики.
A Geometric Modeling of Occam's Razor in Deep Learning

Почему глубокие нейронные сети (ГНС) выигрывают от очень высокоразмерных пространств параметров? Их огромная сложность по количеству параметров при этом сочетается с впечатляющими результатами на практике, что вызывает особое интерес и не может быть полностью объяснено стандартной теорией выбора модели для обычных моделей. В этой работе предлагается подход, основанный на геометрических и информационно-теоретических идеях, для изучения этого явления. Исходя из предположения, что простота связана с лучшей обобщающей способностью, что подкрепляется теорией минимальной длины описания, целью нашего анализа является исследование и ограничение сложности ГНС. Мы вводим понятие локально меняющейся размерности пространства параметров нейронных сетей, рассматривая число значимых измерений матрицы Фишера, и моделируем пространство параметров как многообразие, используя рамки сингулярной полуримановой геометрии. В результате получаются меры сложности модели, которые позволяют получать короткие описания для моделей глубоких нейронных сетей на основе анализа их сингулярностей, что помогает объяснить их хорошую производительность несмотря на большое число параметров.

https://arxiv.org/abs/1905.11027
Из рубрики «Для эрудитов»

На Юго-западной
Всех вылечим!
2025/07/06 17:03:33
Back to Top
HTML Embed Code: