[QUOTE]Алексей Вячеславович Гуськов пишет:
С теорией там нет никаких проблем.[/QUOTE]
Вот тут есть другое мнение: [URL=https://computeroptics.ru/KO/PDF/KO43-5/430521.pdf]Структурно-функциональный анализ и синтез глубоких конволюционных нейронных сетей[/URL]
[QUOTE]
В качестве таких наиболее важных ограничений возможностей
ГКНС можно отметить следующие:
1) большинство существующих и наиболее
успешных архитектур ГКНС предназначены
для обработки регулярных массивов данных и
не способны работать со сложно структурированными и неоднородными данными;
2) сам процесс конструирования и обучения
ГКНС является сложным, длительным и нестабильным, т.е. не всегда завершается гарантированным успешным результатом.
Первая из указанных проблем является источником критического ограничения нынешней функциональности ГКНС, поскольку именно такие нерегулярные и сложно структурированные данные об
окружающей среде необходимо анализировать в процессе решения задачи управления мобильными объектами в быстро меняющейся обстановке. При этом
ГКНС, приобретающие знания путём обучения на
примерах, должны плотно взаимодействовать с базами данных и знаний (в том числе геопространственных данных), где информация также представлена в
виде графовых структур, вообще говоря, произвольного вида.
Вторая проблема связана с тем, что на сегодняшний день в области глубокого обучения сложилась
классическая ситуация, когда практика намного опережает теорию. Множество научных групп и прикладных разработчиков используют глубокое обучение (Deep Learning) и глубокие конволюционные
нейронные сети (CNN, ГКНС), получают при этом
state-of-the-art результаты, но никакой теории построения и обучения CNN не существует. Есть лишь некоторые наборы стандартных топологий сетей
(AlexNet [1], GoogleNet [2] и т.п.) и рецептов их обучения. Периодически появляются некоторые эвристические новации (например, MFM-пулинг [3]) без
какого-либо теоретического обоснования, и они закрепляются в пуле ходячих рецептов, если дают какие-то полезные результаты. Такой способ развития
аппарата машинного обучения на основе CNN без теоретического обоснования сопряжён с необходимостью перебора конфигураций сети и стратегий обучения при решении каждой конкретной задачи, а для
этого требуется многократно прогонять большие (или
сверхбольшие) объёмы обучающих и тестовых данных через процедуру обучения с использованием
мощных вычислительных кластеров.
Конечно, желательно иметь общую теорию построения и обучения CNN, которая была бы способна
ответить на следующие основные вопросы:
– Какова должна быть сложность CNN для решения задач определённого типа на данных определённой сложности при обучении на выборках определённого размера?
– Как оптимально формировать структуру глубокой сети для конкретных типов задач и конкретных типов данных?
– Как оптимально формировать стратегию обучения глубокой сети для конкретных типов задач
и конкретных типов данных?
– От чего зависит скорость обучения глубокой сети, и как на неё влиять в процессе обучения?
– Как заранее оценить достижимые результаты
некоторой заданной глубокой сети при её обучении в некоторой конкретной задаче (тип
данных, выборка и т.п.)?
– Как предсказать или хотя бы семантически интерпретировать структурные описания, которые порождает глубокая сеть на разных уровнях в результате обучения в некоторой конкретной задаче (тип и характеристики данных,
тип и характеристики выборки и т.п.), т.е. как
превратить CNN из «черного ящика» в «прозрачный»?
К сожалению, никаких предпосылок к созданию
такой теории пока нет. Неясен даже математический
аппарат, который позволил бы вести подобный теоретический анализ поведения таких сложных объектов,
как CNN. Однако это не значит, что всякая систематическая работа по теоретическому анализу и развитию CNN сегодня невозможна. Представляется, что,
напротив, она возможна и даже необходима, но с менее амбициозной целью – не моделировать и предсказывать характеристики и поведение CNN, а систематизировать и обобщать те удачные архитектуры и
«рецепты», о которых шла речь выше. Такую теорию/методику предлагается назвать теорией структурно-функционального анализа и синтеза (СФАС)
глубоких конволюционных нейронных сетей (ГКНС).
СФАС должна ответить на следующие вопросы:
– Из каких типовых структурно-функциональных
элементов (СФЭ) могут строиться глубокие сети?
– Каковы необходимые математические свойства этих элементов, и, соответственно, каковы могут быть их различные алгоритмические
реализации?
– Какие комбинации СФЭ являются допустимыми и эффективными с точки зрения построения
и обучения глубоких сетей?
– Каковы возможные пути построения и обучения
глубоких сетей для анализа и распознавания
нерегулярных, неоднородных или сложно структурированных данных (нерегулярные массивы,
данные различного размера и различной природы, деревья, скелеты, графовые структуры,
2D-, 3D- и ND-облака точек, триангулированные поверхности, аналитические описания
данных и т.п.)? [/QUOTE]