Бинарная классификация изображений на примере задачи распознавания лиц

Рассматривается практическое применение теоремы о разделимости, утверждающей, что в много- размерных пространствах произвольно выбранная точка этого пространства отделима линейным дискриминантом от любого произвольно выбранного множества точек этого пространства при до- статочно большой размерности. Показано, что «достаточно большой» является размерность больше двадцати. В качестве приложения данной теоремы приводится задача распознавания (бинарной клас- сификации) лиц людей. Используя сверточные нейронные сети, для каждой фотографии лица формиру- ется вектор признаков (в данном случае 128-мерный). Каждый такой вектор можно рассматривать как точку в 128-мерном пространстве. Показано, что, используя теорему о разделимости, можно с вероят- ностью, близкой к единице, отделить лицо одного человека от лиц остальных людей. В качестве дис- криминанта используется линейный дискриминант Фишера, который предоставляет одношаговую процедуру отделения, не требующую предварительного обучения. В результате экспериментов на наборе из 13 233 фотографий была получения точность 0.9980 с полнотой 0,9623.

Авторы: А. М. Голубков

Направление: Информатика и компьютерные технологии

Ключевые слова: Нейронные сети, бинарная классифкация, теорема о разделимости, линейный дискриминант, расстояние Махаланобиса


Открыть полный текст статьи