Лабораторная работа
№15. Классификация данных.
Цель работы. Целью
данной лабораторной работы является исследование способности нейронной сети
решать задачи классификации. Сеть необходимо обучить классификации по пяти
классам по 10-20 числовым признакам. Используемая модель: одномерная сеть
Кохонена.
Теория. Задача классификации заключается в
идентификации объекта и отнесении его к одному из нескольких множеств. При этом
задача классификации предполагает, что множества попарно не пересекаются.
Применительно к нейронным сетям задачу классификации можно поставить следующим
образом: пусть имеется N множеств D1,D2…Dn признаков объектов. Сеть обучается на парах векторов X и
Y, где: X = (x1,x2…xm) – входной вектор признаков; Y
= (y1,y2…yn) = C(X) – выходной вектор,
классифицирующий вектор X. При этом возможно несколько случаев:
1.
Y = k,
классификатор имеет скалярный характер. k – порядковый номер множества, к
которому относится X.
2.
Y = (y1,y2 …yk … yn).
При этом только yk=1, остальные компоненты вектора
равны 0. Таким образом работает звено Кохонена
3.
Y = (y1,y2 … yn). При этом каждая компонента
yk характеризует степень принадлежности к множеству Dk. В режиме нормального функционирования сеть по входному
вектору X выдает вектор Z по правилам, аналогичным описанным для векторов Y.
Точность решения определяется статистикой: сколько раз вектор Z правильно
классифицировал объект с признаками X, соотнося его с той или иной группой Dk. Для пункта 3 возможно вычисление погрешности, при
наличии функции-скаляризатора степени принадлежности
вектора X к множествам Dk. Задача может быть
дополнена введением «шума», однако смысл от этого не изменится. Шум лишь
изменит границы областей D1…Dn.
Для решения задачи
классификации с линейной и нелинейной разделимостью классов используются
классические модели нейронных сетей: многослойный персептрон и рекуррентные
сети на его основе, радиально-базисные сети, сети Кохонена, гибридные сети,
рекуррентные самоорганизующиеся сети. При наложении множества объектов друг на
друга, то задача классификации становится более общей и предполагает, что
объект характеризуется степенью принадлежности к тому или иному множеству, то
есть имеет место задача классификации с вероятностной разделимостью
классов.
Ход работы:
1.
Необходимо
выбрать предметную область, отобрать не менее 10 числовых характеристик
объектов и задать их диапазоны.
2.
Сгенерировать
обучающую выборку размерностью от 10 до 20 примеров для каждого класса.
Предусмотреть нормализацию входных векторов.
3. Написать программу, имитирующую работу нейронной сети Кохонена
4.
Провести
обучение сети Кохонена по алгоритму
Кохонена с прямоугольным соседством.
5.
Исследовать
эффективность алгоритмов обучения
от значения
коэффициента обучения.
6.
Исследовать
зависимость погрешности классификации от алгоритма обучения.
7.
Исследовать
зависимость погрешности классификации от объёма обучающей выборки.
8.
Исследовать
зависимость погрешности классификации от числа итераций обучения.
Cодержание отчета:
1.
Цель
лабораторной работы.
2.
Краткое
описание хода работы.
3.
Файл обучающей выборки.
4.
Результатов
работы нейросетевого клссификатора Выводы
по результатам работы.
5.
Ответы
на вопросы.
6.
Ответы
на вопросы.
Вопросы:
1.
В чем
суть классификации данных?
2.
Отличие
классификации от кластеризации.
3.
Какие
существуют методы классификации кроме нейросетевого?
4.
Целесособразность применения нейросетевого метода
для лссификации данных.
5.
Как
определяется погрешность классификации?