Практическая работа №10
Тема: Кластерная
обработка данных (карты Кохонена)
Цель:
Научиться использовать метод кластерной обработки данных в виде
самоорганизующихся карт Кохонена».
Практические задания:
Импортируйте
в АП «Deductor» исходные данные из файла
C:\Program\Files\BaseGroup\Deductor\Samples\CreditSample.txt.
Процесс
построения карты Кохонена состоит из 10 этапов.
Запустите
мастер обработки, в котором в разделе «Data Mining» выберете способ обработки данных «Карта Кохонена», нажмите «Далее». В окне настройки назначения
столбцов необходимо обозначить столбцы «Код» и «№ паспорта» как
«Неиспользуемые» (так как значения этих столбцов уникальны, а это не позволит
их классифицировать по общим признакам).
Определите
поле «Давать кредит» как «Выходное».
Пример настройки
назначений столбцов
Настройку
обучающей выборки и параметров карты Кохонена можно
оставить без изменений.
Настройка параметров
карты Кохонена
Настройте
параметры остановки обучения, указав уровень допустимой погрешности, если он
будет превышен, анализ данного множества будет прекращен. Можно оставить
значения «по умолчанию».
Настройка параметров
остановки обучения.
Настройку
параметров обучения также оставьте без изменений. Далее запустите процесс
построения карты Кохонена, нажав кнопку «Пуск».
Итог построения карты
Кохонена
На вкладке «Выбор способа отображения
данных» поставьте галочку напротив пункта «Самоорганизующаяся карта Кохонена». Теперь необходимо провести настройку отображения
карты:
отметьте
разделы «Давать кредит» и «Кластеры» и другие разделы – по желанию.
Настройка отображений
карты Кохонена
Далее задайте имя, метку и описание
карты (по желанию). В результате получатся карты Кохонена,
подобные изображенным на рисунке.
Примеры карт Кохонена
Щелкнув левой клавишей мыши по любому
шестиугольнику на любой карте, выделятся соответствующие ему ячейки на
остальных картах, в том числе на картах «Давать кредит» и «Кластеры». При этом
на шкалах в нижней части карт отобразятся значения соответствующих параметров.
Задание
Выполните
описанные выше действия по построению карт Кохонена.
Проанализируйте результаты, что можно сказать о вероятности возврата кредита
для групп 2, 3 и 4?
Используя
различные отображения карты Кохонена, постройте 3-4
правила выдачи кредитов.
Содержание
отчета
Цель
работы.
Краткое
описание хода работы
Вид
карт Кохонена 4. Ответы на вопросы.
Листинг
программы
Заключение.
Темы рефератов
1.
Способы и методы организации сигнального и аналитического хранилищ данных
2.
СУБД MS SQL Server
Литература
1.
Диго С.М. Проектирование баз данных (учебник).- М.:Финансы и статистика,1988.-
216с.*
2.
Диго С.М. Проектирование и использование баз данных.
Учебник. - М.: Финансы и статистика, 1995 – 208с.