Министерство образования и науки РФ
Федеральное агентство по образованию
Казанский государственный технический университет им. А. Н. Туполева
Барковский С. С. , Захаров В. М. , Лукашов А. М. ,
Нурутдинова А. Р. , Шалагин С. В. Многомерный анализ данных
методами прикладной статистики
Учебное пособие
Под редакцией В. М. Захарова
Рекомендовано к изданию Учебно-методическим центром
КГТУ им. А. Н. Туполева
Казань 2010
2
УДК 519. 23
Барковский С. С. , Захаров В. М. , Лукашов А. М. , Нурутдинова А. Р. , Шала-
гин С. В. Многомерный анализ данных методами прикладной статистики:
Учебное пособие – Казань: Изд. КГТУ, 2010. – 126 с. Табл. 5 . Ил. 105. Библи-
огр. : 12 наим. Излагаются теоретические основы и методика применения методов мно-
гомерного статистического анализа. Рассмотрены методы: кластеризации (кла-
стерный анализ), идентификации (дискриминантный анализ), выявления стати-
стической зависимости (корреляционно-регрессионный анализ) и снижения
размерности многомерного пространства факторов (факторный анализ). Изло-
жение иллюстрируется решением практических задач при использовании ин-
тегрированной системы Statistica 8. 0. Для студентов вузов направления «Информатика и вычислительная тех-
ника», аспирантов, преподавателей и специалистов, занимающихся вопросами
компьютерного моделирования и многопараметрического анализа данных. Рецензенты:
кафедра систем информационной безопасности КГТУ им. А Н, Туполева;
доцент кафедры теоретической кибернетики Казанского государственно-
го университета, к. ф. -м. н. Еникеев А. И. ISBN 978-5-7579-1526-5
© Казанский государственный технический
университет им. А. Н. Туполева, 2010. © Барковский С. С. , Захаров В. М. ,
Лукашов А. М. , Нурутдинова А. Р. ,
Шалагин С. В.
3
СОДЕРЖАНИЕ
Введение ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... . 4
1. Кластерный анализ ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
... ... ... ... . 6
1. 1. Задача кластерного анализа... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 7
1. 2. Меры расстояния между кластерами ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 8
1. 3. Методы кластерного анализа ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... . 10
1. 4. Методика решения задачи при использовании кластерного анализа... ... ... ... ... ... ... ... ... . 19
1. 5. Задания для самостоятельной работы... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 37
2.