Реферат: Классификация объектов нечисловой природы на основе непараметрических оценок плотности - текст реферата. Скачать бесплатно.
Банк рефератов, курсовых и дипломных работ. Много и бесплатно. # | Правила оформления работ | Добавить в избранное
 
 
   
Меню Меню Меню Меню Меню
   
Napishem.com Napishem.com Napishem.com

Реферат

Классификация объектов нечисловой природы на основе непараметрических оценок плотности

Банк рефератов / Биология

Рубрики  Рубрики реферат банка

закрыть
Категория: Реферат
Язык реферата: Русский
Дата добавления:   
 
Скачать
Microsoft Word, 418 kb, скачать бесплатно
Заказать
Узнать стоимость написания уникального реферата

Узнайте стоимость написания уникальной работы

КЛАССИФИКАЦИЯ ОБЪЕКТОВ НЕЧИСЛОВОЙ ПРИРОДЫ НА ОСНОВЕ НЕПАРАМЕТРИЧЕСК ИХ ОЦ ЕНОК ПЛОТНОСТИ . В СССР в середине 70-х годов актив но ведутся работы по статистическому анализу нечисловых данных [1]. В настоящее время во Всесоюзном центре статистических методов и информатики мы при разработке методических документов и программн ых продуктов п о прикладной статистике делим ее на четыр е части соответственно виду обрабатываемых ст атистических данных : на статистику случайных величин , многомерный статистический анализ , статис тику временных рядов и случайных процессов , статистику объек т ов нечисловой при роды (другими словами , статистику нечисловых д анных ). Вероятностный и статистический анализ н ечисловых данных сопровождали теорию вероятносте й и математическую статистику с самого на чала их развития . Типичными примерами являютс я урновые с хемы и изучение рождаемост и . Испытание Бернулли - вероятностная модель пр остейшего объекта нечисловой природы . Наиболее массовым применением статистических методов яв ляется , видимо , выборочный контроль качества п родукции по альтернативному признаку (т . е . п о признаку "годен” - “не годен "), относящийся , очевидно , к статистике объектов нечисловой природы [2]. Развитие прикладных исследований привело к необходимости рассмотрения в качестве ст атистических данных различных объектов нечислово й природы . Этот терми н применяем к объектам , которые нецелесообразно рассматривать как описанные числами . Другими словами , речь идет об элементах пространства , не являющ ихся линейными (векторными ). Примеры : бинарные о тношения (ранжировки , разбиения , толерантности и т . д .); мн о жества ; нечеткие множес тва ; результаты измерений в шкалах , отличной от абсолютной ; как обобщение перечисленных объектов - элементы пространств общей природы . Для результатов наблюдений , являющихся объектами нечисловой природы , рассматривают [1] классическ и е задачи статистики : описание дан ных (включая классификацию ) оценивание (параметров , характеристик , плотности распределения , регрессио нной зависимости и т . д .). Математический аппарат статистики объектов нечисловой природы основан не на свойств е линейност и пространства , а на примен ении симметрик и метрик в нем , поэтому существенно отличается от классического. В прикладных работах наиболее распростр аненный пример объектов нечисловой природы - р азнотипные данные . В этом случае реальный объект описывается ве ктором , часть коорди нат которого - значения количественных признаков , а часть - качественных (номинальных и порядк овых ). Основная цель настоящего раздела - обосно вать новый подход [3] к классификации в прос транствах произвольной природы , основанный на пос троении не параметрических оценок пло тности распределений вероятности в таких прос транствах [4]. " Пусть - измеримое пространство ,. и . суть -конечн ые меры на ., причем абсолю тно непрерывна относительно , т . е . из равенства . . =0 следует равенство =0, где .. В этом случае на существует неотрицательная измеримая функц ия такая , что для любого Фун кция называется производной Родона-Никодима меры по мере , а в случае , когда - вероят ностная мера , также плотностью вероятности по отношению к . " [5] Будем считать , что в пространстве об ъектов нечисловой природы фиксирована некоторая мера , а мера со ответствует распределению Р случайного эл емента со знаниями в измеримом пространстве , т . е. Если - простр анство из конечного числа точек , то в качестве меры можно использовать считающую меру (приписывающую е диничный вес каждой точке ), т . е . , или В случае счи тающей меры значение плотности в точке совпад ает с вероятностью попасть в точку , т . е . Многие методы классификации используют расстояния или меры близости между объектами или признаками . Та кие методы пригодны и для классификации о бъектов нечисловой природы , лишь бы в соот ветствующем пространстве было опре делено расстояние или мера близости . Таким образом , широко известные иерархические агломеративные алгоритмы ближайшего соседа , дальнего соседа , средней связи и др ., результатом работы ко торых являются дендрограммы , на самом деле относятся к статистике объ е ктов нечисловой природы. Не пытаясь рассмотреть все многообразие методов классификации в статистике объектов нечисловой природы (см ., например , [6, 7]), сосредото чимся на тех из них , которые используют плотности распределения и их оценки . Зная плотности р аспределения классов , можно решать основные задачи классификации - как зад ачи выделения кластеров , так и задачи диаг ностики . В задачах кластер-анализа можно наход ить моды плотности и принимать их за центры кластеров или за начальные точки и терационных мет о дов типа динамических сгущений . В задачах диагностики (дискриминаци и , распознавания образов с учителя ) можно принимать решения о классификации объектов на основе отношения плотностей , соответствующих классам . При неизвестных плотностях представляетс я есте с твенным использовать их со стоятельные оценки . Корректность такой постановки , как правило , нетрудно обосновать , например , в стиле [8]. Таким образом , для переноса на пространства произвольной природы основных м етодов классификации рассматриваемого типа дос т аточно уметь оценивать плотность распределения вероятности в таких пространства х. Методы оценивания плотности вероятности в пространствах общего вида предложен и п ервоначально изучены в [4]. В частности , в за дачах классификации объектов нечисловой природы предлагаем использовать непараметрические ядерные оценки плотности типа Парзена-Розенблатта (этот вид оценок и его название введе ны нами в [4]): , где К : - ядерная функция - выборка по которой оценивается плотностью , - расстояние между эле менто м выборки и точкой , в которой оценивается плотность последовательност ь показателей размытости такова , что при 0 и n , а - нормирующий множитель , обеспечиваю щий выполнение условия Оценки типа Парзена-Розенблатта - частный случай линейных оцено к [4]. В теоретическом плане они выделяются тем , что удается получать результаты тако го же типа , что в классическом одномерном случае ( ), но , разумеется , с помощью совсем иного математического аппарата. Одна из основных идей состоит в том , чтобы согласовать между собой расст ояние и меры . А именно , рассмотрим шары радиуса и их меры Предположим , что как функция п ри фиксированном н епрерывна и строго возрастает . Введем функцию Это - монотонное преобразование расстояния , а потому - метрика или симметрика (т . е . неравенство треугольника может быть не выполнено ), которую , как и , можно рассматривать как меру близости между и . Вв едем . Поскольку определена однозначно , то ^ где ., а потому Переход от к напоминает классическое преобразование , использова нное Н . В . Смирновым , , переводящее случайную величину с непрерывной функцией распределения в случайную величину , равном ерно распределенн ую на [ 0, 1]. Оба рассматрива емых преобразования существенно упрощают дальней шие рассмотрения. Преобразование зависит от точки , ч то не влияет на дальнейшие рассуждения , по скольку ограничиваемся изучением сходимости в точке. Функцию , для которой мера шара ради уса р авна , н азывают [4] естественным показателем различия или естественной метрикой . В случае пространства и евклидовой метрики и меем где -объем шара единичного радиуса в . Поскольку можно записать , что где то переход от к соответствует переходу от к . Выгода от такого перехода заключается в том , что утверждения приобретают более прос тую формулировку. ТЕОРЕМА 1. Пусть - е стественная метрика, Плотность н епрерывна в и ограничена на , причем . Тогда , оценк а явля ется состоятельной , т . е . по вероятности при , Теорем а 1 д оказана в [4]. Однако остается открытым вопрос о скорости сходимости ядерных оценок , т . е . о поведении величины и об оптималь ном выборе показателей размытости . Введем круговое распределение и круговую плотность . ТЕОРЕМА 2. Пусть я дерная функция непрерывна и при . Пусть круговая пл отность допускает раз ложение причем остаточный член равномерно огранич ен [0, 1,...., ]. П усть Тогда Величина до стигает минимума , равного при что совпадает с классическими результатами для (см . [9, с 316]). Заметим , что для уменьшения смещения оценки приходится применять знакопеременные ядра . В случае дискретных пространств естеств енных метрик не существует . Однако можно п олучить аналоги теорем 1 и 2 переходя к пред елу не только по объему выборки , н о и по параметру дискретности . Пусть - последовате льность конечных пространст в , - расстояния в для любо го . Положим , , , Тогда функции кусочно постоянны и имеют скач ки в некоторых точках , причем . ТЕОРЕМА 3. Если при (другими словами , при ), то существует последовательность параметр ов дискретности такая , что при , , справедливы заключения теорем 1 и 2. ПРИМЕР 1. Пространство всех подмножеств конечного множества из э лементов допускает [10, Пар 4. 3] аксиома тическое введение метрики , где - символ симметрической разности множеств . Рассмотрим непараметрическую оценку плотности типа Пар зена - Розенблатта , где - функция нормального стандартного распреде ления . Можно показать , что эта оценка удов летворяет условиям теоремы 3 . ПРИМЕР 2. Рассмотр им пространство фу нкций , определенных на конечном множестве со значениями в конечном м ножестве . Это пространство можно интерпретировать как прос транство нечетких множеств [11]. Очевидно , . Будем использовать расстояние . Непараметрическая оценка плотност и имеет вид : . Если , , то при выполнен ы условия теоремы 3, а потому справедливы т еоремы 1 и 2. . ПРИМЕР 3. Рассматривая пространства ранжирово к о бъект непреов , в качестве расстояния между ранжировками и . Т огда . не стремиться к 0 при ., условия теоремы 3 не выполнены. Пространства разнотипных признаков - это декартово произведение непрерывных и дискретных пространств . Для него возможны различные постановки . Пусть , например , число градаций кач ественных признаков остает ся постоянным . Тогда непараметрическая оценка плотности сводитс я к произведению частоты попадания в точк у в пространстве качественных признаков на классическую оценку Парзена-Розенблатта в прост ранстве количественных переменных . В общем сл учае расстояние можно , например , рассматривать как сумму евклидова расстояния между количественными факторами , расстояния между номинальными признаками ( , если и , если ) и расстояния между порядковыми переменными (если и - н омера градаций ., то . Наличие количественных факторов приводит к непрерывности и строгому возрастанию , а потому для непараметрических оц енок плотности в пространствах разно типны х признаков справедливы теоремы 1 - 3. Литература 1.Орлов А.И . Устойчивость в социально-экон омических моделях.-М.Наука ,1979.-296 с. 2.Орлов А.И . Экспертные оценки / Вопросы кибернетики . Вып .58.-М .: Научный Совет СССР по компле ксной проблеме "Кибернетика ", 1979.С .17-33. 3.Орлов А.И . / Тезисы докладов Четвертой международной Вильнюсской конференции по теори и вероятностей и математической статистике : Т ом 2.-Вильнюс , Вильнюсский госуниверситет , 1985.С .278-280. 4.Орлов А.И . / Анализ нечисловой инфо рмации в социологических исследованиях.-М.Наука , 1985.С .58-92. 5.Орлов А.И . / Статистика . Вероятность . Экон омика.-М.Наука ,1985. С .99-107. 6.Орлов А.И . / Заводская лаборатория . 1987.Т .58. N3.С .90-91. 7.Орлов А.И . /Надежность и контроль ка чества . 1987.N6.С .54-59. 8.Рекомендации . Прикладная статистика . Методы обработки данных . Основные требования и х арактеристики .- М .:ВНИИС ,1987.-64 с. 9.Кривцов В.С ., Фомин В.Н ., Орлов А.И . / Стандарты и качество . 1988.N3.С .32-36. 11.Колмогоров А.Н . Статис тический прие мочный контроль при допустимом числе дефектны х изделий , равном нулю . - Л .: ДНТП , 1951. - 22 с . 12. Гнеденко Б.В . Математика и контроль качества продукции .- М .: Знание , 1978. - 64 с . 13. Беляев Ю.К . Вероятностные методы выборо чного контроля.- М .: Наука , 1975. - 408 с. 14. Лумельский Я.П . Статистические оценки р езультатов контроля качества . - М .: Из-во стандар тов , 1979. - 200 с . 15. Орлов А.И . Современные проблемы киберне тики : Прикладная статистика . - М .: Знание , 1981. с 3-14. 16. Статистичес кие методы анализа экс пертных оценок / Ученые записки по статистике , т . 29, -М .: Наука , 1977-384 с . 17. 17.Экспертные оценки в системных исследов аниях / Сборник трудов . - Вып . 4. - М .: ВНИИСИ , 1970 - 120 с . 18. Экспертные оценки / Вопросы кибернетики . - В ып . 58. - М .: Научный Совет АН СССР по комплексной проблеме / "Кибернетика ". 1979. - 200 с.
1Архитектура и строительство
2Астрономия, авиация, космонавтика
 
3Безопасность жизнедеятельности
4Биология
 
5Военная кафедра, гражданская оборона
 
6География, экономическая география
7Геология и геодезия
8Государственное регулирование и налоги
 
9Естествознание
 
10Журналистика
 
11Законодательство и право
12Адвокатура
13Административное право
14Арбитражное процессуальное право
15Банковское право
16Государство и право
17Гражданское право и процесс
18Жилищное право
19Законодательство зарубежных стран
20Земельное право
21Конституционное право
22Конституционное право зарубежных стран
23Международное право
24Муниципальное право
25Налоговое право
26Римское право
27Семейное право
28Таможенное право
29Трудовое право
30Уголовное право и процесс
31Финансовое право
32Хозяйственное право
33Экологическое право
34Юриспруденция
 
35Иностранные языки
36Информатика, информационные технологии
37Базы данных
38Компьютерные сети
39Программирование
40Искусство и культура
41Краеведение
42Культурология
43Музыка
44История
45Биографии
46Историческая личность
47Литература
 
48Маркетинг и реклама
49Математика
50Медицина и здоровье
51Менеджмент
52Антикризисное управление
53Делопроизводство и документооборот
54Логистика
 
55Педагогика
56Политология
57Правоохранительные органы
58Криминалистика и криминология
59Прочее
60Психология
61Юридическая психология
 
62Радиоэлектроника
63Религия
 
64Сельское хозяйство и землепользование
65Социология
66Страхование
 
67Технологии
68Материаловедение
69Машиностроение
70Металлургия
71Транспорт
72Туризм
 
73Физика
74Физкультура и спорт
75Философия
 
76Химия
 
77Экология, охрана природы
78Экономика и финансы
79Анализ хозяйственной деятельности
80Банковское дело и кредитование
81Биржевое дело
82Бухгалтерский учет и аудит
83История экономических учений
84Международные отношения
85Предпринимательство, бизнес, микроэкономика
86Финансы
87Ценные бумаги и фондовый рынок
88Экономика предприятия
89Экономико-математическое моделирование
90Экономическая теория

 Анекдоты - это почти как рефераты, только короткие и смешные Следующий
Давайте уже 2016, с этим 2015 уже всё ясно.
Anekdot.ru

Узнайте стоимость курсовой, диплома, реферата на заказ.

Обратите внимание, реферат по биологии "Классификация объектов нечисловой природы на основе непараметрических оценок плотности", также как и все другие рефераты, курсовые, дипломные и другие работы вы можете скачать бесплатно.

Смотрите также:


Банк рефератов - РефератБанк.ру
© РефератБанк, 2002 - 2016
Рейтинг@Mail.ru