Реферат: Регрессионный анализ в моделировании систем. Исследование посещаемости WEB сайта - текст реферата. Скачать бесплатно.
Банк рефератов, курсовых и дипломных работ. Много и бесплатно. # | Правила оформления работ | Добавить в избранное
 
 
   
Меню Меню Меню Меню Меню
   
Napishem.com Napishem.com Napishem.com

Реферат

Регрессионный анализ в моделировании систем. Исследование посещаемости WEB сайта

Банк рефератов / Математика

Рубрики  Рубрики реферат банка

закрыть
Категория: Реферат
Язык реферата: Русский
Дата добавления:   
 
Скачать
Microsoft Word, 160 kb, скачать бесплатно
Заказать
Узнать стоимость написания уникального реферата

Узнайте стоимость написания уникальной работы

Содержание Теоретическая часть работы 3 Основные задачи корреляционно-регрессионного анализа 3 Корреляция случайных величин 4 Линейная регрессия 5 Оценка существенности связи, принятие решения на основе уравнения регрессии. 10 Практическая часть работы 11 1. Описание объекта 11 2. Факторы формирующие моделируемое явление 12 3. Анализ матрицы коэффициентов парных корреляций 13 4. Построение уравнения регрессии 13 5. Смысл модели 15 Литература 16 Теоретическая часть работы Основные задачи корреляционно-регрессионного анализа Все явления и процессы, характеризующие социально-экономическое развитие и составляющие единую систему национальных счетов, тесно взаимосвязаны и взаимозависимы между собой. В статистике показатели, характеризующие эти явления, могут быть связаны либо корреляционной зависимостью, либо быть независимыми Корреляционная зависимость является частным случаем стохастиче¬ской зависимости, при которой изменение значений факторных признаков (х 1 х2 ..., хn ) влечет за собой изменение среднего значения результативно¬го признака. Корреляционная зависимость исследуется с помощью методов корре-ляционного и регрессионного анализов. Корреляционный анализ изучает взаимосвязи показателей и позволяет решить следующие задачи. 1. Оценка тесноты связи между показателями с помощью парных, ча-стных и множественных коэффициентов корреляции 2. Оценка уравнения регрессии. Основной предпосылкой применения корреляционного анализа явля-ется необходимость подчинения совокупности значений всех факторных (х1 х2 .... хn) и результативного (У) признаков r-мерному нормальному закону распределения или близость к нему. Если объем исследуемой сово-купности достаточно большой ( n > 50), то нормальность распределения может быть подтверждена на основе расчета и анализа критериев Пирсо¬на, Боярского, Колмогорова, чисел Вастергарда и т. д. Если n < 50, то закон распределения исходных данных определяется на базе построения и визуального анализа поля корреляции. При этом если в рас¬положении точек имеет место линейная тенденция, то можно предполо¬жить, что совокупность исходных данных подчиняется нормальному распределению. Целью регрессионного анализа является оценка функциональной за-висимости условного среднего значения результативного признака (У) от факторных (х1. Х2..., хn). Основной предпосылкой регрессионного анализа является то, что толь¬ко результативный признак (У) подчиняется нормальному закону распре-деления, а факторные признаки х1. Х2..., хn могут иметь произвольный закон распределения. В анализе динамических рядов в качестве фактор-ного признака выступает время t При этом в регрессионном анализе зара-нее подразумевается наличие причинно-следственных связей между ре-зультативным (У) и факторными х1. Х2..., хn признаками. Уравнение регрессии, или статистическая модель связи социально-эко-номических явлений, выражаемая функцией Y=f(х1. Х2..., хn) является достаточно адекватным реальному моделируемому явлению или процессу в случае соблюдения следующих требований их построе¬ния. 1. Совокупность исследуемых исходных данных должна быть одно-родной и математически описываться непрерывными функциями. 2. Возможность описания моделируемого явления одним или несколь-кими уравнениями причинно-следственных связей. 3. Все факторные признаки должны иметь количественное (цифровое) выражение. 4. Наличие достаточно большого объема исследуемой выборочной со-вокупности. 5. Причинно-следственные связи между явлениями и процессами сле-дует описывать линейной или приводимой к линейной формой зависимо-сти. 6. Отсутствие количественных ограничений на параметры модели свя-зи. 7. Постоянство территориальной и временной структуры изучаемой совокупности. Соблюдение данных требований позволяет исследователю построить статистическую модель связи, наилучшим образом аппроксимирующую моделируемые социально-экономические явления и процессы. Корреляция случайных величин Прямое токование термина корреляция — стохастическая, вероятная, возможная связь между двумя (парная) или несколькими (множественная) случайными величинами. Для числовой оценки возможной связи между двумя случайными величинами: Y(со средним My и среднеквадратичным отклонением Sy) и — X (со средним Mx и среднеквадратичным отклонением Sx) принято использовать так называемый коэффициент корреляции Rxy= . Этот коэффициент может принимать значения от -1 до +1 — в зависимости от тесноты связи между данными случайными величинами. Если коэффициент корреляции равен нулю, то X и Y называют некоррелированными. Считать их независимыми обычно нет оснований — оказывается, что существуют такие, как правило — нелинейные связи величин, при которых Rxy = 0, хотя величины зависят друг от друга. Обратное всегда верно — если величины независимы, то Rxy = 0. Но, если модуль Rxy = 1, то есть все основания предполагать наличие линейной связи между Y и X. Именно поэтому часто говорят о линейной корреляции при использовании такого способа оценки связи между СВ. В отдельных случаях приходится решать вопрос о связях нескольких (более 2) случайных величин или вопрос о множественной корреляции. Пусть X, Y и Z - случайные величины, по наблюдениям над которыми мы установили их средние Mx, My,Mz и среднеквадратичные отклонения Sx, Sy, Sz. Тогда можно найти парные коэффициенты корреляции Rxy, Rxz, Ryz по приведенной выше формуле. Но этого явно недостаточно - ведь мы на каждом из трех этапов попросту забывали о наличии третьей случайной величины! Поэтому в случаях множественного корреляционного анализа иногда требуется отыскивать т. н. частные коэффициенты корреляции — например, оценка виляния Z на связь между X и Y производится с помощью коэффициента Rxy.z = И, наконец, можно поставить вопрос — а какова связь между данной СВ и совокупностью остальных? Ответ на такие вопросы дают коэффициенты множественной корреляции Rx.yz, Ry.zx, Rz.xy, формулы для вычисления которых построены по тем же принципам — учету связи одной из величин со всеми остальными в совокупности. На сложности вычислений всех описанных показателей корреляционных связей можно не обращать особого внимания - программы для их расчета достаточно просты и имеются в готовом виде во многих ППП современных компьютеров. Например программное обеспечение «Олимп» с помощью которого производится ряд расчетов в этой работе. Линейная регрессия В тех случаях, когда из природы процессов в модели или из данных наблюдений над ней следует вывод о нормальном законе распределения двух СВ - Y и X, из которых одна является независимой, т. е. Y является функцией X, то возникает соблазн определить такую зависимость “формульно”, аналитически. В случае успеха нам будет намного проще вести моделирование. Конечно, наиболее заманчивой является перспектива линейной зависимости типа Y = a + b•X . Подобная задача носит название задачи регрессионного анализа и предполагает следующий способ решения. Выдвигается следующая гипотеза: H0: случайная величина Y при фиксированном значении величины X распределена нормально с математическим ожиданием My = a + b•X и дисперсией Dy, не зависящей от X. При наличии результатов наблюдений над парами Xi и Yi предварительно вычисляются средние значения My и Mx, а затем производится оценка коэффициента b в виде b = = Rxy что следует из определения коэффициента корреляции. После этого вычисляется оценка для a в виде {2 - 16} и производится проверка значимости полученных результатов. Таким образом, регрессионный анализ является мощным, хотя и далеко не всегда допустимым расширением корреляционного анализа, решая всё ту же задачу оценки связей в сложной системе. Теперь более подробно рассмотрим множественную или многофакторную регрессию. Нас интересует только линейная модель вида: Y=A0+A1X1+A2X2+…..AkXk. Изучение связи между тремя и более связанными между собой признаками носит название множественной (многофакторной) регрессии. При исследовании зависимостей методами множественной регрессии задача формулируется так же, как и при использовании парной регрессии, т. е. требуется определить аналитическое выражение связи между результатив¬ным признаком (У) и факторными признаками (х1 х2, х3 ..., хn) найти функ¬цию: Y=f(х1. Х2..., хn) Построение моделей множественной регрессии включает несколько этапов: • выбор формы связи (уравнения регрессии): • отбор факторных признаков: • обеспечение достаточного объема совокупности для получения не-смещенных оценок. Рассмотрим подробнее каждый из них. Выбор формы связи затрудняется тем, что, используя математический аппарат, теоретически зависимость между признаками может быть выражена большим числом различных функций. Выбор типа уравнения осложнен тем, что для любой формы зависимости выбирается целый ряд уравнений, которые в определенной степени будут описывать эти связи. Некоторые предпосылки для выбора опреде¬ленного уравнения регрессии получают на основе анализа предшествую¬щих аналогичных исследований или на базе анализа подобных работ в смежных отраслях знаний. Поскольку уравнение регрессии строится глав¬ным образом для объяснения и количественного выражения взаимосвя¬зей, оно должно хорошо отражать сложившиеся между исследуемыми факторами фактические связи, Наиболее приемлемым способом определения вида исходного уравнения регрессии является метод перебора различных уравнений. Сущность данного метода заключается в том, что большое число уравнений (моделей) регрессии, отобранных для описания связей какого-либо социально-экономического явления или процесса, реализуется на ЭВМ с помощью специально разработанного алгоритма перебора с последующей статистической проверкой, главным образом на основе t-крнтерия Стьюдeнта и F-критерия Фишера. Способ перебора является достаточно трудоемким и связан с большим объемом вычислительных работ. Практика построения многофакторных моделей взаимосвязи показы¬вает, что все реально существующие зависимости между социально-эко¬номическими явлениями можно описать, используя пять типов моделей: 1. линейная: Y=A0+A1X1+….AkXk 2. степенная 3. показательная 4. параболическая 5. гиперболическая Основное значение имеют линейные модели в силу простоты и логичности их экономической интерпретации. Нелинейные формы зависимо¬сти приводятся к линейным путем линеаризации. Важным этапом построения уже выбранного уравнения множествен-ной регрессии являются отбор и последующее включение факторных при-знаков. Сложность формирования уравнения множественной регрессии заклю¬чается в том, что почти все факторные признаки находятся в зависимости один от другого. Проблема размерности модели связи, т. е. определение оптимального числа факторных признаков, является одной из основных проблем построе¬ния множественного уравнения регрессии. С одной стороны, чем больше факторных признаков включено в уравнение, тем оно лучше описывает явление. Однако модель размерностью 100 и более факторных признаков сложно реализуема и требует больших затрат машинного времени. Сокращение размерности модели за счет исключения второстепенных, эконо¬мически и статистически несущественных факторов способствует простоте и качеству ее реализации. В то же время построение модели регрессии малой размерности может привести к тому, что такая модель будет недос¬таточно адекватна исследуемым явлениям и процессам. Проблема отбора факторных признаков для построения моделей взаи-мосвязи может быть решена на основе эвристических или многомерных статистических методов анализа. Метод экспертных оценок как эвристический метод анализа основ-ных макроэкономических показателей, формирующих единую междуна- , родную систему расчетов, основан на интуитивно-логических предпосыл-ках, содержательно-качественном анализе. Анализ экспертной информации проводится на базе расчета и анализа непараметрических показателей связи: ранговых коэффициентов корреляции Спирмена, Кендалла и конкордации . Наиболее приемлемым способом отбора факторных признаков являет¬ся шаговая регрессия (шаговый регрессионный анализ). Сущность мето¬да шаговой регрессии заключается в последовательном включении фак¬торов в уравнение регрессии и последующей проверке их значимости. Факторы поочередно вводятся в уравнение так называемым "прямым ме-тодом". При проверке значимости введенного фактора определяется, на-сколько уменьшается сумма квадратов остатков и увеличивается величина множественного коэффициента корреляции . одновременно используется и обратный метод, т.е. , исключение факторов, ставших незначимы¬ми на основе t-критерия Стьюдента. Фактор является незначимым, если его включение в уравнение регрессии только изменяет значение коэффи-циентов регрессии, не уменьшая суммы квадратов остатков и не увеличивая их значения. Если при включении в модель соответствующего факторного признака величина множественного коэффициента корреляции увеличивается, а коэффициент регрессии не изменяется (или меняется несу¬щественно), то данный признак существен и его включение в уравнение регрессии необходимо. Если же при включении в модель факторного признака коэффициенты регрессии меняют не только величину, но и знаки, а множественный коэффициент корреляции не возрастает, то данный факторный признак при¬знается нецелесообразным для включения в модель связи. Сложность и взаимное переплетение отдельных факторов, обусловли-вающих исследуемое экономическое явление (процесс), могут проявлять-ся в так называемой мультиколлинеарности. Под мультиколлинеарностью понимается тесная зависимость между факторными признаками, включенными в модель. Наличие мультиколлинеарности между признаками приводит к: • искажению величины параметров модели, которые имеют тенденцию к завышению; • изменению смысла экономической интерпретации коэффициентов рег¬рессии; . слабой обусловленности системы нормальных уравнений; . осложнению процесса определения наиболее существенных фактор-ных признаков. Одним из индикаторов определения наличия мультиколлинеарности между признаками является превышение парным коэффициентом корре-ляции величины 0,8 . Устранение мультиколлинеарности может реализовываться через ис-ключение из корреляционной модели одного или нескольких линейно-свя-занных факторных признаков или преобразование исходных факторных признаков в новые, укрупненные факторы. Вопрос о том, какой из факторов следует отбросить, решается на осно¬вании качественного и логического анализов изучаемого явления. Качество уравнения регрессии зависит от степени достоверности и надежности исходных данных и объема совокупности. Исследователь дол-жен стремиться к увеличению числа наблюдений, так как большой объем наблюдений является одной из предпосылок построения адекватных ста-тистических моделей. Аналитическая форма выражения связи результативного признака и ряда факторных называется многофакторным (множественным) уравне-нием регрессии, или моделью связи. Уравнение линейной множественной регрессии имеет вид: Y=A0+A1X1+….AkXk Коэффициенты Аn вычисляются при помощи систем нормальных уравнений. Например система нормальных уравнений для вычисления коэффициентов регрессии для уравнения линейной регрессии с двумя факторными признаками: где An=an Общий вид нормальных уравнений для расчета коэффициентов регрессии: Оценка существенности связи, принятие решения на основе уравнения регрессии. Проверка адекватности моделей, построенных на основе уравнений регрессии, начинается с проверки значимости каждого коэффициента регрессии. Значимость коэффициентов регрессии осуществляется с помощью t-критерия Стьюдента: - дисперсия коэффициента регрессии. Параметр модели признается статистически значимым, если tp>tкр Наиболее сложным в этом выражении является определение диспер¬сии, которая может быть рассчитана двояким способом. Наиболее простой способ, выработанный методикой экспериментиро-вания, заключается в том, что величина дисперсии коэффициента регрес-сии может быть приближенно определена по выражению: - дисперсия результативного признака: k - число факторных признаков в уравнении. Наиболее сложным этапом, завершающим регрессионный анализ, яв-ляется интерпретация уравнения, т. е. перевод его с языка статистики и математики на язык экономиста. Интерпретация моделей регрессии осуществляется методами той от-расли знаний, к которой относятся исследуемые явления. Но всякая ин-терпретация начинается со статистической оценки уравнения регрессии в целом и оценки значимости входящих в модель факторных признаков, т. е. с выяснения, как они влияют на величину результативного признака. Чем больше величина коэффициента регрессии, тем значительнее влия¬ние данного признака на моделируемый. Особое значение при этом имеет знак перед коэффициентом регрессии. Знаки коэффициентов регрессии говорят о характере влияния на результативный признак. Если факторный признак имеет знак плюс, то с увеличением данного фактора результатив¬ный признак возрастает; если факторный признак со знаком минус, то с его увеличением результативный признак уменьшается. Интерпретация этих знаков полностью определяется социально-экономическим содержанием моделируемого (результативного) признака. Если его величина изменяется в сторону увеличения, то плюсовые знаки факторных признаков имеют положительное влияние. При изменении результативного призна-л-1 в сторону снижения положительное значение имеют минусовые знаки факторных признаков. Если экономическая теория подсказывает, что факторный признак должен иметь положительное значение, а он со знаком минус, то необходимо проверить расчеты параметров уравнения регрессии. Такое явление чаще всего бывает в силу допущенных ошибок при решении. Однако следует иметь в виду, что при анализе совокупного влия¬ния факторов, при наличии взаимосвязей между ними характер их влия¬ния может меняться. Для того чтобы быть уверенным, что факторный признак изменил знак влияния, необходима тщательная проверка решения данной модели, так как часто знаки могут меняться в силу допустимых ошибок при сборе или обработке информации. При адекватности уравнения регрессии исследуемому процессу воз-можны следующие варианты. 1. Построенная модель на основе ее проверки по F-критерию Фишера в целом адекватна, и все коэффициенты регрессии значимы. Такая модель может быть использована для принятия решений к осуществлению про-гнозов. 2. Модель по F-критерию Фишера адекватна, но часть коэффициентов регрессии незначима. В этом случае модель пригодна для принятия неко-торых решений, но не для производства прогнозов. 3. Модель по F-критерию Фишера адекватна, но все коэффициенты рег-рессии незначимы. Поэтому модель полностью считается неадекватной. на ее основе не принимаются решения и не осуществляются прогнозы. Практическая часть работы 1. Описание объекта В нашем случае объектом исследования является совокупность наблюдений за посещаемостью WEB сайта Комитета по делам семъи и молодежи Правительства г. Москвы www.telekurs.ru/ismm. Тематика сайта – это предоставление социально незащищенным слоям населения: молодежи, студентам информации о трудоустройстве в Москве. Информация ежедневно обновляется, приблизительно 200 новых вакансий в день. Также на сайте содержится информация о текущих программах правительства г. Москвы направленных на поддержку указанных выше категорий населения. Моделируемым показателем является N- количество человек в день посетивших сайт. 2. Факторы формирующие моделируемое явление Отбор факторов для модели осуществляется в два этапа. На первом идет анализ, по результатам которого исследователь делает вывод о необходимости рассмотрения тех или иных явлений в качестве переменных, определяющих закономерности развития исследуемого процесса, на втором – состав предварительно отобранных факторов уточняется непосредственно по результатам статистического анализа. Полученные данные с помощью программы наблюдения за компьютерной сетью (Net Medic, Net lab) являются не совсем точными, но довольно близки к реальным и по этому будем считать, что они дают представление о характере процесса. (получение более точных данных было для автора невозможно в связи с недостаточной технической базой) Из совокупности этих факторов я отобрал следующие : Зависимый фактор: N- количество человек в день посетивших сайт.
1Архитектура и строительство
2Астрономия, авиация, космонавтика
 
3Безопасность жизнедеятельности
4Биология
 
5Военная кафедра, гражданская оборона
 
6География, экономическая география
7Геология и геодезия
8Государственное регулирование и налоги
 
9Естествознание
 
10Журналистика
 
11Законодательство и право
12Адвокатура
13Административное право
14Арбитражное процессуальное право
15Банковское право
16Государство и право
17Гражданское право и процесс
18Жилищное право
19Законодательство зарубежных стран
20Земельное право
21Конституционное право
22Конституционное право зарубежных стран
23Международное право
24Муниципальное право
25Налоговое право
26Римское право
27Семейное право
28Таможенное право
29Трудовое право
30Уголовное право и процесс
31Финансовое право
32Хозяйственное право
33Экологическое право
34Юриспруденция
 
35Иностранные языки
36Информатика, информационные технологии
37Базы данных
38Компьютерные сети
39Программирование
40Искусство и культура
41Краеведение
42Культурология
43Музыка
44История
45Биографии
46Историческая личность
47Литература
 
48Маркетинг и реклама
49Математика
50Медицина и здоровье
51Менеджмент
52Антикризисное управление
53Делопроизводство и документооборот
54Логистика
 
55Педагогика
56Политология
57Правоохранительные органы
58Криминалистика и криминология
59Прочее
60Психология
61Юридическая психология
 
62Радиоэлектроника
63Религия
 
64Сельское хозяйство и землепользование
65Социология
66Страхование
 
67Технологии
68Материаловедение
69Машиностроение
70Металлургия
71Транспорт
72Туризм
 
73Физика
74Физкультура и спорт
75Философия
 
76Химия
 
77Экология, охрана природы
78Экономика и финансы
79Анализ хозяйственной деятельности
80Банковское дело и кредитование
81Биржевое дело
82Бухгалтерский учет и аудит
83История экономических учений
84Международные отношения
85Предпринимательство, бизнес, микроэкономика
86Финансы
87Ценные бумаги и фондовый рынок
88Экономика предприятия
89Экономико-математическое моделирование
90Экономическая теория

 Анекдоты - это почти как рефераты, только короткие и смешные Следующий
Забавный момент: в будни я ни с кем не могу встретиться, а в выходные я ни с кем не хочу встречаться.
Anekdot.ru

Узнайте стоимость курсовой, диплома, реферата на заказ.

Обратите внимание, реферат по математике "Регрессионный анализ в моделировании систем. Исследование посещаемости WEB сайта", также как и все другие рефераты, курсовые, дипломные и другие работы вы можете скачать бесплатно.

Смотрите также:


Банк рефератов - РефератБанк.ру
© РефератБанк, 2002 - 2016
Рейтинг@Mail.ru