+7(499)-938-42-58 Москва
+7(800)-333-37-98 Горячая линия

Применение регрессии

Содержание

Регрессия – что такое регрессия в психологии, медицине, экономике?

Применение регрессии

Регрессия – распространенный термин в таких областях науки как психология, психиатрия, математика, экономика и отражающий процессы обратного движения или развития. Эзотерика и популярная психология используют методы регрессии для путешествия по прошлым жизням или воплощениям.

Регрессия в психологии

Маленький ребенок, набираясь опыта взаимодействия с окружающим миром и другими людьми, исследует связи и реакции в ответ на свои действия и манипуляции – так закрепляются определенные паттерны поведения, помогающие ребенку получать желаемое, или не быть наказанным за какой-то проступок. Регрессия – механизм защиты, используемый человеком, уже будучи, во взрослом состоянии, в момент тревоги или фрустрации, с которыми он не может справиться и западает на более ранние, незрелые реакции поведения, характерные для маленького ребенка.

Примеры регрессии:

  • при появлении в семье еще одного ребенка – старший, в результате ревности всячески пытается вернуть к себе внимание (он тоже еще маленький или беспомощный, хнычет, капризничает);
  • уход в болезни – манипулирование близкими людьми;
  • «заедание» проблем («воспоминание», когда плачущему ребенку дают конфетку, вместо того, чтобы разобраться в причинах плача и помочь ребенку справиться с возникшей проблемой).

Регрессивная психология изучает психические процессы возникновения состояний регресса.

Возврат в детские реакции характерен для всех людей и объясняется тем, что на бессознательном уровне есть опыт того, что ребенка меньше наказывают или если применить эмоциональный шантаж: заплакать, обидеться, закатить истерику – можно получить желаемое.

Такие смежные науки как психиатрия и психология используют регрессивные техники для возврата человека в прошлые травмирующие события, для того, чтобы «стереть» травму или переписать жизненный сценарий.

Регрессивный гипноз

Регрессия в прошлые жизни – популярный метод самопознания среди людей, занимающихся саморазвитием, практикующих йогу и увлекающихся индуизмом.

Наука отрицает то, что бессознательное человека хранит информацию о прошлых воплощениях, да и сам факт реинкарнации не признает.

Регрессивный гипноз измененное состояние психических процессов, во время которого гипнолог может внушать человеку все что угодно, например, что он:

  • в другом времени;
  • на неизвестной планете;
  • совершает какие-либо действия.

Регрессивный гипноз в отличие от регрессий в прошлые жизни, является методом воздействия на человека, с целью исследования его прошлого, для решения проблемы или избавления от страха, причины которых не осознаются и имеют корни в прошлом пациента, чаще в детстве. Опытный гипнотерапевт должен владеть методами регрессивной терапии, ведь 80% работы гипнолога связано с регрессией в прошлое.

Регрессивная терапия

Для обычного человека регрессинг представляет собой что-то нереальное и фантастичное, но наука объясняет это более прозаично и сам процесс тесно связан с психофизиологическими свойствами человеческого организма.

Регрессивный гипноз – состояние сознания, при котором оно пребывает в трансе, а сам транс – это привычное явление для человека, в нем он пребывает несколько раз в течение дня.

Все автоматизмы (привычные действия), будь то мытье посуды, хождение по одному и тому же маршруту – совершаются человеком в состоянии транса, когда мозг работает с частотой 7 – 14 Гц (альфа-ритм).

Гипнотерапевт вводит пациента в состояние транса и сопровождает человека в его «путешествии» до того места или события где случилась травма и происходит «перезагрузка» сценария в более позитивном ключе. Успех регрессивной терапии зависит от следующих факторов:

  • скорости погружения;
  • гипнабельности человека (только 30% людей обладают высокой степенью гипнабельности, с остальными нужны дополнительные методы по снятию защит и недоверия);
  • время, в течение которого человек способен находиться в трансе.

Регрессивный самогипноз

Регрессивная гипнотерапия может с успехом применяться и в самогипнозе. Сознательное погружение человеком самого себя в определенное событие имевшее место в прошлом. Важные моменты самогипноза:

  • применение техник последовательного движения глаз или обратный отсчет;
  • первоначальная концентрация на незначительных деталях события;
  • задействование всех органов чувств;
  • переживание самого события и выстраивание другой, положительной цепочки;
  • выход из состояния транса и анализ произошедшего.

Регрессивные расстройства

Регрессия – психологическая защита, свойственная человеческой психике.

Откат к незрелым формам реагирования на стресс – это бессознательный механизм, но иногда это и манипуляция, к которой прибегают инфантильные личности, в арсенале которых, только такое поведение способствующее достижению желаемого.

Регрессивные расстройства – это уже комплекс синдромов, характерных для личности, находящейся в неврозе или страдающей психиатрическим заболеванием (шизофрения, психозы, слабоумие).

Виды регрессивных расстройств:

  • нарушение навыков опрятности (энурез, энкопрез);
  • расстройства психомоторики (ползание вместо ходьбы, раскачивания, ходьба на носочках);
  • поведенческие нарушения выражены в полной или частичной утрате навыков самообслуживания (больной ест руками, проглатывает пищу не разжевывая, не может самостоятельно одеться).

Регрессия в медицине

Виды регрессий, существующих в медицинской науке:

  1. Логистическая регрессия – метод статистики, позволяющий прогнозировать наступление, особенности протекания, исход того или иного заболевания, процент заболевших.
  2. Возрастная регрессия – деградация личности с постепенной утратой знаний и навыков.
  3. Регрессия болезни – фаза заболевания, при котором происходит спад симптомов и возврат к нормальному функционированию организма.

Возрастная регрессия

Деградация и регрессия тесно взаимосвязанные процессы, наблюдаемые при тяжелых соматических и психических заболеваниях. Деградация представляет собой процесс распада личности, потери собственного «Я», что приводит к регрессии – примитивным формам реагирования, характерным для детского возраста. Заболевания, провоцирующие возрастную регрессию:

  • алкоголизм, наркомания;
  • болезнь Альцгеймера;
  • старческое слабоумие (стадия маразма);
  • рассеянный склероз.

Регрессия в экономике

Понятие регрессии нашло применение и в экономической сфере. Регрессивный откат в экономике, проявляется как возврат к прежним, изжившим себя когда-то методам, внешне это проявляется упадком и стагнацией экономических процессов. Регрессионно-корреляционный анализ – метод, помогающий просчитать прибыль, факторы, влияющие на снижение или увеличение объемов производства.

Аддитивные технологии – что это такое и где применяются? Аддитивные технологии – инновации в сфере промышленности и производства. Цифровые новшества с использованием 3D-печати, используемые в разных прикладных сферах, таких как медицина, фармакология, авиа и машиностроение – воспринимаются на грани фантастики. Топ-10 предсказаний Симпсонов, которые уже сбылись Мультик о «Симпсонах» предсказал будущее человечества – его герои знают все о победе Трампа, смертоносных вирусах и грядущих терактах…
Когнитивные способности – что это такое, как их развить? Когнитивные способности – познавательные процессы человека: память, мышление, внимание, воображение, восприятие, направленные на взаимодействие с окружающим миром, другими людьми, получение информации и трансформации ее в знания и опыт. Что такое способности – какие бывают способности и способы их развития Что такое способности и как они проявляются? Ребенок рождается с определенными задатками, развивая которые он становится успешно реализованным в социуме. Это могут быть таланты и одаренность в сферах: математики, лингвистики, музыки, спорта.

Источник: http://kak-bog.ru/regressiya-chto-takoe-regressiya-v-psihologii-medicine-ekonomike

Глава 2. Применение регрессивного анализа

Применение регрессии

Напрактике линия регрессии чаще всегоищется в виде линейной функции (линейнаярегрессия), наилучшим образом приближающейискомую кривую. Делается это спомощью метода наименьших квадратов,когда минимизируется сумма квадратовотклонений реально наблюдаемыхотих оценок(имеютсяв виду оценки с помощью прямой линии,претендующей на то, чтобы представлятьискомую регрессионную зависимость):

(—объём выборки). Этот подход основан натом известном факте, что фигурирующаяв приведённом выражении сумма принимаетминимальное значение именно для тогослучая, когда.

Длярешения задачи регрессионного анализаметодом наименьших квадратов вводитсяпонятие функцииневязки:

Условиеминимума функции невязки:

Полученнаясистема является системой линейныхуравнений снеизвестными.

Еслипредставить свободные члены левой частиуравнений матрицей

акоэффициенты при неизвестных в правойчасти — матрицей

тополучаем матричное уравнение: ,которое легко решается методомГаусса. Полученная матрица будетматрицей, содержащей коэффициентыуравнения линии регрессии:

Дляполучения наилучших оценок необходимовыполнение предпосылок МНК (условийГаусса — Маркова). В англоязычнойлитературе такие оценки называются BLUE(BestLinearUnbiasedEstimators —«наилучшие линейные несмещенныеоценки»). Большинство исследуемыхзависимостей может быть представленос помощью МНК нелинейными математическимифункциями.

2.2 Интерпретация параметров регрессии

Параметры являютсячастными коэффициентамикорреляции;интерпретируетсякак доля дисперсии Y, объяснённая,при закреплении влияния остальныхпредикторов, то есть измеряет индивидуальныйвкладвобъяснение Y.

В случае коррелирующихпредикторов возникает проблеманеопределённости в оценках, которыестановятся зависимыми от порядкавключения предикторов в модель.

В такихслучаях необходимо применение методованализа корреляционного и пошаговогорегрессионного анализа.

Говоряо нелинейных моделях регрессионногоанализа, важно обращать внимание на то,идет ли речь о нелинейности по независимымпеременным (с формальной точки зрениялегко сводящейся к линейной регрессии),или о нелинейности по оцениваемымпараметрам (вызывающей серьёзныевычислительные трудности). При нелинейностипервого вида с содержательной точкизрения важно выделять появление в моделичленов вида ,,свидетельствующее о наличии взаимодействиймежду признаками,и т. д.

Глава 3. Проблемы с регрессией, последствия и решения

Ошибки спецификации относительно независимых переменных.Когда ключевые независимые переменные отсутствуют в регрессионном анализе, коэффициентам и связанным с ними р-значениям нельзя доверять.Создаётся карта и проверяются невязки МНК и коэффициенты ГВР или запускается анализ горячих точек по регрессионным невязкам МНК, чтобы увидеть, насколько это позволяет судить о возможных отсутствующих переменных.
Нелинейные взаимосвязи (рис. 3.1)МНК и ГВР – линейные методы. Если взаимосвязи между любыми независимыми величинами и зависимыми – нелинейны, результирующая модель будет работать плохо.Создаётся  диаграмма рассеяния, чтобы выявить взаимосвязи между показателями в модели. Уделяется особое внимание взаимосвязям, включающим зависимые переменные. Обычно криволинейность может быть устранена трансформированием величин(рис. 3.2).  Альтернативно, используется нелинейный метод регрессии.
Выбросы данных(рис.3.3).Существенные выбросы могут увести результаты взаимоотношений регрессионной модели далеко от реальности, внося ошибку в коэффициенты регрессии.Создаётся диаграмма рассеяния и другие графики (гистограммы), чтобы проверить экстремальные значения данных. Корректируются или удаляются выбросы, если они представляют ошибки. Когда выбросы соответствуют действительности, они не могут быть удалены. Запускается регрессия с и без выбросов, чтобы оценить, как это влияет на результат.
Нестационарность. Можно обнаружить, что входящая переменная, может иметь сильную зависимость в регионе А, и в то время быть незначительной или даже поменять знак в регионе B(рис. 3.4). Если взаимосвязь между зависимыми и независимыми величинами противоречит в пределах вашей области изучения, рассчитанные стандартные ошибки будут искусственно раздуты.Инструмент МНК в ArcGIS автоматически тестирует проблемы, связанные с нестационарностью (региональными вариациями) и вычисляет устойчивые стандартные значения ошибок(рис.3.5). Когда вероятности, связанные с тестом Koenker, малы (например, 7,5), избыток является проблемой и излишние показатели должны быть удалены из модели или модифицированы путем создания взаимосвязанных величин или увеличением размера выборки(рис.3.7). 
Противоречивая вариация в отклонениях. Может произойти, что модель хорошо работает для маленьких величин, но становится ненадежна для больших значений(рис. 3.8).Когда модель плохо предсказывает некоторые группы значений, результаты будут носить ошибочный характер.Инструмент МНК в ArcGIS автоматически выполняет тест на несистемность вариаций в отклонениях (называемая гетероскедастичность или неоднородность дисперсии) и вычисляет стандартные ошибки, которые устойчивы к этой проблеме. Когда вероятности, связанные с тестом Koenker, малы (например, 0,05), необходимо учитывать устойчивые вероятности, чтобы определить, является ли независимая переменная статистически значимой или нет(рис. 3.9). 
Пространственно автокоррелированные отклонения(рис.3.10)Когда наблюдается пространственная кластеризация в отклонениях, полученных в результате работы модели, это означает, что имеется переоценённый тип систематических отклонений, модель работает ненадежно.Запускается инструмент Пространственная автокорреляция (Spatial Autocorrelation) по отклонениям, чтобы убедиться, что в них не наблюдается статистически значимой пространственной автокорреляции. Статистически значимая пространственная автокорреляция практически всегда является симптомом ошибки спецификации (отсутствует ключевой показатель в модели)(рис. 3.11). 
Нормальное распределение систематической ошибки(рис.3.12).Когда невязки регрессионной модели распределены ненормально со средним, близким к 0, р-значения, связанные с коэффициентами, ненадежны.Инструмент МНК в ArcGIS автоматически выполняет тест на нормальность распределения отклонений. Когда статистический показатель Jarque-Bera является значимым (например, 0,05), скорее всего в модели отсутствует ключевой показатель (ошибка спецификации) или некоторые отношения, которые моделируются, являются нелинейными. Карта отклонений нуждается в проверке и возможно карта с коэффициентами ГВР, чтобы определить, какие ключевые показатели отсутствуют. Нужно найти на диаграмме рассеяния нелинейности взаимосвязей.

Рис.3.1Криволинейность. Эта криволинейнаясвязь между кражами и доходом указываетна то, что больше краж происходит в домахсреднего дохода, чем в домах низкогоили высокого дохода.

Рис.3.2Трансформация. Иногда возможнотрансформировать искаженные переменные,чтобы придать им нормальное распределение.

Рис.3.3Выбросы. Существенные выбросы могутувести результаты модели далеко отреальности, внося ошибку в коэффициентырегрессии.

Есливыброс – ошибка, она должна бытьисправлена или удалена из анализа. Есливыброс отражает корректные данные, выможете провести ваш анализ с и безвыброса, чтобы посмотреть, как сильноон влияет на ваши результаты.

Рис.3.4Нестационарность. Моделированиеотношений, не являющимися постояннымив пределах изучаемой области.

Заметьте,что связь между числом вызовов 911 ичислом людей отличаются в районах свысокой численностью населения июго-западных районах с низкой плотностьюнаселения.

Рис.3.5Усьлйчивые вероятности. ИнструментМНК вычисляет стандартные ошибки ивероятностные коэффициенты, которыеустойчивы к нестационарности.

Есликритерий Кенкера статистически значимый(*), примите во внимание устойчивыевероятности, чтобы оценить, статистическизначимые ваши независимые переменныеили нет.

Рис.3.6Мультиколлинеарность. Существуетсильная взаимосвязь между этимипеременными.

Использованиебольше чем одной из этих независимыхпеременных в единой регрессионноймодели привело бы к избыточности инепостоянству модели. Каждая независимаяпеременная в вашей регрессионной моделидолжна достигнуть различного аспектазависимой переменной, которую выпытаетесь предсказать или смоделировать.

Рис.3.7Фактор, увеличивающий дисперсию (ФУД).Большие значения ФУД говорят о избыточностисреди ваших моделируемых независимыхпеременных

Рис.3.8Зависимость дисперсии от случайнойвеличины. Область рассеяния в формеконуса указывает, что модель работаетпо-разному в зависимости от величиныоценочных показателей. В этом случаемодель работает лучше (остатки меньше)для участков с меньшим количествомпреступлений, чем для участков с большимчислом преступлений.

Рис.3.9Устойчивые вероятности. ИнструментМНК вычисляет стандартные ошибки ивероятностные коэффициенты, которыеустойчивы к нестационарности.

Есликритерий Кенкера статистически значимый(*), примите во внимание устойчивыевероятности, чтобы оценить, статистическизначимые ваши независимые переменныеили нет.

Рис.3.10Карта, отражающая невязки пространственнойавтокорреляции. Отклонения, полученныев результате моделирования, кластеризуютсяв пространстве.

Заметьте,как переоценки, полученные в результатемоделирования (красные), кластеризуютсяв пространстве.

Статистически значимаяпространственная кластеризацияотклонений – доказательство того, чтов модели отсутствуют ключевые независимыепеременные.

Вы можете использоватьинструмент Пространственная автокорреляция(Spatial Autocorrelation), чтобы определить,присутствует ли в моделированиистатистически значимая кластеризацияотклонений.

Рис.3.11Графическое представление результатовпространственной автокорреляции.Графическое представление результатовПространственной автокорреляции(Глобальный индекс Морана I)

Рис.3.12Гистограмма невязок. Невязки моделейдолжны быть распределены равномерно.

Источник: https://StudFiles.net/preview/2554877/page:3/

Основы линейной регрессии

Применение регрессии

Что такое регрессия? 

Линия регрессии 

Метод наименьших квадратов

Предположения линейной регрессии

Аномальные значения (выбросы) и точки влияния

Гипотеза линейной регрессии

Оценка качества линейной регрессии: коэффициент детерминации R2

Применение линии регрессии для прогноза

Простые регрессионные планы

Пример: простой регрессионный анализ

Рассмотрим две непрерывные переменные x=(x1, x2, .., xn), y=(y1, y2, …, yn).

Разместим точки на двумерном графике рассеяния и скажем, что мы имеем линейное соотношение, если данные аппроксимируются  прямой линией.

Если мы полагаем, что y зависит от x, причём изменения в y вызываются именно изменениями в x, мы можем определить линию регрессии (регрессия y на x), которая лучше всего описывает прямолинейное соотношение между этими двумя переменными.

Статистическое использование слова “регрессия” исходит из явления, известного как регрессия к среднему, приписываемого сэру Френсису Гальтону (1889).

Он показал, что, хотя высокие отцы имеют тенденцию иметь высоких сыновей, средний рост сыновей меньше, чем у их высоких отцов. Средний рост сыновей “регрессировал” и “двигался вспять” к среднему росту всех отцов в популяции. Таким образом, в среднем высокие отцы имеют более низких (но всё-таки высоких) сыновей, а низкие отцы имеют сыновей более высоких (но всё-таки довольно низких).

Линия регрессии

Математическое уравнение, которое оценивает линию простой (парной) линейной регрессии:

Y=a+bx.

x называется независимой переменной или предиктором.

Y – зависимая переменная или переменная отклика. Это значение, которое мы ожидаем для y (в среднем), если мы знаем величину x, т.е. это «предсказанное значение y»

  • a – свободный член (пересечение) линии оценки; это значение Y, когда x=0 (Рис.1).
  • b – угловой коэффициент или градиент оценённой линии; она представляет собой величину, на которую Y увеличивается в среднем, если мы увеличиваем x на одну единицу.
  • a и b называют коэффициентами регрессии оценённой линии, хотя этот термин часто используют только для b.

Парную линейную регрессию можно расширить, включив в нее более одной независимой переменной; в этом случае она известна как множественная регрессия.

Рис.1. Линия линейной регрессии, показывающая пересечение a и угловой коэффициент b (величину возрастания Y при увеличении x на одну единицу)

Метод наименьших квадратов

Мы выполняем регрессионный анализ, используя выборку наблюдений, где a и b – выборочные оценки истинных (генеральных) параметров, α и β , которые определяют линию линейной регрессии в популяции (генеральной совокупности).

Наиболее простым методом определения коэффициентов a и b является метод наименьших квадратов (МНК).

Подгонка оценивается, рассматривая остатки (вертикальное расстояние каждой точки от линии, например, остаток = наблюдаемому y – предсказанный y, Рис. 2).

Линию лучшей подгонки выбирают так, чтобы сумма квадратов остатков была минимальной.

Рис. 2. Линия линейной регрессии с изображенными остатками (вертикальные пунктирные линии) для каждой точки.

Предположения линейной регрессии

Итак, для каждой наблюдаемой величины остаток равен разнице и соответствующего предсказанного Каждый остаток может быть положительным или отрицательным.

Можно использовать остатки для проверки следующих предположений, лежащих в основе линейной регрессии:

  • Между и существует линейное соотношение: для любых пар данные должны аппроксимировать прямую линию. Если нанести на двумерный график остатки, то мы должны наблюдать случайное рассеяние точек, а не какую-либо систематическую картину.
  • Остатки нормально распределены с нулевым средним значением;
  • Остатки имеют одну и ту же вариабельность (постоянную дисперсию) для всех предсказанных величин  Если нанести остатки против предсказанных величин от мы должны наблюдать случайное рассеяние точек. Если график рассеяния остатков увеличивается или уменьшается с увеличением то это допущение не выполняется;

Если допущения линейности, нормальности и/или постоянной дисперсии сомнительны, мы можем преобразовать или и рассчитать новую линию регрессии, для которой эти допущения удовлетворяются (например, использовать логарифмическое преобразование или др.).

Аномальные значения (выбросы) и точки влияния

“Влиятельное” наблюдение, если оно опущено, изменяет одну или больше оценок параметров модели (т.е. угловой коэффициент или свободный член). 

Выброс (наблюдение, которое противоречит большинству значений в наборе данных) может быть “влиятельным” наблюдением и может хорошо обнаруживаться визуально, при осмотре двумерной диаграммы рассеяния или графика остатков.

И для выбросов, и для “влиятельных” наблюдений (точек) используют модели, как с их включением, так и без них, обращают внимание на изменение оценки (коэффициентов регрессии).

При проведении анализа не стоит отбрасывать выбросы или точки влияния автоматически, поскольку простое игнорирование может повлиять на полученные результаты. Всегда изучайте причины появления этих выбросов и анализируйте их.

Гипотеза линейной регрессии

При построении линейной регрессии проверяется нулевая гипотеза о том, что генеральный угловой коэффициент линии регрессии β равен нулю.

Если угловой коэффициент линии равен нулю, между и нет линейного соотношения: изменение не влияет на

Для тестирования нулевой гипотезы о том, что истинный угловой коэффициент равен нулю можно воспользоваться следующим алгоритмом:

Вычислить статистику критерия, равную отношению , которая подчиняется распределению с степенями свободы, где стандартная ошибка коэффициента

,

– оценка дисперсии остатков.

Обычно если достигнутый уровень значимости нулевая гипотеза отклоняется.

Можно рассчитать 95% доверительный интервал для генерального углового коэффициента :

где процентная точка распределения со степенями свободы что дает вероятность двустороннего критерия

Это тот интервал, который содержит генеральный угловой коэффициент с вероятностью 95%.

Для больших выборок, скажем, мы можем аппроксимировать значением 1,96 (то есть статистика критерия будет стремиться к нормальному распределению)

Оценка качества линейной регрессии: коэффициент детерминации R2

Из-за линейного соотношения  и мы ожидаем, что  изменяется, по мере того как изменяется , и называем это вариацией, которая обусловлена или объясняется регрессией. Остаточная вариация должна быть как можно меньше.

Если это так, то большая часть вариации  будет объясняться регрессией, а точки будут лежать близко к линии регрессии, т.е. линия хорошо соответствует данным.

Долю общей дисперсии , которая объясняется регрессией называют коэффициентом детерминации, обычно выражают через процентное соотношение и обозначают R2 (в парной линейной регрессии это величина r2, квадрат коэффициента корреляции), позволяет субъективно оценить качество уравнения регрессии.

Разность представляет собой процент дисперсии который нельзя объяснить регрессией.

Нет формального теста для оценки мы вынуждены положиться на субъективное суждение, чтобы определить качество подгонки линии регрессии.

Применение линии регрессии для прогноза

Можно применять регрессионную линию для прогнозирования значения по значению в пределе наблюдаемого диапазона (никогда не экстраполируйте вне этих пределов).

Мы предсказываем среднюю величину для наблюдаемых, которые имеют определенное значение путем подстановки этого значения в уравнение линии регрессии.

Итак, если прогнозируем как Используем эту предсказанную величину и ее стандартную ошибку, чтобы оценить доверительный интервал для истинной средней величины в популяции.

Повторение этой процедуры для различных величин позволяет построить доверительные границы для этой линии. Это полоса или область, которая содержит истинную линию, например, с 95% доверительной вероятностью.

Подобным образом можно рассчитать более широкую область, внутри которой, как мы ожидаем, лежит наибольшее число (обычно 95%) наблюдений.

Простые регрессионные планы

Простые регрессионные планы содержат один непрерывный предиктор. Если существует 3 наблюдения со значениями предиктора P, например, 7, 4 и 9, а план включает эффект первого порядка P, то матрица плана X будет иметь вид

а регрессионное уравнение с использованием P для X1 выглядит как

Y = b0 + b1P

Если простой регрессионный план содержит эффект высшего порядка для P, например квадратичный эффект, то значения в столбце X1 в матрице плана будут возведены во вторую степень:

а уравнение примет вид

Y = b0 + b1P2

Сигма-ограниченные и сверхпараметризованные методы кодирования не применяются по отношению к простым регрессионным планам и другим планам, содержащим только непрерывные предикторы (поскольку, просто не существует категориальных предикторов).

Независимо от выбранного метода кодирования, значения непрерывных переменных увеличиваются в соответствующей степени и используются как значения для переменных X. При этом перекодировка не выполняется.

Кроме того, при описании регрессионных планов можно опустить рассмотрение матрицы плана X, а работать только с регрессионным уравнением.

Пример: простой регрессионный анализ

Этот пример использует данные, представленные в таблице:

Рис. 3. Таблица исходных данных.

Данные составлены на основе сравнения переписей 1960 и 1970 в произвольно выбранных 30 округах. Названия округов представлены в виде имен наблюдений. Информация относительно каждой переменной представлена ниже:

Рис. 4. Таблица спецификаций переменных.

Задача исследования

Для этого примера будут анализироваться корреляция уровня бедности и степень, которая предсказывает процент семей, которые находятся за чертой бедности. Следовательно мы будем трактовать переменную 3 (Pt_Poor) как зависимую переменную.

Можно выдвинуть гипотезу: изменение численности населения и процент семей, которые находятся за чертой бедности, связаны между собой.

Кажется разумным ожидать, что бедность ведет к оттоку населения, следовательно, здесь будет отрицательная корреляция между процентом людей за чертой бедности и изменением численности населения.

Следовательно мы будем трактовать переменную 1 (Pop_Chng) как переменную-предиктор.

Коэффициенты регрессии

Рис. 5. Коэффициенты регрессии Pt_Poor на Pop_Chng.

На пересечении строки Pop_Chng и столбца Парам. не стандартизованный коэффициент для регрессии Pt_Poor на Pop_Chng равен -0.40374.

Это означает, что для каждого уменьшения численности населения на единицу, имеется увеличение уровня бедности на .40374.

Верхний и нижний (по умолчанию) 95% доверительные пределы для этого не стандартизованного коэффициента не включают ноль, так что коэффициент регрессии значим на уровне p

Источник: http://statistica.ru/theory/osnovy-lineynoy-regressii/

Регрессия в Excel: уравнение, примеры. Линейная регрессия

Применение регрессии

Регрессионный анализ — это статистический метод исследования, позволяющий показать зависимость того или иного параметра от одной либо нескольких независимых переменных.

В докомпьютерную эру его применение было достаточно затруднительно, особенно если речь шла о больших объемах данных. Сегодня, узнав как построить регрессию в Excel, можно решать сложные статистические задачи буквально за пару минут.

Ниже представлены конкретные примеры из области экономики.

Виды регрессии

Само это понятие было введено в математику Фрэнсисом Гальтоном в 1886 году. Регрессия бывает:

  • линейной;
  • параболической;
  • степенной;
  • экспоненциальной;
  • гиперболической;
  • показательной;
  • логарифмической.

Пример 1

Рассмотрим задачу определения зависимости количества уволившихся членов коллектива от средней зарплаты на 6 промышленных предприятиях.

Задача. На шести предприятиях проанализировали среднемесячную заработную плату и количество сотрудников, которые уволились по собственному желанию. В табличной форме имеем:

A

B

C

1

Х

Количество уволившихся

Зарплата

2

y

30000 рублей

3

1

60

35000 рублей

4

2

35

40000 рублей

5

3

20

45000 рублей

6

4

20

50000 рублей

7

5

15

55000 рублей

8

6

15

60000 рублей

Для задачи определения зависимости количества уволившихся работников от средней зарплаты на 6 предприятиях модель регрессии имеет вид уравнения Y = а0 + а1×1 +…+аkxk, где хi — влияющие переменные, ai — коэффициенты регрессии, a k — число факторов.

Для данной задачи Y — это показатель уволившихся сотрудников, а влияющий фактор — зарплата, которую обозначаем X.

Использование возможностей табличного процессора «Эксель»

Анализу регрессии в Excel должно предшествовать применение к имеющимся табличным данным встроенных функций. Однако для этих целей лучше воспользоваться очень полезной надстройкой «Пакет анализа». Для его активации нужно:

  • с вкладки «Файл» перейти в раздел «Параметры»;
  • в открывшемся окне выбрать строку «Надстройки»;
  • щелкнуть по кнопке «Перейти», расположенной внизу, справа от строки «Управление»;
  • поставить галочку рядом с названием «Пакет анализа» и подтвердить свои действия, нажав «Ок».

Если все сделано правильно, в правой части вкладки «Данные», расположенном над рабочим листом «Эксель», появится нужная кнопка.

Линейная регрессия в Excel

Теперь, когда под рукой есть все необходимые виртуальные инструменты для осуществления эконометрических расчетов, можем приступить к решению нашей задачи. Для этого:

  • щелкаем по кнопке «Анализ данных»;
  • в открывшемся окне нажимаем на кнопку «Регрессия»;
  • в появившуюся вкладку вводим диапазон значений для Y (количество уволившихся работников) и для X (их зарплаты);
  • подтверждаем свои действия нажатием кнопки «Ok».

В результате программа автоматически заполнит новый лист табличного процессора данными анализа регрессии. Обратите внимание! В Excel есть возможность самостоятельно задать место, которое вы предпочитаете для этой цели. Например, это может быть тот же лист, где находятся значения Y и X, или даже новая книга, специально предназначенная для хранения подобных данных.

Анализ результатов регрессии для R-квадрата

В Excel данные полученные в ходе обработки данных рассматриваемого примера имеют вид:

Прежде всего, следует обратить внимание на значение R-квадрата. Он представляет собой коэффициент детерминации. В данном примере R-квадрат = 0,755 (75,5%), т. е. расчетные параметры модели объясняют зависимость между рассматриваемыми параметрами на 75,5 %.

Чем выше значение коэффициента детерминации, тем выбранная модель считается более применимой для конкретной задачи. Считается, что она корректно описывает реальную ситуацию при значении R-квадрата выше 0,8.

Если R-квадрата tкр, то гипотеза о незначимости свободного члена линейного уравнения отвергается.

В рассматриваемой задаче для свободного члена посредством инструментов «Эксель» было получено, что t=169,20903, а p=2,89Е-12, т. е.

имеем нулевую вероятность того, что будет отвергнута верная гипотеза о незначимости свободного члена. Для коэффициента при неизвестной t=5,79405, а p=0,001158.

Иными словами вероятность того, что будет отвергнута верная гипотеза о незначимости коэффициента при неизвестной, равна 0,12%.

Таким образом, можно утверждать, что полученное уравнение линейной регрессии адекватно.

Задача о целесообразности покупки пакета акций

Множественная регрессия в Excel выполняется с использованием все того же инструмента «Анализ данных». Рассмотрим конкретную прикладную задачу.

Руководство компания «NNN» должно принять решение о целесообразности покупки 20 % пакета акций АО «MMM». Стоимость пакета (СП) составляет 70 млн американских долларов. Специалистами «NNN» собраны данные об аналогичных сделках. Было принято решение оценивать стоимость пакета акций по таким параметрам, выраженным в миллионах американских долларов, как:

  • кредиторская задолженность ();
  • объем годового оборота (VO);
  • дебиторская задолженность (VD);
  • стоимость основных фондов (СОФ).

Кроме того, используется параметр задолженность предприятия по зарплате (V3 П) в тысячах американских долларов.

Решение средствами табличного процессора Excel

Прежде всего, необходимо составить таблицу исходных данных. Она имеет следующий вид:

Далее:

  • вызывают окно «Анализ данных»;
  • выбирают раздел «Регрессия»;
  • в окошко «Входной интервал Y» вводят диапазон значений зависимых переменных из столбца G;
  • щелкают по иконке с красной стрелкой справа от окна «Входной интервал X» и выделяют на листе диапазон всех значений из столбцов B,C, D, F.

Отмечают пункт «Новый рабочий лист» и нажимают «Ok».

Получают анализ регрессии для данной задачи.

Изучение результатов и выводы

«Собираем» из округленных данных, представленных выше на листе табличного процессора Excel, уравнение регрессии:

СП = 0,103*СОФ + 0,541*VO – 0,031* +0,405*VD +0,691*VZP – 265,844.

В более привычном математическом виде его можно записать, как:

y = 0,103*x1 + 0,541*x2 – 0,031*x3 +0,405*x4 +0,691*x5 – 265,844

Данные для АО «MMM» представлены в таблице:

СОФ, USD

VO, USD

, USD

VD, USD

VZP, USD

СП, USD

102,5

535,5

45,2

41,5

21,55

64,72

Подставив их в уравнение регрессии, получают цифру в 64,72 млн американских долларов. Это значит, что акции АО «MMM» не стоит приобретать, так как их стоимость в 70 млн американских долларов достаточно завышена.

Как видим, использование табличного процессора «Эксель» и уравнения регрессии позволило принять обоснованное решение относительно целесообразности вполне конкретной сделки.

Теперь вы знаете, что такое регрессия. Примеры в Excel, рассмотренные выше, помогут вам в решение практических задач из области эконометрики.

Источник: http://fb.ru/article/322644/regressiya-v-excel-uravnenie-primeryi-lineynaya-regressiya

Поделиться:
Нет комментариев

    Добавить комментарий

    Ваш e-mail не будет опубликован. Все поля обязательны для заполнения.