Навигация:

Главная Случайная страница Обратная связь ТОП Интересно знать Избранные Новые материалы

Топ:

Когда производится ограждение поезда, остановившегося на перегоне: Во всех случаях немедленно должно быть ограждено место препятствия для движения поездов на смежном пути двухпутного...

Теоретическая значимость работы: Описание теоретической значимости (ценности) результатов исследования должно присутствовать во введении...

Динамика и детерминанты показателей газоанализа юных спортсменов в восстановительном периоде после лабораторных нагрузок до отказа...

Интересное:

Инженерная защита территорий, зданий и сооружений от опасных геологических процессов: Изучение оползневых явлений, оценка устойчивости склонов и проектирование противооползневых сооружений — актуальнейшие задачи, стоящие перед отечественными...

Влияние предпринимательской среды на эффективное функционирование предприятия: Предпринимательская среда – это совокупность внешних и внутренних факторов, оказывающих влияние на функционирование фирмы...

Берегоукрепление оползневых склонов: На прибрежных склонах основной причиной развития оползневых процессов является подмыв водами рек естественных склонов...

Дисциплины:

Автоматизация Антропология Археология Архитектура Аудит Биология Бухгалтерия Военная наука Генетика География Геология Демография Журналистика Зоология Иностранные языки Информатика Искусство История Кинематография Компьютеризация Кораблестроение Кулинария Культура Лексикология Лингвистика Литература Логика Маркетинг Математика Машиностроение Медицина Менеджмент Металлургия Метрология Механика Музыкология Науковедение Образование Охрана Труда Педагогика Политология Правоотношение Предпринимательство Приборостроение Программирование Производство Промышленность Психология Радиосвязь Религия Риторика Социология Спорт Стандартизация Статистика Строительство Теология Технологии Торговля Транспорт Фармакология Физика Физиология Философия Финансы Химия Хозяйство Черчение Экология Экономика Электроника Энергетика Юриспунденкция

Оценка качества пробит- и логит-моделей

2017-11-28

1506

0.00 из 5.00 0 оценок

Заказать работу

Содержание

⇐ ПредыдущаяСтр 4 из 4

3.3.1. Адекватность. Оценка качества регрессионных моделей с бинарной зависимой переменной осуществляется практически по той же схеме, что и качество обычной линейной регрессии: определяется пригодность модели в целом, затем определяется статистическая значимость каждого коэффициента модели и, наконец, проверяются гипотезы (если они имеют место), относительно ограничений, которым могут удовлетворять отдельные группы параметров.

Пригодность модели в целом (адекватность) определяется с помощью двух показателей. В качестве первого рассмотрим предложенный Макфадденом (McFadden) индекс отношения правдоподобия

, (3.53)

где – максимальное значение логарифмической функции правдоподобия, достигаемое в точке, координаты которой равны оценкам параметров модели , а – значение логарифмической функции правдоподобия, вычисленное в предположении, что . (Во многих пакетах предусмотрен расчет этих значений функции правдоподобия).

Интуиция подсказывает, что значения такого критерия должны быть заключены между 0 и 1. Действительно, в случае, когда все коэффициенты кроме , равны нулю, индекс отношения правдоподобия тоже равен нулю. Если же модель оказалась такой, что ее расчетные значения в точности совпадают с наблюдаемыми значениями , т.е. имеют место только случаи или , или , то индекс . О такой модели принято говорить, что она совершенно согласована. В остальных случаях значение заключено между 0 и 1, причем, чем больше совпадений между расчетными и фактическими значениями, тем ближе значение индекса к 1. К сожалению, случаи, когда значения индекса заключены между нулем и единицей, не имеют собственной интерпретации. Даже в случае, когда построенная модель идентична истинной функции распределения вероятностей она не является совершенно согласованной.

Второй критерий принято называть псевдо (pseudo) . Его расчет осуществляется по формуле

. (3.54)

Как и в случае индекса псевдо равен 0, когда все коэффициенты модели, кроме , равны нулю. Его значение приближается к 1 по мере того, как увеличивается разность между и , но самой 1 не достигает. Чем ближе к 1 значение псевдо , тем точнее модель воспроизводит фактические значения бинарной переменной.

3.3.2. Статистическая значимость коэффициентов. Проверка статистической значимости отдельных коэффициентов модели осуществляется с помощью статистики Вальда. Для вычисления ее значения необходимо иметь стандартные ошибки коэффициентов модели. Стандартные ошибки, как и в случае линейной регрессии, определяются по диагональным элементам ковариационной матрицы оценок . Но прежде, чем перейти к определению значимости, исследуем вопрос состоятельности и асимптотической нормальности этих оценок.

Известно, что решение любого из уравнений правдоподобия (3.1) или (3.2), даже если оно существует, не обязательно имеет хорошие асимптотические свойства. Желаемые состоятельность и асимптотическая нормальность обеспечены только в том случае, когда выполняются определенные условия, налагаемые на поведение объясняющих переменных в генеральной совокупности. Существуют два подхода к этой проблеме:

1) полагают, что объясняющие переменные являются стохастическими. Тогда налагаемые на них условия предстают в форме «все х _i являются независимыми, одинаково распределенными случайными переменными, для которых существуют моменты достаточно высокого порядка»;

2) полагают, что объясняющие переменные фиксированы. В этом случае условия будут следующими:

§ для зависимой переменной существует асимптотическая матрица вариации-ковариации;

§ значения независимых переменных ограничены, то есть всегда найдутся такие константы m, M; m > -¥, M < ¥, что:

Если одно из этих условий выполнено, то при достаточно больших n оценка существует и сходится по вероятности к истинному значению b. Ковариационная матрица этой оценки равняется матрице, обратной к информационной матрице Фишера, которая представляет собой математическое ожидание Гессиана, взятое с обратным знаком

. (3.55)

Предполагается, что математическое ожидание здесь берется условно по х.

Таким образом, при выполнении выше сформулированных условий можно считать, что оценка вектора коэффициентов модели, полученная с помощью метода максимального правдоподобия, является асимптотически нормальной, т.е.

. (3.56)

Как нетрудно понять асимптотическая матрица ковариации зависит от неизвестного параметра b. Поэтому непосредственное использование ее в практических расчетах исключено. Рекомендации здесь те же самые, что и при использовании обычной регрессии – неизвестные параметры, присутствующие в матрице следует заменить соответствующими оценками. Руководствуясь этим общим правилом, можно записать

(3.57)

и использовать в практических расчетах не ковариационную матрицу, а ее оценку.

Рассмотрим детально, каким образом может быть получена оценка этой матрицы. Для этого вычислим матрицу вторых производных (Гессиан)

(3.58)

где F = F(x _i b) и f = f(x _i b).

Для получения информационной матрицы Фишера необходимо Гессиан умножить на минус единицу и взять математическое ожидание. Используя тот факт, что E(y_i) = F (x _i b), и, проведя несложные преобразования, получаем:

(3.59)

Соответственно асимптотическая матрица вариации-ковариации примет вид:

(3.60)

а ее оценка равна

(3.61)

Корни квадратные из диагональных элементов этой матрицы являются стандартными ошибками соответствующих оценок . Их используют для получения статистики Вальда

, . (3.62)

В случае логит-модели, для которой , матрица Фишера упрощается

(3.63)

Кроме того, матрицу Фишера можно представить в более компактной и более удобной для расчетов форме.

С этой целью обозначим через матрицу наблюдений за экзогенными переменными, дополненную столбцом из единиц и имеющую размер . По-прежнему будет обозначать -ую строку матрицы наблюдений. Далее через обозначим диагональную матрицу -го порядка, у которой -ый элемент диагонали имеет следующий вид:

. (3.64)

Тогда информационная матрица Фишера может быть записана следующим образом:

. (3.65)

Ковариационная матрица в этом случае равна

. (3.66)

Такая форма ковариационной матрицы напоминает обобщенную оценку наименьших квадратов.

3.3.3. Стандартные ошибки предсказанных вероятностей и предельных эффектов. Расчетные значения , получаемые с помощью оцененных пробит- и логит моделей, представляют собой вероятности того, что переменная примет значение 1 или 0. Возможные изменения этих вероятностей в зависимости от факторов оцениваются частными предельными эффектами

. (3.67)

Это именно те характеристики, которые подлежат интерпретации и практическому использованию. Чтобы иметь представление о надежности выводов полученных на основе результатов моделирования необходимо иметь оценки стандартных ошибок этих характеристик. Получить оценки стандартных ошибок можно с помощью дельта метода [63].

Для расчетной вероятности дельта-метод позволяет записать асимптотическую величину стандартной ошибки в виде

, (3.68)

где – асимптотическая ковариационная матрица оценки и производная вычислена в точке, компоненты которой совпадают с компонентами оценки .

Заметим, что доступность практического использования данной формулы гарантируется тем, что асимптотическую ковариационную матрицу в ней, следуя рекомендациям предыдущего параграфа, можно заменить оценкой

Чтобы сделать эту формулу более удобной для расчетов, проведем ее преобразование. С этой целью введем обозначение: . Тогда вектор производных может быть представлен следующим образом:

. (3.69)

Замена в (3.68) вектора производных на (3.69) позволяет записать выражение для стандартной ошибки расчетной вероятности в более компактной форме

. (3.70)

Стандартная ошибка зависит от вектора, по которому рассчитывалась вероятность.

Теперь перейдем к рассмотрению предельных эффектов. Для удобства введем обозначение . Тогда асимптотическая ковариационная матрица предельных эффектов может быть записана в виде:

. (3.71)

Для дальнейших преобразований матрицу производных представим в виде суммы

. (3.72)

В полученном выражении вычисление производной привело к единичной матрице, а вычисление – к вектор-строке .

Для пробит-модели, если учесть, что , (3.72) переписывается следующим образом:

. (3.73)

В случае логит-модели плотность вероятности может быть записана через функцию распределения как . Для краткости мы будем писать , полагая . Дифференцируя это выражение по , получаем

. (3.74)

Подставляя полученное выражение в (3.72), получаем стандартные ошибки предельных эффектов логит-модели

. (3.75)

Стандартные ошибки предельных эффектов, так же как и стандартные ошибки расчетных вероятностей зависят от вектора экзогенных переменных.

3.3.4. Тесты для проверки линейных гипотез. Описанные выше алгоритмы дают оценки, которые являются асимптотически нормальными при стремлении размера выборки к бесконечности. Асимптотическая нормальность оценок обеспечивает корректность проверки линейных гипотез относительно коэффициентов модели. Опорным элементом всех статистиках, используемых в этих тестах, является информационная матрица Фишера. Способ получения асимптотической оценки этой матрицы был рассмотрен выше. Поэтому в дальнейшем изложении предполагается, что матрица Фишера нам известна.

Во всех тестах проверяется нулевая гипотеза, формальная запись которой имеет следующий вид:

, (3.76)

где – вектор тестируемых параметров;

– матрица (размером ), задающая структуру ограничений,

– вектор (размером ) правой части ограничивающих условий.

Все ниже рассматриваемые тесты асимптотически эквивалентны и, следовательно, обеспечивают получение одних и тех же выводов. Поэтому выбор того или иного теста диктуется только конкретной ситуацией и удобством применения в ней.

Тест Вальда. В соответствии спредположением, лежащим в основе теста Вальда, вектор оценок при выполнении нулевой гипотезы должен быть близок к .

В силу асимптотической нормальности в тех случаях, когда имеет место нулевая гипотеза (), случайное отклонение нормально распределено, т.е.

, (3.77)

где – матрица вариации-ковариации , вычисляемая как обратная к информационной матрице Фишера.

Статистика Вальда в этом случае имеет вид

. (3.78)

В силу свойств нормального распределения статистика имеет распределение , и проверка нулевой гипотезы осуществляется по правилу

Рассмотрим пример, иллюстрирующий технику проверки предположений относительно коэффициентов модели с помощью теста Вальда. Пусть, например, методом максимального правдоподобия получен вектор оценок и требуется проверить предположение о том, что , а . В этом случае нулевая гипотеза записывается следующим образом:

Если проверяется статистическая значимость отдельного коэффициента модели, например , то, как нетрудно понять, нулевая гипотеза записывается в виде

и статистика Вальда после выполнения всех перемножений оказывается равной квадрату t–статистики

, (3.79)

где – соответствующий диагональный элемент матрицы .

Есть и другая схема вычисления статистики Вальда. Ее использование удобно в тех случаях, когда проверяется только статистическая значимость некоторых коэффициентов, т.е. проверяется гипотеза о равенстве их нулю.

Будем считать, что независимые переменные упорядочены таким образом, что проверка этой гипотезы касается первых коэффициентов. Для дальнейшего изложения этой схемы разделим вектор коэффициентов на две группы

где b ₁ – q -мерный вектор, а b ₂ включает (m – q) элементов. В этом случае проверяется нуль-гипотеза вида

H₀: { b ₁ = 0 }. (3.80)

Проверке подвергаются оценки, полученные путем максимизации функции правдоподобия без каких-либо ограничений на оцениваемые коэффициенты модели. Полученные оценки, как отмечалось выше, состоятельны и асимптотически нормальны, т.е.

(3.81)

Обращая информационную матрицу, представленную в блочном виде, по частям, получаем для подвектора матрицу вариации-ковариации

(3.82)

Статистика Вальда в этом случае рассчитывается по формуле

, (3.83)

и нуль-гипотеза отвергается или нет по результатам сравнения с критическим значением .

Особенность теста Вальда в том, что в нем используются оценки, которые вычислены без учета ограничений, которые постулируются в нуль-гипотезе. Это безусловное достоинство теста, так как для его реализации не требуется проведения дополнительных расчетов.

Тест отношения правдоподобия. В отличие от процедуры Вальда, реализация этого теста требует расчетов, связанных с максимизацией функции правдоподобия без учета ограничений и с учетом ограничений на коэффициенты модели.

Вектор оценок с учетом ограничений имеет вид

(3.84)

где является результатом максимизации по b ₂. Полученная таким образом оценка является состоятельной и асимптотически нормальной:

(3.85)

Используемая в тесте статистика основана на сравнении двух оценок максимального правдоподобия, полученных максимизацией ограниченной (с учетом ограничений) и неограниченной (без учета ограничений) функции правдоподобия, т.е.

. (3.86)

Статистика имеет распределение . Поэтому решение о том, отвергнуть или нет нулевую гипотезу, принимается аналогично тому, как это делалось в процедуре Вальда.

Тест множителей Лагранжа. Применение этого теста не вызывает затруднений в случае линейных регрессионных моделей. Там понятно, как определить множители Лагранжа и использовать их для расчета статистики. В случае бинарных моделей определение множителей Лагранжа не совсем простая процедура. Поэтому построение статистики основано на других принципах.

Если нулевая гипотеза верна, то две оценки неограниченная и ограниченная должны быть очень близки. Из близости оценок следует близость уравнений правдоподобия, решение которых позволило получить эти оценки.

Причем, неограниченная оценка получена как решение системы уравнений

(3.87)

а ограниченная – как решение той же самой системы, но с учетом ограничения

(3.88)

Обе системы уравнений представляют собой математические ожидания соответствующих уравнений правдоподобия. Взятие математического ожидания в данном случае эквивалентно замене каждой случайной величины ее ожидаемым значением или , соответственно. Причем, значения самих производных вычислены в точке .

Для рассматриваемого случая статистика множителей Лагранжа записывается следующим образом:

. (3.89)

Она является асимптотически эквивалентной статистике Вальда и статистике отношения правдоподобия и имеет распределение . Решение, отвергнуть нулевую гипотезу или нет, принимается по результатам сравнения с критическим значением , т.е. процедура сравнения проводится точно так же, как это описано в тесте Вальда.

Можно значительно упростить процедуру расчета статистики множителей Лагранжа, сведя ее к построению регрессионного уравнения. Правда, для этого необходимо провести ряд не совсем простых преобразований, которые приведут к упрощенной схеме. Начнем с того, что являясь частью матрицы, обратной информационной матрице Фишера, позволяет записать статистику множителей Лагранжа в эквивалентном виде

(3.90)

Теперь вставим индивидуальные наблюдения в уравнение правдоподобия, которое после этой операции будет записываться как сумма логарифмов

(3.91)

Если наблюдения не коррелированны между собой, то можно показать, что информационная матрица Фишера представима в виде произведения производных первого порядка. Первая производная равна

. (3.92)

Соответственно вторая производная может быть записана как

. (3.93)

Выполним операцию взятия математического ожидания путем замены на ()

В результате проведенного преобразования взаимно уничтожаются слагаемые, содержащие

Если в преобразованном выражении убрать оператор ожидания, т.е. в числителе снова вернуться к

то получаем выражение, отрицательное значение которого представимо в виде суммы произведений

. (3.94)

Возможность такого представления непосредственно следует из того, что и , а правильность проверяется непосредственным перемножением.

Таким образом, состоятельная оценка информационной матрицы Фишера может быть представлена в виде

. (3.95)

Используя полученную оценку информационной матрицы, запишем статистику множителей Лагранжа

. (3.96)

Упрощенный расчет этой статистики можно осуществить следующим образом. Обозначим через матрицу (размером n x q) из соответствующих значений частных производных первого порядка

(3.97)

и через е n -мерный вектор из единиц.

Тогда искусственная линейная регрессия

(3.98)

с вектором коэффициентов

(3.99)

может использоваться для расчета статистики . Коэффициенты такой регрессии легко рассчитываются с помощью любого статистического пакета, а значение статистики равно сумме расчетных значений этой регрессии.

⇐ Предыдущая 1 2 34

Поделиться с друзьями:

Историки об Елизавете Петровне: Елизавета попала между двумя встречными культурными течениями, воспитывалась среди новых европейских веяний и преданий...

Опора деревянной одностоечной и способы укрепление угловых опор: Опоры ВЛ - конструкции, предназначенные для поддерживания проводов на необходимой высоте над землей, водой...

Автоматическое растормаживание колес: Тормозные устройства колес предназначены для уменьшения длины пробега и улучшения маневрирования ВС при...

Типы оградительных сооружений в морском порту: По расположению оградительных сооружений в плане различают волноломы, обе оконечности...