загрузка...
загрузка...
На головну

Аналіз лінійної регресії при дисперсії помилок, що залежить від значень вхідної змінної

Дивіться також:
  1. Hazard Analysis and Critical Control Points - Аналіз ризиків і критичні контрольні точки
  2. I. Аналіз демографічної ситуації в Концепція РФ
  3. I. Значення і завдання аналізу заготівельної діяльності. Аналіз закупівель сільськогосподарської продукції. Аналіз факторів, що впливають на заготівельний оборот.
  4. I. ЗНАЧЕННЯ І ЗАВДАННЯ АНАЛІЗУ ВИРОБНИЧОЇ ДІЯЛЬНОСТІ. АНАЛІЗ ВИПУСКУ промислової продукції.
  5. I. ЗНАЧЕННЯ, ЗАВДАННЯ АНАЛІЗУ ПОКАЗНИКІВ ДІЯЛЬНОСТІ АВТОМОБІЛЬНОГО ТРАНСПОРТУ.
  6. I. Організаційні етапи, форми і інформаційна база аналізу.
  7. I. Поняття і види аналізу господарської діяльності.
  8. I. Поняття і значення маржинального аналізу.
  9. II. Аналіз зовнішнього і внутрішнього середовища бізнесу
  10. II. Аналіз зовнішнього середовища (оточення)
  11. II. Аналіз джерел фінансування інвестиційних проектів
  12. II. Аналіз якості закупівель.

Таблиця 3.2

 джерело розсіювання  Сума квадратів відхилень  Число ступенів свободи  оцінка дисперсії
 1. Чистий помилка
 2. Відхилення щодо лини регресу (M-2)
 3. Відхилення зарахунок регресії
 4. Загальне відхилення

Обчислені оцінки дисперсій можуть використовуватися як для визначення оцінки дисперсії шуму , Так і для проведення аналізу якості рівняння регресії.

При цьому дисперсія D1 часто називається дисперсією відтворюваності, a D2 - Дисперсією адекватності.

Для проведення аналізу скористаємося наступною теоремою розкладання для - Розподілу [6]:

Нехай сума Q, що складається з N квадратів незалежних нормально розподілених випадкових величин xi с mxi = 0. , Розбита на m сум квадратів нормально розподілених випадкових величин Q1, Q2 , ..., Qm відповідно з r1, г2, ..., Rm ступенями свободи:

Тоді, якщо виконується умова N = r1 + г2 + ... + Rm, То випадкові величини Q1, Q2, ..., Qm будуть незалежними і розподіленими по закону розподілу з числом ступенів свободи відповідно r1, г2, ..., Rm.

Так як в нашому випадку значення вихідної змінної у підпорядковані нормальному закону розподілу і виконується умова r0 = r1+ г2+ г3, То з урахуванням зроблених раніше припущень можна показати, що відповідні варіації Sзаг, S1, S2 і S3 підпорядковані - Розподілу з числом ступенів свободи відповідно r0, r1, r2 і г3.

Крім того, величина може використовуватися як оцінка дисперсії шуму , так як т е

При цьому на точність оцінки не впливає якість знайденого рівняння регресії .

3.3. Перевірка адекватності моделі

Під адекватністю моделі будемо розуміти те, що вона добре (в статистичному сенсі) описує результати спостережень. Перевірка адекватності полягає в оцінці того, наскільки добре значення , Обчислені по знайденому рівнянню регресії, узгоджуються зі середніми значеннями змінної , Знайденими в результаті спостережень.

Розглянемо гіпотезу Н0, Яка полягає в тому, що , де - Знайдене рівняння регресії, проти альтернативної гіпотези H1: .

При переході до усереднених за рівнями змінної xi значенням спостерігається змінної отримаємо для гіпотези Н0 еквівалентну умова: .

Розсіювання щодо цих математичних очікувань вихідної змінної характеризується дисперсиями відтворюваності і адекватності . Еквівалентної гіпотезою буде Н'0: Dвос= Dад. В якості запобіжного неузгодженості цих значень будемо використовувати дисперсійне відношення виду

Так як варіації S2 і S1 підпорядковані - Розподілу з числом ступенів свободи г1 і г2 відповідно, то міра U підпорядкована F-розподілу, з числом г2 ступенів свободи чисельника і r1 - Знаменника. Для величин D1 і D2 завжди виконується співвідношення D2> D1. Якщо при заданому рівні значимості і ступенях свободи г2 і r1 значення U, обчислене за статистикою, більше Uкр, Взятого з таблиці (т. Е. Дисперсія Dад за рахунок відхилення знайденого рівняння регресії від дійсного буде значимо більше дисперсії Dвос), То розбіжність дисперсій (і відповідно середніх) вважається значущим і гіпотеза Н0 відкидається. Модель вважається неадекватною. В іншому випадку (U Kp) Немає підстав відкинути гіпотезу Н0. Модель адекватна.

Якщо рівняння регресії, знайдене за результатами спостережень, адекватно, то для отримання більш точної оцінки дисперсії помилки спостережень доцільно використовувати одночасно варіації S1 і S2, Т. Е.

3.4. Перевірка значущості коефіцієнтів регресії

Для перевірки значущості коефіцієнтів регресії необхідно знайти закон розподілу оцінок і його параметри - математичне очікування і дисперсію.

Так як оцінки параметрів и являють собою лінійні функції від випадкової величини , Розподіленої за нормальним законом (див. Допущення), то і оцінки коефіцієнтів регресії, знайдені по МНК, будуть розподілені по нормальному закону з параметрами:


 Дисперсії оцінок можуть бути знайдені для випадку рівняння регресії

(3.3) досить просто:

Так як , то

Для перевірки значущості коефіцієнтів регресії и необхідно перевірити гіпотези:

- для Н0 : = 0 проти альтернативи ;

- для Н0 : = 0 проти альтернативи .

При перевірці гіпотез використовуються статистики виду

для и для .

Оскільки точне значення - Невідомо, то береться її

оцінка , Де S1 має розподіл с

числом ступенів свободи г= N - m. Звідси статистики U0 і U1 підпорядковані t-розподілу з числом ступенів свободи відповідно

Довірчий інтервал при рівні значущості для них буде де береться з розподілу Стьюдента. Критична область симетрична двостороння.

Якщо довірчий інтервал накриває початок координат, то коефіцієнт вважається незначним, в іншому випадку - значущим.

Так, при перевірці гіпотези H0: , . якщо , то - Незначну, інакше - значущий. При перевірці гіпотези Н0: обчислюється статистика

Якщо | U1 | Kp, То b1 - Незначну.

якщо коефіцієнти (Або будь-якої з них) незначущі, то їх в рівнянні регресії можна не враховувати. Якщо той чи інший член виключається з рівняння регресії через незначущість відповідного коефіцієнта, то необхідно заново перерахувати оцінку дисперсії адекватності, змінивши вид рівняння регресії. Очевидно, що при цьому можуть змінитися висновки щодо адекватності самої моделі.

Аналогічно визначається значимість коефіцієнтів b0 і b1 рівняння регресії виду (3.1).

Так як , то

Враховуючи що , Можна показати, що

замість береться її оцінка . Однак необхідно мати на увазі, що одержувані оцінки b0 і b1 залежні і для перевірки їх значимості необхідно будувати еліпсоїд розсіювання (рис. 3.2).

При побудові довірчого інтервалу для одного з коефіцієнтів (наприклад, для b1) Необхідно ставити значення іншого коефіцієнта (b0*).

Мал. 3.2

В іншому перевірка значущості коефіцієнтів b0 і b1 аналогічна перевірці значущості коефіцієнтів и .

Довірчий інтервал може бути побудований і для значень змінної у, що обчислюється за допомогою знайденого рівняння регресії в заданій точці х = х0. Так, для рівняння вила (3.2) математичне сподівання оцінки у буде

, А дисперсія оцінки

Довірчий інтервал буде

замість береться її оцінка . значення tKp береться з t-розподілу з числом ступенів свободи відповідно г = N-m.

Якщо використовується рівняння виду (3.1): , то , звідси

т. е. збігається зі значенням, отриманим для рівняння (3.2). Довірчий інтервал також не змінюється.

Будемо розглядати колишні результати спостережень (див. Табл.3.1). Однак, перш ніж переходити до визначення коефіцієнтів регресії b0 і b1 проведемо попередню їхню обробку.

Уявімо результати спостережень в кожній точці xi у вигляді

, Де, як і раніше , - Випадкова величина, що характеризує відхилення результатів спостережень від середнього значення , Яка може розглядатися як помилка вимірювання, підпорядкована нормальному закону розподілу з и . Середня помилка вимірювань в точці х = xi, що дорівнює . також є нормально розподілена випадкова величина з параметрами и

З урахуванням сказаного можна вважати, що в кожній точці xi проводиться одне спостереження вихідної змінної з результатом і випадковою помилкою . Тобто . Рівняння лінійної регресії матиме вигляд . Для того щоб результати розрахунків параметрів рівняння регресії з використанням МНК і його аналізу не змінювалися, необхідно отримане значення вихідної змінної в точці xi брати з вагою wi т. е. . Як ваги wi братимемо величину, обернено пропорційну дисперсії помилки спостереження в даній точці, т. е. кількістю спостережень.

Тоді відповідно до МНК завдання пошуку оцінок b0 і b1 зводиться до мінімізації виразу, еквівалентного старому (3.2). у вигляді зваженої сумі квадратів

Це призводить до тих же розрахунковим співвідношенням, що і раніше. Результати аналізу отриманого рівняння регресії також не змінюються. Якщо число спостережень у всіх точках xi однаково, то і все wi= N = const, i = l, ..., m. Введення вагових коефіцієнтів wi дозволяє проводити лінійний регресійний аналіз для разноточних спостережень.

Аналіз якості рівняння регресії «-- попередня | наступна --» Багатофакторний лінійний регресійний аналіз
загрузка...
© om.net.ua