загрузка...
загрузка...
На головну

Способи перевірки процедури первинного вимірювання на надійність

Слід мати на увазі, що операції підвищення надійності первинного вимірювання, які ми будемо тут розглядати, використовуються лише на стадії відпрацювання інструменту виміру в процесі пілотажу. Після остаточної перевірки надійності побудованих шкал і збору даних на об'єктах дослідження акцент контролю їх достовірності переноситься з первинного вимірювання на вторинні, т. Е. Комбінаторні процедури, і так послідовно аж до обгрунтування достовірності підсумкових висновків.

В цілому ж достовірність результатів дослідження залежить від багатьох складових, починаючи з того, наскільки обґрунтованою є його загальна концепція і всі компоненти теоретико-методологічного розділу програми, а далі - від якості вихідних даних, системи їх відбору, т. Е. Відповідності типу вибірки (і її організації) цілям дослідження, якості аналізу даних і, нарешті, від глибини інтерпретації отриманих залежностей і зв'язків.4

4 Про вимоги і операціях, необхідних для гарантії загальної Достовірності даних, див. [68, 200, 233]. Якщо врахувати всі можливі помилки, пов'язані з неповним відповідністю теоретичної моделі об'єкта самому об'єкту, можливими недоліками на різних етапах дослідження (наприклад, при розрахунках вибірки, тиражування польових документів і т. Д.), Специфікою типів можливих помилок (напри-Мер, систематичні або випадкові), а також деякі інші причини, то, як показав Б. 3. Докторів [68], в так званій метрологічної карті можна виявити 162 (I) складові можливих помилок.

На жаль, немає однаковості в тлумаченні терміну "надійність" стосовно соціологічної інформації. Головна причина полягає в тому, що одні автори трактують надійність занадто розширено як якість всього дослідження і, отже, його підсумків, а інші, навпаки, ототожнюють надійність з тим або іншим особливим її проявом (наприклад, с. Стійкістю даних, їх адекватністю цілям дослідження і т.д.).

Не зупиняючись тут на дискусії термінологічного характеру, зауважимо, що в строгому сенсі слова поняття надійності вимірювання правомірно відносити саме до інструменту, за допомогою якого проводиться вимірювання, але не до самих даних, що підлягають вимірюванню, Відносно даних, як і заключних висновків з дослідження, правильніше говорити, що вони достовірні (або щодо достовірні) в тому числі і тому, що фіксовані надійним інструментом.

Можуть бути різні типології прийомів оцінки надійності первинної інформації, наприклад, з точки зору зовнішнього або внутрішнього контролю даних, одержуваних певним способом. Ми будемо користуватися узагальнюючим поняттям надійності інструменту виміру (і відповідно надійності даних, що фіксуються цим інструментом), маючи на увазі три складові: (1) обґрунтованість, (2) стійкість і (3) правильність вимірювання. Природно, що і методи контролю на надійність потрібно розглядати в цих трьох аспектах5.

5 Найбільш детально методи і техніка контролю даних на надійність викладені в роботах Г. І. Саганенко [233] і В. І. Папіотто [200]. Останній застосовує аналітичний підхід до предмету, виділяючи безліч різновидів надійності і технічних прийомів оцінки її рівня [200. С. 74-75], тоді як Саганоцко, ряд ідей і прикладів з книги якої ми використовуємо, акцентує увагу на найбільш істотних, неодмінних вимогах і порівняно прості способи контролю надійності.

обгрунтованість6 шкали полягає в тому, що с її допомогою цілеспрямовано вимірюють цілком певну властивість чи ознака, не змішуючи його з іншими.

6 У зарубіжній і вітчизняній (особливо в психологічній) літературі замість терміна "обґрунтованість" часто використовується як його аналог поняття "валідність". Однак в англійському "reliability" (обгрунтованість) підкреслює можливість покладатися на кого-небудь, в даному випадку довіряти отриманої інформації завдяки тому, що вона адекватна об'єкту вимірювання [337. З, 132-138], a "validity" семантично має відтінок стійкості, "міцності" отриманої інформації. Тому термін "валідність" правильніше було б співвідносити ве з обґрунтованістю, під зі стійкістю даних вимірювання.

Припустимо, при опитуванні телеглядачів їм пропонують вказати, яким з перерахованих у доданому списку передачам телебачення приділяє "занадто багато", "досить" і "занадто мало" часу. Якщо за допомогою цієї тричленної шкали дослідник має намір фіксувати середній час, що відводиться телепередачам, його вимір буде необгрунтованим. Насправді він вимірює ставлення людей до даних передачам, а не обсяг часу, відведеного для їх трансляції. Обгрунтоване вимір обсягу часу на передачі різного типу - документальний аналіз "сітки" програм телебачення.

Щоб підвищити обгрунтованість вимірювання, використовують ряд технічних прийомів.

(1) Найбільш простий спосіб - логічні міркування на основі досвіду і здорового глузду.

Звернемося до прикладу з обстеження, проведеного Б. М. Фірсовим. Завдання: визначити середню інтенсивність перегляду телепередач шляхом масового опитування телеглядачів.

Перший варіант побудови шкали був такий. Питання: "Скільки приблизно годин на день Ви проводите біля телевізора?" Шкала для відповіді містила п'ять інтервалів: (не більше 1 години) - (від 1 до 2 годин) - (від 2 до 3 годин) - (від 3 до 4 годин) - (понад 4 години).

Шляхом логічних міркувань були висловлені наступні сумніви в обгрунтованості такого методу. Слід вказати день перегляду телепередач: будній, суботній або недільний. Інакше незрозуміло, який із днів глядач вибере за еталон оцінки. Не врятує положення і питання, скільки в середньому годин на тиждень глядач проводить біля телевізора, так як люди не звикли думати в "середніх" величинах.

Значить, треба поставити питання так, щоб: а) виділити дні тижня і б) вказати зрозумілий для глядача еталон оцінки. Тому більш вдалий варіант побудови шкали для вирішення тієї ж завдання наступного [274. С. 142].

Перше питання: "Скільки днів в тиждень Ви, як правило, дивіться телевізійні передачі?":

1) майже всі дні тижня;

2) 3 або 4 дні в тиждень;

3) 1 або 2 дні на тиждень;

4) менше, ніж один раз в педелю, т. Е. Не щотижня;

5) по суті, зовсім не дивлюся.

Друге питання: "Чи не могли б Ви приблизно оцінити, скільки в середньому годин Ви проводите біля телевізора в той день, коли дивитеся передачі?" Зробіть позначку в кожному рядку.

 Дні тижня  час перегляду
   максимум 1 години  від 1 до 2 годин  від 2 до 3 годин  від 3 до 4 годин  понад 4 години
 В будні дні - - - - -
 В суботу - - - - _
 В неділю _ - - - -

Тепер, користуючись простими арифметичними діями, можна розрахувати "среднепросмотровое" час за тиждень і скласти шкалу.

Позначимо а число днів в тиждень, приділяють перегляду телепередач. Числові індикатори відповідей на перше питання взяті як середні емпірично отриманих інтервалів (в числі днів перегляду), а саме: 6; 3,5; 1,5; 0,7; 0. Позначимо видання кількість годин, витрачених на перегляд телепрограм в певні дні (відповіді на друге питання) також за середніми: 4,5; 3,5; 2,5; 1,5; 1.

Позначивши будні дні як d, суботні s, недільні w, розрахуємо среднепросмотровое час за тиждень Т:

Для телеглядача, який у відповіді на перше питання позначив "3 або 4 рази на тиждень", у відповіді на другий вказав "до 1 години на будні" і "від 2 до 3 годин на суботу та неділю" среднепросмотровое час обчислюється за формулою:

Неадекватне розуміння того, що ж ми вимірюємо, може привести до серйозних наслідків. Повчальний приклад: дискусія в пресі щодо сумлінності служб громадської думки в опитуваннях про рейтинг політичних діячів.

У листопаді 1997 р два провідних російських центру вивчення громадської думки представили дані загальноросійських опитувань. Рейтинги Президента, прем'єра і деяких інших ключових фігур в уряді за опитуваннями центру "А" на 10-12% відрізнялися від рейтингів за опитуваннями служби "Б". Це викликало публічний скандал: одна служба підіграє уряду, а інша - опозиції. Що ж насправді сталося? Служба "А" задавала питання "Чи схвалюєте Ви діяльність ..?", А служба "Б" пропонувала формулювання "Чи довіряєте Ви ..?". Протягом трьох місяців всі показники довіри / недовіри на 10-12% поступалися показникам схвалення / несхвалення, причому цей розрив стійко зберігався відносно Президента і прем'єра, але сильно коливався щодо ряду інших урядовців (т. Е. Громадяни сформували позицію щодо Президента і прем'єра, але не мали чіткої позиції щодо Інших, неключових фігур в уряді). Через два тижні після цього скандалу служба "Б" в загальноукраїнському опитуванні запропонувала респондентам обидві формулювання в одному інтерв'ю. Виявилося, що довіряють уряду 14-16% опитаних, але схвалюють його діяльність в тій же вибірці 29%. Логіка тут така: "Я можу не дуже довіряти щирості намірів уряду, але те, що воно робить, я схильний зараз схвалити".

Зауважимо, однак, що логічні міркування, на зразок наведених вище, підвищують обгрунтованість, але не є прямим доказом того, що ми міряємо шукане властивість.

(2) Тест по "еталонної грynne" - сильніший прийом перевірки інструменту на обгрунтованість. Сенс перевірки - в зіставленні даних, отриманих шляхом вимірювання за шкалою, з достовірними відомостями про об'єкт вимірювання.

Так, шкала на ставлення до дотримання норм права може бути обгрунтована опитуванням засуджених правопорушників (вони розглядаються як "еталон" негативного полюса шкали), в порівнянні з "еталонною" групою законослухняних громадян. Діхотомізація полярних груп за шкалою повинна созпадать з фактичної поляризацією еталонних груп в межах допустимої помилки, величина якої залежить від завдань дослідження.

(3) Пошук незалежного критерію як різновид зовнішнього контролю надійності для вимірювання того ж самого об'єкта або властивості.

Якщо підключити до телевізійного приймача прилад, реєструючий час його роботи, і зіставити показання приладу з результатами опитування про частоту і тривалості перегляду телепрограм, можна точно встановити обґрунтованість даних опитування.

Не маючи такої можливості, Б. М. Фірсов зіставляв відомості, отримані за шкалою среднепросмотрового часу, з даними за іншою шкалою, названої "зміна звичок" (табл. 1) [274, С, 107]. Остання конструировалась з відповідей на питання: "Чи доведеться Вам в разі тривалої відсутності телевізора міняти свої звички, спосіб проведення дозвілля, життєвий уклад?" Беремо два крайні варіанти відповідей по другій шкалі, відкидаючи проміжні (у відсотках до чисельності представників кожного типу, т. Е. По рядку). Очевидно, що шкала "захопленості", отримана як вторинна угруповання даних среднепросмотрового часу Т, високо узгоджується зі шкалою "звичок" і, отже, може вважатися цілком обгрунтованою.7

7 Користуючись тією ж шкалою, автор провів повторне порівняльне дослідження аналогічної вибірки ленінградців через 10 і 12 років. За період з 1967 р по 1979 р виявилося, що частка "дуже поміркованих" телеглядачів впала з 32% до 6% і "вельми захоплених" підвищилася з 16% до 40% [157. С. 701].

Пошук еталона виміру. «-- попередня | наступна --» Обгрунтування шкали захопленості телебаченням по незалежного критерію.
загрузка...
© om.net.ua