загрузка...
загрузка...
На головну

Вибір більш точної шкали шляхом порівняння величин відносної стійкості вимірювання

Таблиця 4

Таблиця 3

Порівняння даних двох послідовних вимірів в тричленної шкалою (N = 28 чол.)

 Відповіді в I пробі про заняття на дозвіллі  Відповіді в 11 пробі  всього
   "Привл." (1)  "Не дуже" (2)  "Не привл." (3)  
 "Дане заняття привабливо" (1) "Не дуже привабливо" (2) "Заняття непривабливо" (3) -  -
 всього

Іншим дуже корисним показником повної стійкості є міра зсуву, оцінена як середньоарифметична помилка розрізнення градацій шкали. Цей показник означає, яку частку градації цієї шкали (в середньому) все випробовувані як би не вловлюють, т. Е. Які справжні кордони розрізнення градацій.

Наприклад, уточнимо середнєарифметичну помилку в розрізненні тричленної школи згоди - незгоди з якимось судженням (нехай це буде судження про привабливість деякого заняття на дозвіллі). Наведемо схему (табл. 3) і розрахунки, використовуючи дані таблиці Г. І. Саганенко.

У випробуванні беруть участь 28 чоловік, з яких 17 повністю повторюють свої оцінки даного заняття в обох пробах (сума по діагоналі схеми: 7 + 6 + 4 = 17), а решта 11 випробовуваних дають різні відповіді в двох пробах. Для оцінки шуканої помилки обчислюємо відмінності відповідей респондентів як зрушення між II і I пробами, наприклад, в II пробі з тих, хто в I пробі відповів "заняття привабливо", 3 людини повідомили, що воно «не дуже привабливо", т. В. це різниця (2-1) 3. Тепер підсумуємо все різниці у відповідях і отримаємо міру середньоарифметичної помилки розрізнення пунктів градації цієї шкали:

Значить, середньоарифметичний "зрушення" в оцінці по тричленної шкалою становить близько 40% одного її поділу, т. Е. Менш половини поділу, що в загальному можна визнати задовільним, хоча і не ідеальним. (Нижче, кажучи про правильність вимірювання, ми покажемо, як можна було б зменшити цю помилку.)

Розглядаючи стійкість як відтворюваність результатів вимірювань, можна використовувати і інші показники її заходи [200. С. 33-34], наприклад, звичайні розрахунки кореляції підсумків двох послідовних вимірювань. Показники, що рекомендуються Г. І. Саганенко, представляються нам цілком адекватними і наочними.

Яка ж міра стійкості задовільна? Це залежить від істоти вимірюваного властивості, його значущості для цілей і завдань дослідження. В принципі для немногочленной шкали середньоарифметична помилка розрізнення градацій в 40% її поділу невисока, а відповідна міра стійкості (100% -40% = 60%) цілком достатня, бо не перекриваються кордону між-ДУ двома сусідніми інтервалами шкали. Якщо нестійкість склала не 40%, а 60%, т. Е. Більше половини поділки шкали, то помилка була б явно недопустима, бо в середньому випробувані не розрізняють дві сусідні градації з трьох.

Для багаточленних шкал, наприклад з 10 градацій, помилка в 60% одного поділу не надто велика, так як перекриваються два ділення з 10, т. Е. 2/3, а 0,2 загальної "довжини" шкали. Білі при обробці даних градації укрупнити, поєднуючи дві сусідні, то помилка мінімізується до цілком упевненого рівня стійкості.

Крім показників повної стійкості шкали, можливі також показники її відносної стійкості. Вони корисні при порівнянні різних шкал, наприклад для вибору з декількох варіантів найбільш правильною і точною шкали (про що йдеться нижче в цьому ж розділі) або для того, щоб порівняти рівні стійкості вимірювання різних властивостей, кожне з яких фіксується шкалами різного типу і різного ступеня роздрібненості.

Але перш за все показники слід співвідносити з рівнем реальної стабільності - мінливості досліджуваного об'єкта, вимірюваних властивостей.

2) Використання декількох осіб для вимірювання даного властивості. Трапляється, що шкала нестійка тому, що її пункти довільно інтерпретуються самими дослідниками. Особливо це характерно для шкал якісної класифікації об'єктів. У таких (номінальних) шкалах групи об'єктів класифікують за допомогою опису всіх якісних ознак, за якими кожен об'єкт відноситься до певного пункту шкали - класу.

Припустимо, що виділено кілька ознак (з відповідними індикаторами) для віднесення політичної діяльності в вищу категорію за рівнем активності. Щоб виконати цю операцію однозначно, потрібно переконатися, що ознаки ясно помітні і при співвіднесенні видів діяльності з пунктами шкали не виникає плутанини. Скажімо, такими ознаками були: членство або заявлена приналежність до будь-якої партії, руху, виборчого блоку, регулярність участі в його акціях (зборах і публічних виступах, участь в голосуванні на виборах і т. Д.).

У цьому випадку об'єкт ідентифікують одночасно кілька (мінімум троє) лаборантів, що використовують єдину процедуру. Якщо дані, отримані різними лаборантами (в нашому прикладі вони працювали з текстами інтерв'ю), високо узгоджуються, шкала стійка, якщо ні - нестійка, і ми починаємо шукати іншу, більш прийнятну розмірну величину. Причина нестійкості шкали - поганий відбір індикаторів.

3) Нарешті, третій прийом контролю еталона вимірювання на стійкість - "розщеплення шкали". Шкала роздвоюється на дві половини. Якщо виявиться, що вимірювання по кожній з них збігаються, їх можна розглядати як рівноцінні шкали, підсумувати дані і надалі користуватися одночасно обома половинами, що утворюють тепер єдину і більш надійну шкалу, ніж кожна з її складових.

Покажемо техніку "розщеплення» не прикладі. Візьмемо об'єктом вимірювання рівень задоволеності робочого своєю спеціальністю. Дані отримуємо шляхом анкетного опитування.

Проектуємо дві шкали, пункти яких будуть відповідати одному з п'яти рівнів задоволеності спеціальністю (схема 5). Кожному рівню відповідають два судження. Непарні пункти утворюють одну, а парні - іншу половину випробовується шкали.

Далі виробляємо наступні операції: (а) все 10 пунктів парній і непарній половин перемішуються в довільному порядку; б) опитуваним пред'являють набір з 10 суджень з проханням вказати свою згоду або незгоду з кожного з них; (В) після опитування достатньої групи осіб (близько 50 осіб) з числа обстежуваної сукупності дані групуються за двома шкалами окремо: по непарній половині - (a1), (b1), (з1), (d1), (e1) і по парній шкалою - (a2), (b2), (с2), (d2), (е2).

Основна операція - (г) зіставлення підсумків вимірювання за двома половин випробовується шкали. Якщо кореляція між ними буде досить висока, ці половини можна розглядати як частини єдиного інструменту, що вимірює загальний континуум властивостей, В разі потреби "випадають" судження слід переформулювати, щоб отримати прийнятну кореляцію.

В такому випадку підсумкову шкалу утворюють всі 10 суджень, які у випадковому порядку пред'являються загальним списком. У підсумковий показник для даної особи підсумовуються всі бали суджень, з якими він висловив згоду.

Позначивши ранжирування пункти балами від 5 (для al і аа - найвища оцінка) до 1 (в, і є3 - нижча оцінка), припустимо, що якийсь суб'єкт висловив згоду з пунктами а1 + & 2, відкинувши всі інші. Його сумарний бал за шкалою дорівнює 5 + 4 = 9.

Точність і правильність вимірювання залежать від (А) ступеня стійкості вимірюваного об'єкта або властивості, (б) чутливості еталона виміру (дробності пунктів шкали), (в) відсутності систематичних помилок виміру і, звичайно, (г) від стійкості вимірювання.

Соціальні об'єкти, що підлягають вимірюванню, мають різний ступінь стійкості. Скажімо, встановлення стану задоволеності якоюсь діяльністю буде свідомо менш точним, ніж реєстрація частоти поведінкових актів. У першому випадку сам об'єкт вимірювання нестабільний. У поганому настрої людина може висловлювати невдоволення рекламою на телебаченні, а в хорошому настрої він буде запевняти, що рекламні ролики бувають дуже забавними і навіть повчальними. Але навряд чи його настрій відіб'ється на інформації про те, як часто він вимикає телевізор при трансляції реклами або перемикається на іншу програму.

Дробность метрики - чутливість шкали - прямо пов'язана з точністю вимірювання. Шкала в 10 поділок вимірює точніше, ніж в 5 або 3 ділення. Але дробность пунктів шкали не можна збільшувати безмежно. Треба встановити оптимум, що задовольняє двом вимогам: максимум градацій шкали за умови високої стійкості результатів вимірювання. Поступово підвищуючи дробность еталона вимірювання і паралельно перевіряючи шкалу на стійкість, ми знайдемо кордон, за межами якої подальше підвищення дробності тягне зниження стійкості. Це і є оптимум чутливості шкали з урахуванням заходів стійкості вимірюваного властивості. Таким чином, досягнення стійких даних при максимальній дробності метрики підвищує точність вимірювання. Воно буде задовільно точним, якщо абсолютна помилка вимірювання не перевищує 0,5 поділки шкали. Разом з тим, якщо помилка взагалі відсутній | X j = 0, то не виключено, що шкала має заниженою чутливістю (особливо у випадках, коли ми припускаємо достатню варіабельність вимірюваного властивості).

Але вимір може бути цілком точним і разом з тим ... неправильним, постійно відтворюючи якусь систематичну помилку, як це трапляється з зіпсованим термометром, в якому ртутний стовпчик спочатку був фіксований на невірній вихідній позначці і постійно завищує температуру, скажімо, на 0 , 8 градуса.

При квантіфікгГціі соціальних характеристик проблема правильності, т. Е. Відсутність ухилень від істинного значення вимірюваної властивості, набагато складніше, бо часто ми в принципі не здатні встановити, які ж ці істинні значення вимірюваних властивостей (скажімо, думок людей з якихось питань). Ми можемо лише, зіставляючи різні способи фіксування даного властивості, домагатися усунення помічених систематичних помилок. Які ж ці систематичні помилки?

Одна з можливих - відсутність "розкиду" інформації за шкалою внаслідок того, що якісь її пункти "не працюють", т. Е. Не реагують на певний стан вимірюваного властивості. Наприклад, при опитуванні всі відповіді концентруються в позитивному або тільки в негативному полюсі шкали. Звичайно, це може бути і результатом одностайності оцінок, але може бути і результатом того, що сама шкала невдала, наприклад, містить якийсь пункт, сформульований з сильним нормативним тиском на опитуваних. Припустимо, поставлено питання про вживання алкоголю, і вкрай негативний варіант відповіді говорить: "Я п'ю систематично і звичайно до байдужого стану". Сумнівно, щоб навіть явний алкоголік відзначить такий пункт як показник свого ставлення до спиртного. Швидше за все, він вибере судження не настільки різке, наприклад: "Я випиваю досить часто". Вкрай негативний пункт шкали тут "не працює * ': він відлякує. Внаслідок цього шкала неправильна.

Іншою причиною неправильності може бути погана различительная здатність сусідніх пунктів шкали високої роздрібненості. Спробуйте, наприклад, упорядкувати своє ставлення до 24 політикам так, щоб впевнено вказати не тільки прийнятного і рішуче відкидаємо, але всіх, хто лишився із запропонованого переліку розташувати так само акуратно і впевнено в порядку убування їх привабливості. Психологічно це просто неможливо, так що "серединна" частина цієї так званої рангової шкали буде вкрай сумнівною, а вся шкала гілковий і неправильною. Систематична помилка, швидше за все, позначиться на тому, що прийнятні політичні діячі будуть відзначатися як більш привабливі (хоча не виключено, що фактично дані особи ними не цікавляться), а соціально неприйнятні потраплятимуть в нижні рівні рангового ряду.9

9 В даному випадку для підвищення надійності вимірювання використовуються операції, що описуються иа с. 103-104.

У всіх подібних випадках досвідчена перевірка шкали на стійкість даних виявить помилки. Але часто це показує вже перша проба.

Правильність і точність вимірювання можна підвищити шляхом розрахунку відносної помилки вимірювання.10

10 Детальніше їм. [231. С. 63-66].

Відносна помилка дозволяє зіставляти правильність вимірів за двома і більше шкалами різної чутливості і таким шляхом відпрацювати оптимальний інструмент. Нагадаємо, що, на відміну від абсолютної, відносна помилка обчислюється не в частках похибки поділу шкали, а в порівнянній, певним чином нормированном показнику.

Наведено приклад розрахунку відносної помилки вимірювання. Припустимо, що в семичленной шкалою оцінок фіксується намір жінок мати дітей. В обстеженні беруть участь 100 молодих заміжніх жінок, які дали такі відповіді на запитання: "Якою мірою Ви згодні з тим, що було б бажано мати дитини?"

Полюса шкали інтерпретуються, а проміжні пункти не мають словесної інтерпретації.

При деякому навику і достатній дослідному досвіді ми часто інтуїтивно вгадуємо, яка повинна бути дробность метрики, що забезпечує стійку інформацію. Але, приступаючи до вимірювання складних об'єктів, з якими раніше не доводилося стикатися, соціолог повинен виконати ряд експериментів, відпрацьовуючи шкалу на точність і правильність.

Оцінки 3, 2 і 1 (вкрай негативне ставлення до судження) зустрічаються дуже рідко, і цю частину шкали можна визнати погано працює: в сумі тут зосереджено менше 5% всіх відповідей. Більшість жінок або явно хотіли мати дітей, або не дуже в цьому впевнені, і майже немає таких, хто відкидає ідею мати дитини. Значить, в нашій шкалі працюють градації 7, 6, 5 і 4, де 4 фактично найбільш негативна установка. Діапазон працюючої частини шкали: 7-4 = 3. Відносна помилка даної шкали визначається запропонованої Г. І. Саганенко формулою:

де w - оцінка повної устойчівосвості шкали, л зон реально працює її частини.

Перевіривши шкалу на стійкість, як було описано вище, ми, припустимо, отримали значення ц) = 0,75, т. Е. 75% повного збігу відповідей в двох послідовних пробах, що виразно недостатньо.

Тепер випробуємо на стійкість пятичленную і тричленну шкали, задаючи той же питання аналогічної (або тієї ж самої) групі випробовуваних в 100 чоловік. Припустимо, що ми отримаємо такі розподілу (табл. 4),

Як видно, в пятичленной і тричленної шкалах працюють всі градації, так що в негативній зоні виявляється відповідно 25% і 32% відповідей (порівняйте з семибальною шкалою, де в цій зоні менше 50%). Показники повної стійкості двох останніх шкал, перевірені повторними опитуваннями, припустимо, дали відповідно 0,95 і 0,99 (у семибальною - 0,75).

Але відносні помилки за умови, що всі градації обох шкал працюють, такі:

для пятичленной ?отн = 0,95 / (5-1) = 0,238 і для тричленної ?0,99 / (3-1) = 0,495; округлено 0,24 і 0,49. Отримуємо, що відносні помилки семичленной шкали (0,25) і пятичленной (0,24) практично однакові, а тричленної - істотно вище (0,49).

Яка з трьох шкал надійніша? Питання вирішується при порівнянні стійкості шкали і величини відносної помилки. Стійкість даних по пятичленной і тричленної шкалами порівнянна: 95% і 99%. Іншими словами, опитувані добре розрізняють градації цих шкал, краще, ніж в семичленной шкалою: там стійкість дорівнює 75%. З цієї причини останню треба забракувати. Залишається вибір з двох, що залишилися. Пятичленная шкала має високу стійкість і невелику помилку, а тричленна - більш високу стійкість і прийнятну помилку (менше половини градації шкали). Але в отіошеняі до трьох градаціях це складе 0,49: 3 = 0,16, а для пятичленной - 0,24: 5 = 0,05 довжини шкали. Отже, пятичленная шкала втричі чутливіша, а значить, правильніше і точніше.

Підсумовуємо все сказане про перевірку надійності шкал в наступною схемою (схема 6).

Порівняння даних двох послідовних вимірів: оцінка збіги (+) і розбіжності (-) результатів в дихотомічної шкалою «-- попередня | наступна --» Проста номінальна шкала
загрузка...
© om.net.ua