загрузка...
загрузка...
На головну

Програмні вимоги до вибірки

У переважній більшості випадків соціолог використовує той чи інший спосіб виділення з великої сукупності явищ і об'єктів вивчення деяку їх частину в надії, що на цій вибіркової сукупності можуть бути виявлені властивості об'єкта дослідження в цілому. 19

19 На відміну від ідеалізованого обєкта дослідження, як певній галузі соціальної реальності, що містить предмет вивчення, тут мається на увазі емпіричний об'єкт: конкретні індивіди, групи, організації, регіони, локалізовані в часі і просторі.

Тип і способи вибірки прямо залежать від цілей дослідження і його гіпотез. Чим конкретніше мета, чим ясніше сформульовані гіпотези, тим правильніше буде вирішено питання про вибір.

Найбільш суворі вимоги пред'являються до вибірок десріптівних і аналітико-експеремінтальних ісследванія, найменш суворі - до досліджень з розвідувального плану. В останньому випадку відбір "одиниць спостереження" на об'єкті підпорядковується досить простим правилам: слід виділяти полярні групи по істотним для аналізу критеріям. Чисельність таких несистематических вибірок строго не визначається. Все залежить від стану отриманої інформації. Спостереження або опитування в такому дослідженні тривають до тих пір, поки не виявиться, що вийде інформація, досить різноманітна для формулювання гіпотез. Отже, склад і обсяг вибірки заздалегідь не фіксується, а встановлюються дослідним шляхом у міру розвитку дослідження.

У дослідженні дескриптивного плану вборка, навпаки, повинна бути строго репрезентативною. 20

20 Ми розглядаємо лише принципові проблеми вибіркових досліджень. Методи і процедури здійснення вибірок різного типу см. [12. Гл. V; 118; 128; 196. С. 31-38; 198. Гл. III; 218. Гл VI; 262. Ч.1; 287], а також у додатку. 2 "Анотований список літератури"

Вимоги репрезентативної вибірки означають, що по виділених параметрах (критеріями) склад обстежуваних повинен наближатися до відповідних пропорцій у генеральній сукупності. Тим часом, строго репрезентативну вибірку з усіх важливих для проблематики дослідження параметрами забезпечити неможливо, і тому слід гарантувати репрезентацію по головному напрямку аналізу даних.

Перш за все, слід усвідомити, які з наявних відомостей про характеристики генеральної сукупності істотні для цілей дослідження. У багатьох випадках це статево-віковою, соціально-професійний, майновий склад обстежуваних, їх просторова локаклізація. Статево-вікова структура "замикає" на себе багато показників сімейного стану, вже відомі за іншими даними. Вік містить вказівки на життєвий досвід і, як правило, не робочий або професійний стаж. Соціально-професійні, соціально-статусні характеристики - це свідчення про відмінності в системі реального стану людей і їх особливих інтересів, позицій. Просторова локалізація (по території, підрозділам підприємств і установ, за іншими адміністративним і виробничим "Локаль") важлива і з точки зору особливостей умов цієї діяльності (наприклад, центр і периферія, основні і допоміжні служби), і з точки зору адресності підсумкових висновків і рекомендацій, які повинні бути "прив'язані" до адміністративних або виробничих осередків, які мають чіткі межі і часто самоврядним. У поєднанні трьох названих параметрів - статево-вікової структури, соціального складу, просторової локалізації - можна, як правило, бути впевненим, що вибірка буде представницька для аналізу багатьох соціальних проблем. Зрозуміло, що це правило має винятки в залежності від конкретних умов і особливих цілей дослідження (наприклад, в етнічно неоднорідному середовищі істотно мати на увазі репрезентацію за критерієм національної приналежності).

Міра подібності вибіркової моделі структурі генеральної сукупності оцінюється помилкою вибірки, а межі допустимої помилки знову-таки залежать від мети дослідження.

Іноді потрібна підвищена надійність, як це має місце в економічних і демографічних обстеженнях, наприклад при переписах населення. Тут істотні помилки обертаються мільйонними втратами матеріальних ресурсів і прорахунками планування.21

21 Акуратна репрезентативна територіальна вибірка в сучасній Росії вимагає систематичних корекцій. Це пов'язано з тим, що територіальні адміністративні кордони (саме вони є основами офіційної статистики населення) формувалися Для цілей, не збігаються з соціально-дослідними і крім того складу і структура населення в періоди реформації нестійкі. Як показує М. С. Косолапов [128], достовірні розрахунки загальнонаціональної і регіональних представницьких вибірок - складна дослідницька задача. Економна вибірка передбачає також акуратні розрахунки маршрутів дослідників (інтерв'юерів і ін.), Що становить особливу проблему в даному регіоні.

Набагато частіше соціологічні обстеження проводяться для з'ясування загальних тенденцій, загального орієнтування в сфері соціальної політики.

Дуже корисна наступна приблизна оцінка надійності результатів вибіркового обстеження [301. С. 36].22

22 Формули розрахунку помилок вибірки см. В літературі, зазначеної в виносці 19.

Підвищена надійність припускається помилки вибірки до 3%, звичайна - до 3-10% (довірчий інтервал розподілів на рівні 0,03-0,1), наближена -від 10 до 20%, орієнтовна - від 20 до 40%, а приблизна - більше 40%.

В аналітичних і експериментальних дослідженнях проблема статистичної репрезентативності вибірки виявляється другорядною в порівнянні з необхідністю забезпечити якісне представництво досліджуваних соціальних об'єктів,

Розглянемо наступний приклад. У вивченні способу жит * ні населення деякого міста ми, дотримуючись правил дескриптивного обстеження, хочемо забезпечити представництво всіх груп населення відповідно їх пропорціям в складі генеральної сукупності з відхиленням ± 5% від істинного розподілу. Така вибірка, представницька в якісному відношенні, буде також і статистично репрезентативною, але слід вирішити, чи потрібно це.

Нагадаємо, що репрезентативні вибірки необхідні лише в тому випадку, якщо метою дослідження є отримання сумарних даних щодо досліджуваного об'єкта в цілому. У нашому прикладі - це все населення даного міста. Тоді в висновках соціолог має право повідомити, що в середньому городяни так-то оцінюють різні умови життя і діяльності, в середньому така-то частка населення виявляє високу активність в таких-то видах діяльності, а така-то - низьку і т. П. але з практичної точки зору, не кажучи вже про теоретичні завдання вивчення способу життя, нам набагато важливіше виявити специфіку умов і способу життя різних груп населення і в тому числі тих, які, будучи нечисленними, потребують спеціальної уваги.

Припустимо, що в складі населення міста є 370 ветеранів Вітчизняної війни. Щоб отримати більш-менш достовірну інформацію про умови їх життя і їх проблеми, має бути забезпечено належне чисельне представництво цієї категорії громадян в вибіркової сукупності. Але оскільки вибірка статистично репрезентативна, то при чисельності населення міста, скажімо, в 100 тис. І чисельності вибіркової сукупності в 2 тис., Т. Е. При двовідсотковій вибірці, частка ветеранів в вибіркової сукупності складе 60 осіб. Багато це чи мало? Можливо, цієї чисельності досить для того, щоб зробити статистично достовірні висновки про найпростіші приватних показниках умов їх життя, наприклад про рівень забезпеченості житлом ветеранів війни, в порівнянні з середньостатистичними показниками на всю вибірку населення міста. Але як тільки ми захочемо поглибити аналіз, ми виявимо, що чисельність підвибірки ветеранів явно мала. Наприклад, важливо встановити, яка частка ветеранів війни, які проживають в окремій квартирі і без сім'ї, т. Е. Одиноких. В такому випадку доведеться скласти табличку розмірністю 2X2 (дві градації "проживають з сім'єю" і "одиночки" 4 дві градації за критерієм наявності своєї кімнати або квартири). У кожній клітинці цієї таблиці може бути в межі по 15 одиниць спостереження (60: 4 = 15). Звичайно, реальний розподіл виявиться іншим. Так, ветеранів-одинаків, які не мають власної кімнати, не буде зовсім. Зате одинаків, які проживають в окремій квартирі, може виявитися, допустимо, 5-10 чоловік. Разом з тим саме зга категорія ветеранів і становить предмет особливої уваги. Однак при чисельності підвибірки в 10 чоловік ніякої подальший статистичний аналіз вже неможливий.

Отже, якщо ми хочемо вивчити в статистичних показниках особливості умов і способу життя якихось певних груп населення, репрезентативна вибірка повинна бути замінена цільової, в якій чисельність кожної що цікавить нас буде достатня для більш ґрунтовного аналізу. Така вибірка, будучи якісно представницькою відносно цілей дослідження, не є статистично репрезентативною щодо генеральної сукупності.

У багатьох випадках необхідні саме цільові вибірки23.

23 Іноді цільову вибірку називають "соціологічної", в ній забезпечується представництво за ознаками, виявленими у попередніх соціологічних дослідженнях, а для реалізації таких вибірок можуть використовуватися таксономічні процедури (див. Нижче: с. 318-322, а також [84; 107].

Особливо це важливо в дослідженнях експериментального плану. Скажімо, перевіряється ефективність запровадження нової форми організації праці. Ясно, що для цього слід відібрати підрозділи, де введена нова організація, і для порівняння - аналогічні, де робота йде по-старому. Слід гарантувати в вибірці рівну чисельність експериментальних підрозділів або організацій і "контрольних", які працюють за колишньою системою. При цьому важливо так підібрати ці підрозділи, щоб вони були аналогічні з усіх істотних характеристик, крім факту наявності або відсутності нової форми організації праці. Форми власності, професійний і кваліфікований склад працівників, їх статево-структура і, можливо, інші показники повинні бути порівняні. Вирішальне значення має тут аж ніяк не пропорційність вибіркової частки експериментальних підрозділів фірми або підприємства в ставленні до їх частці в генеральної сукупності, але саме якісне представництво експериментальних і контрольних об'єктів відповідно до мети дослідження.

Чисельність (обсяг) вибірки залежить від рівня однорідності або різнорідності досліджуваних об'єктів. Чим більше вони однорідні, тим менша чисельність може забезпечити статистично достовірні висновки. Але ступінь однорідності соціального об'єкта залежить, по суті, від того, наскільки детально ми маємо намір його досліджувати. Практично будь-який, самий "елементарний" об'єкт виявляється надзвичайно складним. Лише в аналізі ми представляємо його як відносно простий, виділяючи ті чи інші його властивості. Чим більш грунтовною і детальним буде аналіз, чим більше властивостей даного об'єкта ми маємо намір прийняти до уваги в їх поєднанні, а не ізольовано, тим більше повинен бути обсяг вибірки.

Для вирішення такого роду завдань якраз і необхідні цільові аналітичні вибірки. У них враховується не тільки структура досліджуваної сукупності, але і обмеження, що накладаються на обсяг вибірки цілями дослідження, глибиною аналізу проблем.

Використовуючи статистичний критерій Стьюдента, можна розрахувати обсяг вибірок залежно від заданого рівня довірчого інтервалу помилки виведення [227. С. 19-21]. Чим менше об'єм порівнюваних підвибірок (нехай це будуть ветерани-одинаки і сімейні), тим більше повинно бути відмінність кожної пари зіставляються статистик (наприклад, процентні відмінності оцінок умов побуту тими і іншими). Якщо чисельність порівнюваних підвибірок неоднакова, за базу визначення допустимої помилки слід брати найменшу подвиборку.

Залежно від обсягу підвибірки істотність процентних відмінностей визначається таблицею:

 Обсяг підвибірок по їх чисельності  Значна різниця в% при помилку не більше 5%  Обсяг підвибірок по їх чисельності  Значна різниця в% при помилку на понад 5%
 6,3
 11,5  4,5

Припустимо, що задовільно оцінюють умови побуту 85% ветеранів-жінок і 79% чоловіків, які проживають з сім'ями, і відповідно 32% жінок і 38% чоловіків-одинаків. Різниці у відсотках становлять тут: 85-79 = 6 і 42-38,4 = 3,6%. При чисельності підвибірок до 150 чоловік і при 5-відсотковому рівні помилки ці відмінності не можна визнати істотними, так як вони повинні перекривати 11,5%. Але разліних між відповідними оцінками одинаків і сімейних будуть істотні. вонискладуть для жінок 85-32 =53% и79-38 = 41% для чоловіків. Такі відмінності значимі вже при вибірках близько 50 осіб. Достовірний висновок звучить так: вирішальною є ситуація проживання ветеранів з сім'єю або самотньо. Якою мірою ці обставини більше переживаються чоловіками або жінками, сказати важко; наших даних для цього недостатньо.

Автори наведених розрахунків відзначають, що вибірки на рівні 500 чоловік дозволяють аналізувати Табта лиці пов'язаності з 4 ознаками з трьох градацій кожен, а вибірки в 1000 одиниць розширюють можливості впевненого аналізу до таблиць з 6 ознаками з п'яти градацій. Все це за умови забезпечення довірчого інтервалу, що не перевищує 5% стат ^ сти-но значущою помилки.

Загальне правило таке: обсяг вибірки при заданому рівні довірчого інтервалу повинен бути не менше ніж ПК одиниць спостереження, де п - Обсяг під-вибірки по стовпчику, а К - Число стовпців.

Обсяг вибірки залежить також від рівня довірчого інтервалу допустимої помилки, яка, як уже говорилося, задається доцільною точністю підсумкових узагальнень: від підвищеної до орієнтовною. Однак тут маються на увазі так звані випадкові помилки, пов'язані з природою будь-яких статистичних похибок. Саме вони і обчислюються як помилки репрезентативності імовірнісних вибірок.

В. І. Паніотто наводить такі розрахунки репрезентативної вибірки з допущенням 5-відсоткової помилки [199. С. 81].

 Обсяг генеральної сукупності обсяг вибірки
 Обсяг генеральної сукупності обсяг вибірки

Для сукупності більш 100000 вибірка складає 400 одиниць. Якщо ж мати на увазі генеральні сукупності чисельністю від 5 тис. І більше, то, по розра там того ж автора, можна вказати величини фактичний кой помилки вибірки залежно від її обсягу [200 С. 82], що для нас дуже важливо, пам'ятаючи , що величин; допустимої помилки залежить від мети дослідження і необов'язково мусить бути близькою до 5-відсотковому; рівню.

 Обсяг вибірки, якщо генеральна сукупність ?5000  625 ...
 Фактична помилка при даному обсягу вибірки,%

Поряд з випадковими можливі помилки систематичного характеру. Вони залежать від організації вибіркового обстеження. це різноманітні зміщення вибірки в сторону одного з полюсів вибіркового параметра.

Об `єм, вибірки визначається аналітичними завданнями дослідження, а її репрезентативність - цільової установкою програми. Саме програма задає образ необхідної генеральної сукупності для проведення вибірки. Чи буде це все населення або особливі його структурні утворення, всі елементи досліджуваного об'єкта або тільки виділені по заданих програмою критеріям.

Генеральну сукупність становлять всі одиниці певного в програмі об'єкту. Тепер. слід забезпечити рівну їх імовірність влучення в вибіркову сукупність.

При невеликих за чисельністю генеральних сукупностях застосовують випадкову бесповторном вибірку, де забезпечують рівну ймовірність попадання в дослідження всіх її одиниць за повним їх списку з генсовокупності. Маючи повний список працівників підприємства (наприклад, 2000 осіб) і визначивши обсяг вибіркової сукупності (наприклад, в 2000 чоловік), встановлюємо крок вибірки розподілом першого на друге (2000: 200) і отримуємо крок відбору - Кожен 10-й зі списку. Тут важливо не допустити систематичної помилки через відсутність в списку, скажімо, якогось підрозділу, наприклад працюють у філії підприємства.

При великих генеральних сукупностях, як це має місце в опитуваннях населення, використовують багатоступінчастий відбір по районам, т. е. великим структурним складовим генеральної сукупності: регіони, типи поселень, квартали міста. На кожному ступені відбору слід забезпечити вимоги показності населення, т. Е. Обгрунтовано відібрати регіони так, щоб не було зсуву по якомусь важливому параметру (наприклад, по етнонаціональної). Те ж саме і на наступних щаблях відбору. В кінцевому рахунку відбір проводиться знову-таки систематично з встановленим кроком відбору за списком громадян (зі списків виборців чи інших), списку господарств на селі, шляхом відвідування кожної, скажімо, 20-ї квартири в списку квартир кожного 50-го будинку виділеного кварталу міста .

Багато обставини ускладнюють проблему розрахунку помилки і нерідко можуть привести до того, що формально-статистично репрезентативна виборка'окажется якісно непредставницьким.

Отже, якість вибірки залежить від трьох умов: (а) від міри однорідності соціальних об'єктів по найбільш істотним для дослідження характеристик; (Б) від ступеня роздрібненості угруповань аналізу, планованих за завданнями дослідження; (В) від доцільного рівня надійності висновків з проведеного дослідження.

Дуже часто малодосвідчений соціолог не уловлює різниці між проблемою помилки репрезентативності вибірки і помилки виведення з даного конкретного розподілу в рамках вибіркової совокупйості.

Нехай вибірка досить репрезентативна і помилка з того чи іншого параметру вибірки незначна. Оцінка рівня достовірності виведення по кожному конкретному розподілу залишається при цьому проблемою самостійного аналізу.24

24 Прийоми розрахунку різноманітних помилок виводу розглядає К. В. Кемніц, який підкреслює, що формально-статистичні методи розрахунку помилок виводу повинніпередувати "інженерним"

(Т. Е, змістовним, - В. Я.) вивченням розподілу [108. С. 4]

Кілька заключних зауважень. Зі сказаного вище може здатися, що забезпечити представництво даних у вибірковому обстеженні якщо і вдається, то ціною непомірних зусиль, розумність витрат яких часто сумнівна. Рекомендується, по-перше, не впадати у відчай і, по-друге, міркувати розсудливо, маючи на увазі програмні цілі дослідження.

Якщо перед нами стоїть завдання виконати дескриптивное обстеження великої суспільної ваги, в результаті якого повинні бути зроблені висновки щодо генеральної сукупності в цілому, слід, звичайно, максимально реалізувати всі вимоги репрезентативною вибіркової процедури. Витрачені зусилля будуть не тільки виправдані, вони просто необхідні, так як помилки у висновках такого дослідження неприпустимі. Тут помилкова інформація небезпечніше її відсутність (досить послатися на помилки прогнозів результату виборів внаслідок помилок вибірки опитувань електорату або помилки в дослідженнях ринку).

Якщо ж завдання дослідження скромніші, рівень надійності планованих висновків з точки зору їх статистичної точності можна сміливо знизити, але треба вжити всіх заходів до якісного представництва вибіркової сукупності. Перебільшена увага до формально-статистичними критеріями достовірності висновків (і тим більше їх абсолютизація) за рахунок якості вихідної інформації і якості аналізу - свідоцтво професійної недосвідченості соціолога. Підкреслюючи статистичну надійність даних, він вводить в оману і себе, і, гірше того, тих, хто звик вірити в переконливість математичних розрахунків. Не можна забувати про реальну природу того, що криється за цифрами і математичними формулами. Адже самі вихідні характеристики, одержувані дослідником шляхом опитувань або іншими способами, лише умовно переводяться в кількісні показники. Часто ці кількісні відомості дуже приблизно відображають істота соціальних процесів. Тому зусилля, спрямовані на строгість статистичного обґрунтування результатів, набирають форми тільки за умови серйозного якісного аналізу проблеми, змістовного її вивчення. Буває і так, що непредставницьким в статистичному сенсі дані, неодноразово повторені на різних подвибо ^ рках, якраз свідчать про певну соціальну тенденції краще, ніж статистично достовірний висновок, зроблений на одній єдиній вибірці.

Слід постійно пам'ятати, що соціолог покликаний зосередити увагу саме на істоті соціальних проблем, активно залучати до постановки завдань дослідження інших фахівців, практиків і теоретиків, уважно стежити за літературою з широкого кола питань, що відносяться до предмету дослідження. Нарешті, для вирішення власне статистичних завдань, що стосуються типу і обсягу вибірки, він перш за все зобов'язаний максимально чітко сформулювати конкретні питання, які підлягають вирішенню, і вже після цього звертатися до відповідних розрахунків різноманітних статистик.

Принципово (СТРАТЕГІЧНИЙ) ПЛАН ДОСЛІДЖЕННЯ «-- попередня | наступна --» Загальні вимоги до ПРОГРАМІ
загрузка...
© om.net.ua