Як формувати репрезентативну вибірку?
Для досягнення зовнішньої валідності експерименту особливе велике значення має відбір досліджуваних для участі в експерименті.
Генеральна сукупність – це вся сукупність потенційних досліджуваних, які можуть бути об’єктами даного психологічного дослідження і на яких планується поширити експериментальні результати. Її вибір залежить від цілей дослідження.
Вибірка – велика кількість людей, що обирається з генеральної сукупності і бере участь у дослідженні.
Ці досліджувані, як правило, розподіляються на контрольну (КГ) й експериментальну групи (ЕГ). При цьому досліджувані повинні бути правильно розподілені по КГ і ЕГ так, щоб всі групи були еквівалентними.
Головна вимога до вибірки – її репрезентативність (представленість) – адекватності характеристик досліджуваних (вік, освіта, стать, умови їхнього життя тощо) відповідним характеристикам популяції, що вивчається. Т.б. вибірка повинна якісно і кількісно представляти, моделювати генеральну сукупність, основні типи потенційних досліджуваних, оск. висновки, що одержуються в експерименті, поширюються на всіх членів популяції, а не тільки на представників цієї вибірки.
Процес формування вибіркової сукупності в соціологічному дослідженні повністю можна описати за допомогою таких п´яти характеристик.
1. Кількість ступенів відбору.
2. Тип виділених об´єктів репрезентації при переході від одного ступеня відбору до іншого.
3. Тип районування виділених об´єктів репрезентації на проміжних ступенях відбору.
4. Способи відбору об´єктів репрезентації та одиниць спостереження на кожному ступені.
5. Розмір та обсяг вибіркової сукупності (кількість одиниць спостереження, відібраних на останньому ступені відбору).
Розглянемо детальніше кожну з характеристик.
Ступінь відбору
Об´єкт репрезентації слід відрізняти від одиниці спостереження. Об´єктами репрезентації називають елементи вибіркової сукупності, тобто територіальні спільноти та організації, в яких, у свою чергу, концентруються одиниці спостереження. Одиниці спостереження — це елементи сформованої вибіркової сукупності, які безпосередньо є джерелом соціальної інформації. І об´єкти репрезентації, і одиниці спостереження становлять соціальні об´єкти, яким властиві характеристики, що є суттєвими для предмета конкретного дослідження. Об´єкт репрезентації та одиниці спостереження можуть збігатися й відрізнятися. Вибірка є одно-ступеневою тільки тоді, коли на першому ж ступені відбору об´єкти репрезентації та одиниці спостереження збігаються.
Тип виділених об´єктів репрезентації при переході від одного ступеня відбору до іншого
На кожному ступені відбору виділяють проміжні об´єкти репрезентації, які у більшості випадків є "природними одиницями", тобто утвореннями природними, такими як політико-адміністративні райони, населені пункти, підприємства, установи, цехи, академічні групи, бригади тощо.
Виділяють два типи об´єктів репрезентації: політико-адміністративні одиниці (область, різні види населених пунктів, сільради тощо) і промислові та сільськогосподарські підприємства, установи, заклади освіти тощо. На кожному проміжному ступені відбору процес виділення об´єктів репрезентації починається з групування їх за певними ознаками у типологічні групи, з яких виділяються один або кілька найтиповіших представників. Під способом районування виділених на проміжних ступенях відбору об´єктів репрезентації розуміють алгоритми або методи типологізації їх (або одиниць спостереження) у групи, з яких відбирають найтиповіших представників.
У соціологічній і статистичній літературі описано низку алгоритмів і методів типологізації елементів у групи. Наведені методи та алгоритми типологізації можна класифікувати по-різному. Залежно від мети типологізації за основу класифікації беруть різні ознаки.
Можна виділити кілька найзагальніших видів алгоритмів і методів типологізації. До першого виду належать усі методи, що Ґрунтуються на автоматичній класифікації об´єктів дослідження. Другий вид об´єднує всю сукупність методів, що послідовно пов´язані з застосуванням факторного та кластерного аналізів, за допомогою яких відбувається дальша типологізація об´єктів дослідження. Третій вид описує методи якісного, змістовного аналізу ознак (що, зрозуміло, не виключає використання статистичних методів, що ґрунтуються на взаємозв´язку кількості страт з оцінкою дисперсії базової ознаки або з величиною витрат на проведення дослідження).
Дві вибірки подібні лише тоді, коли тотожні не тільки характеристики, що описують структуру процесу формування вибіркової сукупності, а й набори ознак, на підставі яких відбувається районування об´єктів репрезентації на проміжних ступенях відбору. Інакше застосування одних і тих самих алгоритмів і методів типологізації може призвести до того, що в типові групи буде об´єднано різні об´єкти репрезентації. Отже, незважаючи на те що структура вибіркового процесу залишається незмінною, в результаті матимемо вибіркову сукупність, яка складається з якісно відмінних об´єктів репрезентації на останньому ступені відбору.
Тип районування виділених об´єктів репрезентації на проміжних ступенях відбору
Побудуємо складну класифікацію типів та видів відбору (тобто відбори класифікуватимуться не за однією, а за кількома ознаками).
На першому етапі класифікації за основний критерій поділу існуючих типів відбору правитиме спосіб виділення одиниць відбору. Це дасть нам змогу виділити три типи відбору: суцільний, випадковий та невипадковий.
Під суцільним мається на увазі відбір, у процесі якого всі одиниці сукупності підлягають обстеженню або всі об´єкти репрезентації переходять на наступний ступінь відбору. Під випадковим відбором одиниць сукупності будемо розуміти відбір, за якого кожна одиниця генеральної сукупності матиме однакову або майже однакову ймовірність потрапити до вибіркової сукупності. Невипадковим (спрямованим) будемо називати відбір, за якого одиниці вибіркової сукупності відібрані за певним критерієм. Випадкові та невипадкові типи відборів мають кілька видів.
Способи відбору об´єктів репрезентації та одиниць спостереження на кожному ступені
Під імовірнісними розуміють відбори, за яких, по-перше, кожна одиниця генеральної сукупності зберігає рівну або майже рівну ймовірність бути відібраною до вибіркової сукупності і, по-друге, сформована таким чином вибіркова сукупність має бути досить великою за обсягом. За такого відбору елементи генеральної сукупності представлені у вибірці з імовірністю, близькою до відповідного значення в генеральній сукупності. Отже, у вибірковій сукупності немовби відтворюється розподіл ознак генеральної сукупності, що нас цікавлять.
Районування не є відхиленням від принципу випадковості при побудові вибірки, тобто в цьому разі кожна одиниця сукупності, як і раніше, має однакові шанси потрапити до вибірки, оскільки районовану вибірку можна вважати рівнозначною ряду випадкових вибірок із підсукупностей — типових районів. Разом з тим районування за умови умілого використання має своїм результатом меншу, ніж імовірнісна вибірка, дисперсію оцінок. Найточніші результати одержують, коли типові групи виділені так, що одиниці всередині кожної з них мають найбільшу схожість, тоді як одиниці з різних районів помітно різняться, оскільки помилка районованої вибірки зумовлена лише варіацією всередині виділених типових груп. Як ознаки розшарування використовуються тільки ознаки, що корелюють з досліджуваними характеристиками. Представництво таких ознак у відсотках у генеральній сукупності відоме, наявність або відсутність їх у кожній одиниці сукупності можна чітко визначити ще до початку дослідження.
Під гніздом розуміють проміжний об´єкт дослідження, який відбирається на кожному ступені і є висхідною сукупністю для наступного відбору. Гніздами можуть бути різні одиниці відбору, починаючи з міста, району і закінчуючи виробничими бригадами, сім´ями та ін. Використання гнізд суттєво ускладнює методику вибіркового обстеження, оскільки вивчення одиниць дослідження, які належать до одного й того самого гнізда, дасть значно менше інформації, ніж вивчення тієї ж кількості одиниць, розміщених у різних гніздах.
Гніздовий відбір має суттєві організаційні переваги порівняно з імовірнісним і районованим відбором. Легше зробити відбір та вивчити кілька колективів, бригад, цехів тощо, які знаходяться в одному місці, ніж кілька сотень розкиданих у просторі респондентів. Процедура відбору дає змогу сконцентрувати вибірку у порівняно невеликій кількості пунктів. У більшості випадків генеральна сукупність має чітке природне розчленування на гнізда (хоча можливі також "штучні" гнізда).
Систематична вибірка — це, як правило, вибірка з різних алфавітних списків, картотек тощо. Відбір одиниць відбувається через один і той самий інтервал (крок) у вихідному алфавітному чи пронумерованому списку, до того ж номер у списку, з якого починається відбір, визначається випадково.
Найпоширенішим серед невипадкових методик формування вибіркової сукупності є квотний відбір. Відбір за квотами відрізняється від випадкових методик кількома ознаками. На відміну від імовірнісного (як одного з видів випадкового відбору), він передбачає наявність статистичних даних за низкою суттєвих або корелюючих з ними характеристик генеральної сукупності. Відповідно до складу генеральної сукупності встановлюють квоти для певних суттєвих ознак (переважно соціально-демографічних). У такий спосіб намагаються досягти адекватності вибіркової та генеральної сукупностей. Інтерв´юер, одержуючи завдання опитати заплановану кількість одиниць у квоті, сам здійснює вибір одиниць, що потраплять до вибірки.
Одним з видів невипадкового відбору є метод основного масиву. Спостереженню підлягає така група одиниць генеральної сукупності, частка якої, на думку дослідника, "цілком достатня" або "досить значна". Не виключені випадки, коли одиниці генеральної сукупності беруться довільно, на підставі "інтуїції" дослідника. Позитивним моментом такого підходу є його економічність. Проте "цілеспрямовані" відбори, як і відбори методом основного масиву, переважно довільні щодо ознак, суттєвих стосовно явищ, що вивчаються, та інтерпретації одержаних даних. Застосування методу основного масиву можливе лише в тому разі, коли дослідник цілком упевнений, що частина сукупності, яка не потрапила до вибірки, не може впливати на висновки дослідження. Якщо такої впевненості немає, застосовувати метод не можна.
Одним з видів невипадкового відбору є стихійний відбір. Будуючи вибіркову сукупність методом стихійного відбору, соціолог не має можливості забезпечити відповідність вибіркової сукупності генеральній за всіма ознаками, що характеризують одиницю спостереження.
Головними чинниками, що визначають природу стихійного відбору, є готовність соціолога мати справу з максимально доступними одиницями сукупності (чинник доступності), а також його прагнення гарантувати за умови обмежених ресурсів вихід на ті одиниці сукупності, які мають шукані ознаки (чинник цілеспрямованості). Перший чинник означає, що організатор дослідження готовий погодитися з тим, що рішення про занесення до вибірки належить потенційному респонденту. Другий чинник передбачає, навпаки, що це рішення належить досліднику.
Прикладами опитувань, що проводяться за допомогою стихійного відбору, є дослідження "маятникової міграції" населення. Опитування респондентів відбувається в електропоїздах, автобусах тощо. Для інтерв´юера важлива лише належність респондента до "мігрантів" та згода його відповісти на запитання інтерв´юера (респондент сам заносить себе до вибірки).
Розмір та обсяг вибіркової сукупності (кількість одиниць спостереження, відібраних на останньому ступені відбору)
Величина експериментальної вибірки визначається цілями і можливостями, а також видом статистичних мір і обраною точністю (вірогідністю) прийняття або відкидання експериментальної гіпотези.
Чисельність вибірки в більшості випадків варіює від 1 до 100 осіб, але може досягати декількох тисяч чоловік.
Доцільно, щоб вибірка складала не менше 30-35 осіб, а з урахуванням природного відсіву слід передбачити чисельність вибірки на 5-10% більше, ніж потрібно, оскільки частина з них буде “відбракована” у ході експерименту або при аналізі експериментальних протоколів (не зрозуміли інструкцію, не прийняли завдання, дали “девіантні” результати й т.д.).
У разі факторного експерименту кількість досліджуваних повинна не менш ніж у 3 рази перевищувати кількість параметрів, які реєструються в експерименті.
Що стосується складу за статтю і віком, то рекомендується (крім спеціальних випадків) розбивати загальну групу на підгрупи чоловіків і жінок і обробляти дані окремо для кожної підгрупи. Віковий склад визначається відповідно до цілей дослідження.
Використані джерела:
1. Приклад формування репрезентативної вибірки. Навчальні матеріали онлайн. - [Електронний ресурс]. - Режим доступу: 1
2. Експериментальна вибірка. Файловий архів студентів. - [Електронний ресурс]. - Режим доступу: 2
3. Соціологія. Вибірка в соціологічному дослідженні. - [Електронний ресурс]. - Режим доступу: 3