DIAC: Маркетинговые и социологические исследования
RUS ENG
НачалоСправочнаяСоциологический ликбез
О компании
Услуги
Наши проекты
Публикации о нас
Заказчики
Аналитика
Цифры недели
Новости и события
Справочная
Словарь терминов
Социологический ликбез
Обратная связь
Начало
Карта сайта
Ссылки
Контактная информация
+38 062 345 0473
+38 062 381 3931


Rambler's Top100

Рейтинг@Mail.ru
 

Выборочный метод в социологических исследованиях

Как правило, объект социологического исследования включает в себя значительное число отдельных элементов (респондентов, торговых точек, номеров газет или журналов и т.п.), каждый из которых является источником необходимой нам информации. И было очень трудно, а чаще всего — практически невозможно, обеспечить сплошной сбор информации, т.е. опросить, например, все взрослое население какого ни будь города. Вот почему в тех случаях, когда объект исследования складывается из 500 и более элементов, социологи применяют выборочный метод сбора информации. Сущность этого метода состоит в том, что он дает возможность сделать заключение о характеристиках изучаемых признаков у объекта в целом (генеральной совокупности) , измеряя эти признаки только у некоторой части элементов, составляющих этот объект. Такая часть специально отобранных для изучения структурных элементов объекта получила название выборочной совокупности.

Правомерность использования выборочного метода в социологических исследованиях базируется на двух основных принципах.

Во-первых, на взаимосвязи и взаимообусловленности качественных характеристик и признаков социальных объектов. Иными словами, на предположении о том, что интересующие нас значения признаков связаны со значениями ряда заранее известных качественных характеристик объекта. Такими качественными характеристиками (их еще называют контрольными признаками) объекта, для социолога обычно выступают пол, возраст, уровень образования, род деятельности, место проживания и ряд других признаков, по которым имеются заранее известные статистические данные. Как показывает практика социологических исследований, от значения именно таких признаков очень часто зависят значения признаков, которые социолог изучает (например, разного рода мнения, оценки, установки, ценностные ориентации, предпочитаемые образцы поведения, мотивы и т.д.).

Во-вторых, на допустимости выводов об объекте на основании изучения его части при условии, что по своей структуре эта часть является микромоделью объекта, т.е. при условии, что выборочная совокупность воспроизводит основные характеристики генеральной совокупности. На практике это обеспечивается путем отбора в выборочную совокупность элементов из генеральной совокупности так, чтобы они воспроизводили пропорции генеральной совокупности по ряду кон-трольных признаков. Например, по удельному весу мужчин и женщин, лиц разного возраста, уровня образования и т.д. Обычно при построении выборочной совокуп-ности используются значения двух-трех контрольных признаков, о которых из-вестно, что их значения связаны со значениями исследуемых признаков. При этом предполагается, что значения исследуемых признаков в выборочной совокупности будут отклоняться от своих значений в генеральной совокупности на такую же ве-личину, на которую отклоняются значения контрольных признаков. Такая выбо-рочная совокупность считается репрезентативной, т.е. представляющей генеральную.

Уровень репрезентативности полученной выборки определяется с помощью специального статистического показателя — ошибки выборки, т.е. величины, на которую структура выборки отклоняются от структуры генеральной совокупности. Например, институт Дж. Гэллапа, систематически проводящий обследования общественного мнения по национальной выборке объемом 1500 человек, контролирует репрезентативность по имеющимся в национальных цензах данным о распределении населения по полу, возрасту, образованию, доходу, профессии, расовой принадлежности (белый — цветной), месту проживания, величине населенного пункта.

В исследованиях, проводимых Всероссийским центром изучения общественного мнения, надежность выборочных данных также оценивается посредством «апостериорного» контроля. В анкету мониторинга экономических и социальных перемен включены признаки (вопросы), по которым имеется информация в Государственном комитете по статистике Российской Федерации. Такими признаками являются пол, возраст, образование, тип поселения, семейное положение, сфера занятости, должностной статус респондента. Четыре показателя — пол, возраст, образование и место жительства респондента используются для выделения контролируемых групп при определении весов опрошенных — они должны соответствовать аналогичным группам в генеральной совокупности.

Ошибки выборки подразделяются на два типа. Случайные ошибки уменьша-ются при возрастании объема выборочной совокупности. Так кубик при достаточ-но большом числе бросаний будет падать примерно равное количество раз на каж-дую грань. При нескольких бросаниях он может показать преимущественное выпа-дение, например «шестерки». Тогда мы говорим, что число наблюдений слишком мало, чтобы судить о неслучайности выпадения «шестерок». Но если «шестерки» выпадают постоянно при сотнях и тысячах бросаний, мы говорим: крайне малове-роятно, чтобы это происходило случайно. Таким образом, случайная ошибка — это вероятность того, что выборочная средняя выйдет (или не выйдет) за пределы за-данного интервала. При случайном отборе следует неукоснительно соблюдать сле-дующую заповедь: критерии доступа к единицам исследования должны быть неза-висимы от изучаемых переменных.

Чудесное свойство случайных ошибок уменьшаться при возрастании объема выборочной совокупности делает бессмысленными обследования огромных массивов, которые предпринимаются чаще всего с целью произвести впечатление на профессионально неподготовленного заказчика. Даже национальные выборки достаточно малы.

В практике массовых опросов относительная несущественность количества обследованных для получения точных результатов демонстрировалась неодно-кратно. Надо заметить, что предвыборные опросы — вероятно, единственная об-ласть социологических обследований, в которых выборочные параметры получают незамедлительное подтверждение либо опровержение: параметры генеральной со-вокупности обнаруживают себя сразу же после подсчета голосов. В остальных об-следованиях такой возможности нет, генеральная совокупность ничем себя не по-казывает. В получении точных данных при минимальной выборке и проявляется мастерство «поллстера».

Итак, даже очень маленькая выборка при условии, что она хорошо распределена в генеральной совокупности, может быть вполне репрезентативной. Чем больше объем выборки, тем выше точность ее результатов, однако очевидно, что огромная выборка не гарантирует стопроцентного попадания. Плохо распределенная выборка в десять миллионов человек хуже, чем хорошо распределенная выборка в сто человек.
Со времени своего создания в 1935 г. Американский институт общественного мнения провел сотни предвыборных опросов. Средняя ошибка репрезентативности в 1936—1940гг. составляла 5,6 процентных пункта, в 1940—1944 гг. — 3,4, в 1944—1947 гг. — 2,6. В 1944 г. прогноз Гэллапа на президентских выборах был выполнен с точностью до 1,8 процентных пункта, а средняя ошибка по 48 штатам составила 2,5. В 1950—1958 гг. ошибка прогноза была 1,7 процентных пункта, в 1960—1968 гг. — 1,5, в 1970—1978 гг. — 1,1.

Второй тип ошибок выборки — систематические ошибки. Это неконтроли-руемые перекосы в распределении выборочных наблюдений, которые приводят к «утере» проектируемого объекта исследования. В отличие от случайных система-тические ошибки распределяются вокруг средней неравномерно, при возрастании объема выборки не уменьшаются. Число опрошенных здесь уже не имеет значения, потому что фактическая генеральная совокупность — та, что соответствует выбор-ке, уже «уехала» от проектируемой, а исследователь продолжает надеяться на ре-презентативность. Систематические ошибки в отличие от случайных не поддаются предварительному контролю.

Осенью 1936 г. в истории социологических исследований произошло событие, радикально изменившее представления о построении выборки для массовых опросов. В первые десятилетия XX в. американские газеты и журналы соревновались за то, чтобы стать выразителями общественного мнения. Журнал «Литерэри Дайджест» проводил «соломенные опросы» перед выборами с 1925 г. и никогда не ошибался. Рассылались миллионы почтовых бюллетеней — тем, кто числился в телефонных справочниках и списках автовладельцев. Система работала хорошо до тех пор, пока избиратели со средними и высокими доходами голосовали в равной степени и за демократов, и за республиканцев. И наоборот: избиратели с низкими доходами были склонны голосовать за любого кандидата.
С началом «Нового курса» американский электорат стал резко стратифицироваться: люди с доходами выше среднего, придерживавшиеся демократических взглядов, переменили их на республиканские, а те, кто принадлежал к малодоходным группам, стали симпатизировать демократической партии.

 В 1936 г. на пост президента США претендовали Франклин Рузвельт — демократ и Альфред Лэндон — республиканец. Журнал «Литерэри Дайджест» разослал по почте десять миллионов бюллетеней — была охвачена примерно треть американских семей. Вернули бюллетени 2 376 523 человека. Очевидно, что выборка «Литерэри Дайджест», состоящая из владельцев телефонов и автомобилей, была обречена на смещение в пользу республиканцев. Так и получилось. Предвыборный опрос показал, что за Лэндона собираются проголосовать 57% избирателей, а за Рузвельта — 43%. На выборах же победил Рузвельт с результатом 62,5%, а за Лэндона было подано 37,5% голосов.

 К этому времени службы Дж. Гэллапа, Э. Роупера и А. Кроссли уже давно вели эксперименты с выборочными опросами. В частности, Гэллап в 1935 г. уста-новил сдвиг политических ориентации состоятельных избирателей вправо, а бед-ных — влево. В 1936 г. он обнаружил, что большинство владельцев телефонов предпочитают Лэндона Рузвельту, в то время как только 18% получающих пособие собираются голосовать за Лэндона. 12 июля 1936 г., когда началась предвыборная кампания, Гэллап опубликовал статью с предупреждением об ошибке «Литерэри Дайджест», который, как считал автор, по всей вероятности, предскажет победу Лэндона над Рузвельтом со счетом 56: 44. Гэллап получил этот прогноз, разослав по почте всего 3 тыс. бюллетеней. Он подробно проанализировал причины воз-можной ошибки. В ответ в «Литерэри Дайджест» была опубликована сердитая ста-тья, где редактор писал: «Никогда и никто еще не предсказывал результаты наших опросов еще до того, как они начались... Нашему доброму статистическому другу можно было бы напомнить, что эти старомодные методы обеспечивают «Дайдже-сту» правильные прогнозы с точностью до одной сотой процента».

Основной источник систематической ошибки в опросе «Литерэри Дайджест» — использование для определения адресов респондентов телефонных справочников и регистрационных книг владельцев автомобилей. Естественно, выборка сместилась в сторону «верхних» слоев социальной структуры. Владельцы телефонов и автомобилей — группы, в значительной степени пересекающиеся, — и составили реальный объект исследования, в то время как проектируемый объект отождествлялся с электоратом США. В итоге сформировалась выборка из респондентов, избирательные предпочтения которых отличались от предпочтений среднего американца. Средневыборочные значения оказались смещенными в сторону более состоятельных и образованных слоев населения.

Эти социально-структурные параметры имели определяющее влияние на распределение доверия к Рузвельту среди электората. Проводимый президентом с 1932 г. «Новый курс» был основан на вмешательстве государства в сферу свободного предпринимательства, антимонопольной политике и защите интересов низших слоев населения, в том числе расширение избирательных прав для иммигрантов. Немаловажным фактором, обусловившим размежевание позиций избирателей, был и процесс крупных корпораций против Рузвельта в Верховном суде, который был выигран «капиталистами» в 1936 г. Это способствовало его популярности среди низших классов. Да и сам облик Рузвельта — человека, с молодых лет прикованного к инвалидной коляске, но сумевшего стать выдающимся политиком, импонировал демократическому большинству. Оптимальное размещение выборки в таких условиях было несовместимо с «уклоном» в сторону богатых. Этот «уклон» значительно усилился по причине пренебрежения со стороны аналитиков «Литерэри Дайджест» к динамике электоральных предпочтений в различных социальных стратах.

 В предыдущих опросах «Литерэри Дайджест» анкеты рассылались тем же группам и прогнозы оправдывались, но в 1936г. не были учтены два исключительно важных обстоятельства: во-первых, дифференциация избирательных установок в зависимости от уровня доходов — эта тенденция усилилось с приходом в 1932 г. в Белый дом президента Рузвельта; во-вторых, значительное расширение избирательного ценза. Новые контингенты электората в основном принадлежали к беднейшим классам — они и предпочитали видеть Рузвельта на посту президента.

 Метод исследования — почтовый опрос — также усугубил ошибку. Вероятность возврата вопросника по почте была и остается намного выше у людей с высоким образованием и доходами выше среднего, а те, кто не возвратил заполненный вопросник, как правило, принадлежали к низшим классам. Поэтому, если бы даже поллстеры из «Литерэри Дайджест» использовали списки избирателей, а не телефонные справочники, выборка все равно оказалась бы смещенной в сторону богатых и образованных.

Против «Литерэри Дайджест» работал и фактор времени. Состоятельные и более образованные люди обычно определяют «своего» кандидата на президентских выборах еще летом и, вообще, заранее имеют по этому поводу обоснованную позицию, а «простые» люди ничего заранее не умышляют. «Литерэри Дайджест» опрашивал миллионы преуспевающих американцев как раз в начале сентября, когда богатые уже определились в своем выборе, а бедные еще нет. Ошибочно предполагалось, что полученная картина сохранится до ноября, в том числе сохранится и доля тех, кто не мог сказать ничего определенного. К осени ситуация стала меняться. Количество определившихся в своем «нет» Рузвельту осталось относительно стабильным, зато подгруппа не имеющих мнения начала резко сокращаться и перетекать в «да» Рузвельту. Так величайшая по объему выборка в истории массовых опросов оказалась ошибочной, и инцидент показал, что главное для репрезентативности — не объем, а хорошее размещение единиц отбора.
«Каждая единица имеет равный шанс попасть в выборку» — первый прин-цип отбора в выборочную совокупность. Тогда же, в июле 1936 г., молодые и еще неизвестные поллстеры (так стали называть тех, кто проводит массовые опросы, в отличие от социологов), опросив несколько тысяч человек, точно предсказали по-беду Рузвельту. С этого времени начался институциональный период в истории об-следований общественного мнения. Институты Гэллапа, Роупера и Харриса к нача-лу 1960-х гг. уже были международными корпорациями.

 Почему появляются систематические ошибки? Первая и наиболее часто встречающаяся ошибка связана с давлением доступных объектов. В результате происходит необоснованная экстраполяция реального объекта на проектируемый. В выборке «Литерэри Дайджест» возможности доступа к респондентам, предоставляемые телефонными справочниками и регистрационными карточками автовладельцев, снизили у исследователей чувство опасения перед ошибкой. При использовании прессового опроса, когда на опубликованные в газете вопросы отвечают те, кто захотел отвечать и взял на себя труд вернуть анкету обратно, давление доступных объектов ощущается особенно сильно. При уличном опросе интервьюеры будут вынуждены беседовать с теми, кто согласится отвечать на вопросы.

Другой пример систематической ошибки, которая войдет в историю социологических обследований. Причины этой ошибки остаются не вполне ясными, но роль давления доступных данных несомненна. В декабре 1993 г. в России проходили выборы в Федеральное собрание. Многие социологические службы осуществляли массовые опросы и давали ориентировочные прогнозные оценки относительно исхода голосования. Результаты голосования показали, что данные опросов существенно отклоняются от реальных предпочтений избирателей. Так, за партию «Выбор России», по данным Центральной избирательной комиссии, проголосовали 15,74% населения. Самооценка партий и политических блоков, осуществленная в начале ноября, показала цифру 38%. По данным Института социологии РАН (В.А. Мансуров), за «Выбор России» собирались голосовать 25,4%. Институт социальных технологий «Социограф» Российской академии управления (В.М. Соколов) получил достаточно близкую к истинной цифру: 13%. Институт социально-политических исследований РАН на основе опроса 1650 человек в 9 регионах России 20 ноября 1993 г. точно предсказал результат голосования по «Выбору России»: 15%.

 За Либерально-демократическую партию России проголосовало 23,21% из-бирателей. Но ни одна из социологических служб не получила данные о собираю-щихся отдать свои голоса за ЛДПР больше чем 9,9% (Институт социологии РАН). Если причина ошибок заключается в погрешностях выборки, то такая погрешность была допущена всеми социологическими службами. Можно предположить, что на результаты опросов оказали давление политически информированные, активные респонденты, имеющие свое мнение о кандидатах в законодательный орган. Масса «пассивных» респондентов, по всей вероятности, не обнаружила своих политиче-ских предпочтений в ходе опросов, а на выборах отдала голоса Жириновскому, фи-гура которого трактовалась демократически настроенными аналитиками как оди-озная. Нельзя также исключить, что предпочтения избирателей стали резко менять-ся за неделю до голосования. Как показали исследования ряда социологов, избира-тели, затруднившиеся с ответом за неделю до выборов и, следовательно, приняв-шие свое решение накануне выборов, резко изменили соотношение сил в пользу Либерально-демократической партии России в группах служащих, рабочих, пен-сионеров.

 Причины таких сдвигов остаются неясными. Нельзя исключить ни массированного воздействия средств массовой информации, ни антиправительственных настроений среди большинства населения, особенно в периферийных регионах страны. Давление доступных данных проявилось в том, что определенные ответы по поводу предстоящего голосования дали демократически настроенные респонденты, а консервативные, скажем, подавленные развитием капитализма в России, предпочитали долгое время сомневаться — во время выборов они обнаружили свое «против».

Второй тип систематической ошибки связан с иллюзией постоянства. В предвыборных опросах, как мы видели, иллюзия постоянства проявляется в пре-небрежении группой респондентов, не имеющих определенного мнения. Ее чис-ленность, как правило, резко снижается в предвыборные дни. Далеко не все пере-менные устойчивы. В подавляющем большинстве случаев постоянными являются пол, социальное происхождение, группа крови, темперамент. Более лабильны се-мейное положение, должность и, бывает, национальность. Распределение видов деятельности в суточном бюджете времени изменяется достаточно стабильно в за-висимости от времени года, пола, возраста и профессии. Например, можно с боль-шой степенью точности сказать, сколько времени тратят пенсионеры зимой на про-смотр телепередач. Социологические переменные субъективного плана — мнения, оценки, установки, намерения — меняются столь же быстро, сколь хаотично, ино-гда под влиянием непредвиденных обстоятельств. Социологу надо «накрыть» ге-неральную совокупность, но «накрыть» ее в том месте, где она появится через оп-ределенное время. Поскольку траектории социологических переменных изучены слабо — повторные и продолжающиеся исследования трудоемки и встречаются сравнительно редко — подобные экстраполяции выборки производятся эвристиче-ски, «на глаз», но даже в таком случае полезно фиксировать прогноз динамики пе-ременной хотя бы в терминах «возрастет», «снизится», «будет колебаться». Образ-цовым остается исследование Б. Берельсона, П. Лазарсфельда и В. Макфи — они установили циклы электоральных предпочтений американцев в предвыборные ме-сяцы и даже недели. Зависимость распределения времени различных социальных и возрастных групп от будних и выходных дней, летних и зимних месяцев изучалась десятки раз, и в данном случае есть все основания говорить о хорошо прогнози-руемых процессах.

Часто в социологических исследованиях динамика переменных остается непрогнозируемой и выборки в данном случае имеют эпизодический характер — т. е. сама выборка являет собой не более чем эпизод. Обычно данные о субъективных и тому подобных эфемерных и ситуативных признаках привязаны к определенному периоду и за его пределами теряют смысл. Например, «рейтинг популярности» политического лидера сохраняется как факт массового сознания недолго. Мирская молва — морская волна. Примерно то же самое — реакция публики на телепередачи либо политические события. В данном случае мы имеем дело с исследованием-однодневкой. Его результаты должны появиться завтра на газетной полосе и тут же устареть. Аналогичная ситуация складывается в маркетинге — экспозиция рекламного «паттерна» требует немедленного анализа и прослеживания его влияния на сознание потенциальных покупателей, пока «паттерн» не потеряет свою эффективность. Обычно «моментные» выборки применяются в тех областях социологии, которые ориентированы не на концептуальные результаты, а на внешнего заказчика и выполняют «обслуживающие» функции.

Третий тип систематических ошибок — недостаточный учет аномальных и труднодоступных единиц исследования. Речь идет о тех, кто в силу обстоятельств имеет меньшую вероятность попасть в выборку. Если первый тип систематической ошибки связан с давлением доступных единиц, в данном случае причину ошибки можно обозначить как ненавязчивость малодоступных единиц. Их мало, и социо-лог уже на стадии проектирования генеральной совокупности должен решить, сто-ит ли пренебрегать малочисленными группами лиц, лишенных свободы, не имею-щих определенного места жительства, работающих в отрыве от дома и т. п. Если учет малодоступных единиц не имеет существенного значения для исследования (в большинстве случаев бывает именно так), следует указать, что они исключены из выборочной совокупности. К малодоступным единицам относятся также больные, в частности, находящиеся в стационарах, очень нелегко получить возможность об-следовать личный состав Вооруженных Сил (здесь может заключаться источник серьезных систематических ошибок).

Меньшие шансы на попадание в выборку имеют те, кого нет дома, и отказывающиеся сотрудничать с интервьюером. Недостаточный учет отсутствующих в месте сбора данных, как правило, по месту проживания, — четвертый тип систематических ошибок. Казалось бы, не оказаться дома в момент посещения интервьюера может любой человек (канон полевого исследования требует, как минимум, троекратного посещения). На самом деле, отсутствуют дома вполне определенные контингенты населения. По данным Н.Н. Чурилова, при первом посещении интервьюерам удается опросить большую часть женщин и меньше половины мужчин; при трехкратных посещениях обнаруживается, что в числе 4 — 7% труднодоступных респондентов также преобладают женщины. Среди рабочих труднодоступных респондентов 5%, среди служащих — 8%. Чем моложе респонденты, тем больше вероятность опросить их при первом визите интервьюера. С увеличением возраста респондентов увеличивается доля труднодоступных — это противоречит распространенному мнению, будто люди старшего возраста менее мобильны, чем остальные группы населения. Наиболее доступны респонденты, никогда не состоявшие в браке, — после трехкратных визитов интервьюеров доля опрошенных составила 99—100% [см.: 8, с. 140-146].

Пятый тип систематических ошибок — отказы от ответа, которые в зави-симости от темы опроса могут составлять довольно значительный процент запла-нированных интервью. Особенно часто отказы от ответа наблюдаются в крупных городах. Проблема заключается в том, что в отличие от отсутствующих дома отка-зывающиеся отвечать, по данным исследований, существенно отличаются от со-трудничающих с интервьюером. В частности, имеющие высокое образование и информированные респонденты склонны говорить «не знаю» в противоположность малограмотным и самоуверенным, у которых есть ответ на любой вопрос.
Среди причин отказа от ответа можно указать три наиболее важных. Первая причина связана с содержанием вопросов, недостаточной осведомленностью респондента в предмете обсуждения либо нежеланием говорить на определенные темы. Некоторые исследуемые социологом переменные не реагируют на смещение выборочной совокупности, связанное с отказом отвечать на вопросы, другие более чувствительны. Например, беседа с интервьюером по вопросам интимной жизни вызывает затруднение у многих респондентов. В период перестройки (вторая половина 1980-х гг.), когда советские социологи увлекались «острыми» вопросами, трудящиеся старались воздерживаться от ответа или обнаруживали малую осведомленность в актуальных политических темах. Например, многие не могли сказать, как относятся к диссидентам, поскольку они ассоциировались и с пьяницами, и с лицами без определенного места жительства. С другой стороны, респонденты активно отвечали на вопросы, о которых не имели представления. Н.А. Клюшина показала, что высокий процент не ответивших в некоторых случаях свидетельствует о качественной информации. По ее данным, включение вопросов-фильтров при обсуждении проблем внутренней политики приводит к увеличению числа неответивших на 11% и при обсуждении внешней политики — на 16%.

 Вторая причина — нежелание отвечать в силу недоброжелательной установки по отношению к интервьюеру либо к такого рода опросам вообще. Этот аспект изучен недостаточно. Каких-либо систематизированных наблюдений не имеется, хотя в литературе отмечается возрастание общего количества «заисследованных досмерти» (surveyed to death) респондентов. Скорее всего это преувеличение. Наиболее способные и опытные интервьюеры умеют завоевывать доверие респондента и преодолевать его нежелание сотрудничать.

Третья причина — внешние обстоятельства, препятствующие контакту, не-смотря на информированность респондента и желание сотрудничать. Наиболее труднодоступными, поданным Н.Н. Чурилова, являются семейные респонденты — многие из них не могут выделить 40 — 50 мин для беседы с интервьюером, коли-чество отказов от интервью составляет 2,5%, респонденты отсутствуют дома по из-вестным либо неизвестным причинам в 5,2% случаев. По данным опроса 395 моло-дых рабочих в 1982 г. в Киеве, несостоявшиеся интервью связаны с отпуском рес-пондента (0,4%), болезнью (0,4%), отказом от опроса (3,2%), декретным отпуском (3,6%), призывом в армию (1,2%), увольнением с места работы (2,0%). Другие при-чины отсутствия ответов обусловлены утерей анкет, отказом вернуть заполненные анкеты и т. п. Общая величина систематической ошибки, как показал Н.Н. Чури-лов, составляет 3,03%, что существенно не влияет на выборочную среднюю. Уро-вень систематической ошибки можно несколько снизить заменой отсутствующих либо отказавшихся отвечать респондентов лицами из резервного контингента, но самым надежным способом реализации выборки являются повторные посещения. Однократное посещение обеспечивает опрос примерно 55% респондентов, второе и третье посещения увеличивают это число до 95 — 9б% [см.: 8, с. 139-149].

Повторные посещения респондентов, отсутствующих дома, обходятся довольно дорого. Поэтому в 1950-е гг. в Институте Гэллапа была разработана система интервьюирования, названная «Время—Место». Было проведено специальное исследование и установлено: кто, когда с наибольшей вероятностью находится дома. Естественно, что опросы обычно проводятся в вечернее время и в выходные дни.
Общее количество отказов варьирует от 5% в переписях населения США до 30% в отдельных «трудных» обследованиях, например касающихся доходов или интимной жизни. Особенно много отказов в крупных городах. Менее всего расположены к сотрудничеству с интервьюером белые и высокообразованные люди. Возможно, увеличение отказов в последние годы обусловлено соображениями безопасности. Определенную роль играет и снижение уровня подготовки интервьюеров, которые в большинстве случаев рассматривают это ремесло как временную подработку.

 Вряд ли возможно предвидеть все систематические ошибки, встречающиеся в массовых опросах. Например, в исследовании воспроизводства трудовых ресур-сов Киева в 1984г. применялся отбор респондентов по избирательным спискам — выписывался адрес каждого сотого избирателя. В.И. Паниотто заметил, что, если начинать отбор по алфавитному списку, получат преимущество респонденты, фа-милия которых начинается на букву «А». Возникнет систематическая ошибка: в ча-стности, большие шансы на то, чтобы попасть в выборку в Киеве, получат армяне, поскольку их фамилии часто начинаются на «А». Чтобы избежать этого, В.И. Па-ниотто начинал отбор в каждом списке с номера, равного целой части числа к/7 + 6/7 , где к — номер избирательного участка, изменяющийся от 1 до 700 [см.: 5, с. 82].

Каковы способы отбора единиц исследования? Н.Н. Чурилов выделяет сплошной, случайный и неслучайный способы отбора единиц исследования. К случайной выборке он относит выборку вероятностную, систематическую, районированную и гнездовую. Неслучайные методы отбора — «стихийная» выборка, квотная выборка и метод «основного массива» [8, с.13-27].

Если генеральная совокупность имеет небольшой объем и можно обеспечить равную вероятность отбора каждой единицы исследования, применяется вероятностная выборка. Это не просто случайный бессистемный отбор, а строгая процедура, чаще всего основанная на использовании таблицы случайных чисел. Такого рода процедуру можно использовать только в том случае, если единицы исследования удается пронумеровать.

 Однако чаще всего приходится разделять обследуемую совокупность на более или менее однородные части и затем осуществлять отбор единиц внутри этих частей. Такое разделение совокупности на части называется районированием. Проблема заключается в обеспечении однородности выделяемых классов на основе существенных для исследователя критериев. Для решения такой задачи необходимо располагать данными о структуре генеральной совокупности и, в частности, о распределении признака районирования. Выделенные «районы» должны существенно отличаться друг от друга, но им должна быть присуща внутренняя однородность.

 Противоположность районированной выборке составляет выборка гнездовая, где обследуется промежуточный объект. Первоначально гнездовая выборка разрабатывалась в сельскохозяйственной статистике. В качестве социологических гнезд могут выступать населенные пункты, районы, предприятия, бригады. Реализовать такую выборку намного легче, чем вероятностную либо районированную. Единицы исследования здесь размещены компактно. Проблемы, которые возникают при гнездовом отборе, связаны с определением величины гнезда, количеством гнезд, которые надо обследовать, и их размещением в генеральной совокупности.

Систематический отбор является упрощенным вариантом случайного отбо-ра. В основу выборки здесь положены не вероятностные процедуры, а алфавитные списки, картотеки, схемы, которые, как предполагается, не зависят от изучаемого признака и обеспечивают равновероятность попадания в выборку всех единиц ге-неральной совокупности.

Квотный отбор основан на целенаправленном формировании структуры выборочной совокупности. Интервьюер получает задание опросить некоторое количество лиц определенного возраста, пола, образования и профессии. Удельный вес квоты в выборочной совокупности должен соответствовать ее удельному весу в генеральной совокупности. Обычно квотная выборка используется на последних ступенях отбора и завершает процесс районирования и применения вероятностных процедур. Например, в штате Нью-Йорк проживает 10% населения США. Следовательно, 10% интервью должны быть проведены в Нью-Йорке. Если объем национальной выборки 10 000 человек, то на Нью-Йорк приходится 1000 интервью. Далее. НьюЙорк Сити включает 40% населения штата. Следовательно, 400 интервью будут проведены в Нью-Йорк Сити. Поскольку третья часть жителей Нью-Йорк Сити живет в Бруклине, 133 интервью будут проведены в этом районе. Кроме территориальных признаков, для определения квоты выбираются социальный статус, возраст, пол, иногда раса. Распределение этих признаков в генеральной совокупности известно и нетрудно обеспечить ее идентичность структуре выборки. Но при соблюдении квот остается много возможностей для систематических ошибок. В частности, интервьюер, разыскивая респондента определенного пола, статуса и возраста в заданном районе, предпочтет беседовать с более привлекательными и коммуникабельными людьми. Дж. Гэллап отмечал, что в квотных выборках обнаруживается слишком много людей, окончивших колледж, с доходами выше среднего, республиканцев по политическим ориентациям. Поэтому вероятностный отбор обладает немалым преимуществом перед квотным: выборка меньше зависит от инициативы интервьюера.

 Метод стихийного отбора внешне похож на случайный. Исследователь здесь имеет дело с максимально доступными для него единицами наблюдения и исходит по преимуществу только из критерия принадлежности респондента к про-ектируемой генеральной совокупности. Чаще всего в данном случае допускаются неконтролируемые систематические ошибки. Особенно это относится куличным опросам, когда фиксируется мнение тех, кто имеет возможность и желание погово-рить с интервьюером. Существенную роль в данном случае играет взаимное распо-ложение при встрече. Нередко интервьюер, получив задание провести опрос, об-ращается к своим знакомым. Обследования, проводимые с помощью публикуемых в газетах вопросников, строго говоря, относятся к воображаемому объекту. Оце-нить репрезентативность выборочных средних при стихийном отборе практически невозможно. К стихийному отбору относится и метод основного массива, пре-имущество которого состоит в том, что выборочная совокупность составляет зна-чительную долю генеральной и перекрывает возможное смещение. Например, при обследовании коллектива предприятия вполне достаточно опросить «большинст-во» работников и это обеспечит близость выборочной и генеральной средних.

 Каким же должен быть объем выборочной совокупности, чтобы значения измеренных в ней признаков достаточно хорошо совпадало со значениями этих же признаков в генеральной совокупности? Поиск ответа на этот вопрос сопряжен с определенными сложностями, он потребует от социолога высокой профессиональ-ной подготовки и определенного практического опыта. В самом же общем виде этот ответ может быть следующим. Объем вероятностных выборок определяется по специальным формулам, в которых принимается во внимание приемлемый для заказчика размер погрешности, доверительная вероятность полученных результа-тов, особенности вариации значений признака, и, возможно, — объем генеральной совокупности. Более детально познакомиться с теоретическими основами расчета объема выборки можно в специальных работах [см., например: 3, 5, 6, 8]. Что каса-ется эмпирических выборок, то их объем определяется, исходя, в основном, из эм-пирического опыта социолога. Так, оптимальный объем квотной выборки может быть определен по специальным таблицам [см., например, 5] или же рассчитан со-циологом для ситуации, когда вариация исследуемого признака будет максималь-ной. Аналогичным образом можно поступить и при определении объема стихий-ной выборки. Однако, чтобы избежать грубых ошибок, в этом случае лучше ис-пользовать выборки большего объема. Например, при массовых опросах, если ве-личина генеральной совокупности составляет менее 5000 человек, достаточным яв-ляется объем не менее 500 человек. Если же величина генеральной совокупности более 5000 человек, отбирают 10% ее состава, но не более 2000-2500 человек. Это позволяет рассчитывать на достаточно достоверные результаты исследования [см.: 2].

Словарь терминов
Социологический ликбез
 
© Создание и поддержка: Агентство Интернет-Решений "Zveno", 2005—2009