Читайте также:
|
|
После отбора единиц в выборку производится расчет обобщающих выборочных характеристик: выборочной средней и выборочной долей единиц обладающих интересующим нас признаком в общем количестве единиц выборки.
Разность между определенными показателями выборки и аналогичными показателями генсовокупности называется ошибкой выборки, имеющая объективный характер. Изучение и измерение ошибок выборки (репрезентативности) является основной задачей выборочного метода в статистике. Необходимо также отличать ошибки выборки и ошибки регистрации, которые субъективны. Выборочная средняя и выборочная доля – это случайные величины, принимающие различные значения из-за того, какие единицы попали в выборку. Следовательно, ошибка выборки также величина случайная и может принимать различные значения. Поэтому определяют среднюю из возможных ошибок выборки. Она равно среднему квадратическому отклонению деленному на квадратный корень из численности выборки. В этих формулах числители это характеристики генсовокупности которые при выборочном наблюдении неизвестны, поэтому на практике их заменяют аналогичными характеристиками выборочной совокупности и если объем выборки большой, они достаточно точно воспроизводят характеристики генсовокупности. Следовательно средние ошибки выборки можно представить следующим образом: (см. блокнот)
При бесповторном методе численность единиц генсовокупности сокращается в процессе выборки, следовательно в формулы ошибки выборки для средней и доли вводится дополнительный множитель.
В случае, когда выборка n незначительная n -> 0 а в случае, когда n -> 1 им можно пренебречь.
Также кроме средней ошибки выборки применяют предельную ошибку выборки, связанная с гарантирующим ее уровнем вероятности. Уровень вероятности определяет величина нормированного отклонения. Значения даются в таблицах нормального распределения вероятности. Чаще всего используют следующие сочетания уровня вероятности и нормированного отклонения. Иначе t называют коэффициентом доверия.
t | 1,0 | 1,5 | 2,0 | 2,5 | 3,0 | 3,5 |
P(у.в.) | 0,683 | 0,866 | 0,954 | 0,988 | 0,997 | 0,999 |
Если t = 1 то Р = 0,683, можно утверждать что разница между генеральными и выборочными единицами не превысит данной средней ошибки.
После исчисления предельных ошибок выборки для средней или доли находят доверительные интервалы (пределы) внутри которых находятся значения генеральных характеристик.
При стратифицированном отборе (типической выборке) в выборку обязательно попадают единицы всех групп в тех же пропорциях, что и в генеральной совокупности. Следовательно, ошибка выборки будет зависеть от средней из групповых дисперсий. По правилу сложения дисперсий, дисперсия межгрупповая вместе со средней из групповых дисперсий будет равно основной дисперсии для стратифицированного отбора. Следовательно, ошибка выборки для стратифицированного отбора будет всегда меньше, чем для случайного.
При серийном (гнездовом) отборе мерой колеблемости (показателем вариантности) будет межгрупповая дисперсия.
Вопрос 3. Определение численности выборки
Разрабатывая программу выборочного наблюдения обычно сразу задают величину предельной ошибки выборки и доверительную вероятность. Поэтому неизвестным остается количество единиц выборки, которое должно обеспечить величину предельной ошибки выборки. Формулы определения численности выборки зависят от метода отбора и различной для расчета средней и доли и вытекают из формул предельных ошибок выборки.
Дельта и t определяются в зависимости от задач статистического исследования. Чем более достоверные результаты необходимо получить, тем большую вероятность необходимо задать. А с увеличением предельной ошибки выборки (дельта) необходимая численность выборки будет уменьшаться (например:: увеличение дельты в два раза, уменьшит n в 4 раза). Дисперсия - характеристика генеральной совокупности
Вариация признаков (дисперсия) существует объективно, но к началу выборочного исследования она неизвестна. Следовательно сигма квадрат определяются следующими способами:
1. Берут из предыдущих исследований (объект один и тот же);
2. По правилу «трех сигм» общий размах вариации укладывается в шесть сигм;
3. Если хотя бы приблизительно известна средняя величина исследуемого признака, то сигма равна третьей части от исследуемой величины;
4. При изучении альтернативного признака (доли признака) если нет даже приблизительных данных о доле, берется максимальная возможная величина дисперсии, равная четверти.
При стратифицированном отборе (типической выборке) общее число единиц выборки делится на количество групп. Полученное значение и дает объем выборки из каждой группы. Это характерно при отборе непропорциональном объему групп. Если же объем пропорциональный, число единиц по каждой группе определяется следующей формулой (см. блокнот. Формула 13.1)
Отсюда численность выборки при стратифицированном отбор (13.2 и 13.3)
При серийном отборе необходимую часть отбираемых серий определяют также как и при собственно случайном отборе, только вместо Ni и Сигма и-тая подставляют R (число серий в генсовокупности), r (число отобранных серий), и межгрупповую дисперсию
Вопрос 4 Распространение результатов выборочного наблюдения на генеральную совокупность.
Распространение выборочных характеристик на генсовокупность состоит в определении характеристик генсовокупности на основе характеристик выборки. Для этого применяются два способа распространения выборочных данных:
Дата добавления: 2015-01-12; просмотров: 140 | Поможем написать вашу работу | Нарушение авторских прав |