Студопедия
Главная страница | Контакты | Случайная страница

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Ошибка выборочных наблюдений

Читайте также:
  1. В то время как никакое веское доказательство для существования Монстра Лох-Несса еще не поднималось, о множестве наблюдений сообщили.
  2. Виды наблюдений
  3. ВИДЫ СТАТИСТИЧЕСКИХ НАБЛЮДЕНИЙ. ПОНЯТИЕ О ВЫБОРОЧНОМ МЕТОДЕ ИССЛЕДОВАНИЯ, ЕГО ЗНАЧЕНИЕ И ЗАДАЧИ.
  4. г) В этом случае ошибка выборки не изменится, так как выборка случайно-повторная.
  5. Если в больничном листе работодателем допущена ошибка, где именно можно ее исправить, если на обратной стороне бланка писать негде?
  6. Запись наблюдений.
  7. На чужих ошибках нельзя научиться, так как нельзя знать человека, совершившего промах, досконально.
  8. Оценка генеральной средней. Свойство устойчивости выборочных средних. Генеральная дисперсия. Выборочная дисперсия)
  9. Ошибка выбора источника финансирования и сроков согласования
  10. Ошибка выборки в статистике

 

Определение 13.5. Разность между генеральными характеристиками и соответствующими выборочными стати •тиками называется ошибкой выборки, или ошибкой репрезентативности.

 

Статистические методы позволяют оценить эту разность, которая зависит как от характеристик выборки, так и от ее объема. В процессе выборочного исследования параметры генеральной совокупности определяются в виде интервала, построенного вокруг выборочной статистики. От величи­ны этого интервала и зависит качество исследования.

Из теоремы Чебышева следует, что

(13.2)

 

Определение 13.6. Таким образом, мы получили интер­вальную оценку генеральной средней, которая представ­ляет собой доверительный интервал, содержащий оцени­ваемый параметр генеральной совокупности:

(13.3)

где Δ— предельная ошибка выборки.

 

Определение 13.7. Интервальной оценкой называют оцен­ку, которая определяется двумя числами — концами ин­тервала, который с определенной вероятностью накры­вает неизвестный параметр генеральной совокупности.

 

Для определения доверительного интервала необходи­мо вычислить предельную ошибку выборки А, позволяю­щую установить предельные границы, в которых с задан­ной вероятностью (надёжностью) должен находиться пара­метр генеральной совокупности.

Предельная ошибка выборки равна г-кратному числу сред­них ошибок выборки. Коэффициент t позволяет установить, насколько надежно высказывание о том, что заданный интер­вал содержит параметр генеральной совокупности.

Если мы выберем коэффициент таким, что высказывание в 97% случаев окажется правильным и только в 3% — не­правильным, то мы говорим — со статистической надежно­стью в 97% доверительный интервал выборочной статисти­ки содержит параметр генеральной совокупности. Стати­стической надежности в 97% соответствует доверительная вероятность — γ = 0,97.

Если в 5% случаев утверждение «параметр принадлежит доверительному интервалу» будет неверным, то 5% задает уро­вень значимости — или = 0,05 вероятность ошибки. Обыч­но в статистике уровень значимости выбирают таким, чтобы он не превысил 5% ( < 0,05). Доверительная вероятность и уровень значимости дополняют друг друга до 1 (или 100%) и определяют надежность статистического высказывания. Имеет место соотношение:

(13.4)

Применительно к выборочному методу из теоремы Че­бышева следует, что с вероятностью, сколь угодно близкой к единице можно утверждать, что при достаточно большом объеме выборки и ограниченной дисперсии генеральной совокупности разность между выборочной средней и гене­ральной средней будет сколь угодно мала.

(13.5)

где X — средняя по совокупности выбранных единиц;

— средняя по генеральной совокупности;

σген — среднее квадратическое отклонение в генераль­ной совокупности. Запись показывает, что о величине расхождения между параметром и статистикой . можно судить лишь с определенной вероятностью, от которой зависит ве­личина t.

Согласно центральной предельной теореме Ляпунова выборочные распределения статистик (при п 30) будут иметь нормальное распределение независимо' от того, ка­кое распределение имеет генеральная совокупность. Следо­вательно имеет место соотношение:

(13.6)

где Ф0(t) — функция Лапласа (см. лекцию 7);

t — аргумент функции Лапласа, зависящий от надежно­сти интервальной оценки;

— средняя по совокупности выбранных единиц;

— средняя по генеральной совокупности;

— ошибка выборки для собственно случайного отбора. Для оценки генеральной доли используется формула:

(13.7)

где со — выборочная доля;

р — генеральная доля;

— доверительная вероятность;

— ошибка выборки для собственно случайного отбора.

Таким образом, для того чтобы найти доверительный интервал для оценки генеральных параметров, достаточ­но определить величину ошибки. Значения вероятностей, соответствующие различным t, содержатся в специальных

таблицах: при п 30 — в таблице значений Ф0(t) (приложе­ние 2), а при п < 30 в таблице t-распределения Стьюдента (приложение 5). Неизвестное значение σген при расчете ошибки выборки заменяется овы6_.

Средняя ошибка выборки для собственно случайного отбора определяется в зависимости от способа отбора выборки, ошибка выборки определяется по-разному.

Так, для оценки генеральной средней:

► при повторном отборе:

(13-8)

► при бесповторном отборе:

(13.9)

 

где σ2 — выборочная дисперсия значений признака,

п — объем выборки;

N — объем генеральной совокупности;

— доля обследованной совокупности;

— поправка на конечность совокупности.

Для оценки генеральной доли используются формулы:

 

► при повторном отборе:

(13.10)

► при бесповторном отборе:

 

(13.11)

где —выборочная дисперсия доли значений при­знака;

п — объем выборки;

N — объем генеральной совокупности;

— доля обследованной совокупности;

С помощью доверительного интервала можно оценить не только генеральную среднюю, но и другие неизвестные параметры генеральной совокупности.

Для оценки математического ожидания (генеральной средней) нормально распределенного количественного при­знака Хген по выборочной средней Хвыб при неизвестном среднем квадратическом отклонении σген генеральной со­вокупности (на практике — при малом объеме выборки, т.е. при п < 30) и собственно-случайном повторном отборе формула интервального оценивания примет вид:

(13.12)

где t определяется по таблицам Стьюдента:

—по уровню значимости α= 1 - γ;

—и числу степеней свободы k =n - 1;

S — исправленное среднее квадратическое отклонение;

п — объем выборки (число обследованных единиц).

Δ определяется по формуле:

(13.13)

Оптимальный объем представительной выборки

В процессе решения задач легко убедиться, что довери­тельный интервал оценки средней и оценки доли зависит от объема выборки. Чем больше выборка, тем уже будет ин­тервал, тем точнее оценка генеральных статистик. В самом деле, во всех формулах расчета ошибки выборки объем выборки стоит в знаменателе, значит, между объемом выбор­ки и ошибкой существует обратная связь. Самая большая выборка — это вся генеральная совокупность, и тогда оценка вообще будет точечной. При этом, конечно же, не будет соблюдаться экономичность исследования, которая и явля­ется целью выборочного метода. Поэтому следует найти такой оптимальный размер выборки, который будет удов­летворять всем требованиям.

 




Дата добавления: 2015-02-16; просмотров: 139 | Поможем написать вашу работу | Нарушение авторских прав




lektsii.net - Лекции.Нет - 2014-2025 год. (0.009 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав