Студопедия  
Главная страница | Контакты | Случайная страница

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Статистическое оценивание параметров распределения по выборке. Точечные оценки параметров распределения

Читайте также:
  1. Amp;Сравнительная характеристика различных методов оценки стоимости
  2. II. Характеристика распределения населения по доходу.
  3. III. Другие оценки коллективной душевной жизни
  4. III. Критерии оценки РЕЗУЛЬТАТОВ практики
  5. III. Регистрация, учет и статистическое наблюдение случаев заболеваний гриппом
  6. III. Регистрация, учет и статистическое наблюдение случаев заболеваний гриппом
  7. IV. Информирование и участие общественности в процессе оценки воздействия на окружающую среду
  8. V2: Случайные величины и их законы распределения
  9. V2: Статистические оценки параметров распределения
  10. VII. Критерии оценки.
Помощь в написании учебных работ
1500+ квалифицированных специалистов готовы вам помочь

Оценка - это приближение значений искомой величины, полученное на основании результатов выборочного наблюдения. Оценки являются случайными величинами. Они обеспечивают возможность формирования обоснованного суждения о неизвестных параметрах генеральной совокупности. Примером оценки генеральной средней является выборочная средняя генеральной дисперсии – выборочная дисперсия и т.д.
Для того чтобы оценить насколько «хорошо» оценка отвечает соответствующей генеральной характеристике разработаны 4 критерия: состоятельность, несмещенность, эффективность и достаточность. Этот подход основывается на том, что качество оценки определяется не по ее отдельным значениям, а по характеристикам ее распределения как случайной величины.
Основываясь на положениях теории вероятностей, можно доказать, что из таких выборочных характеристик, как средняя арифметическая, мода и медиана, только средняя арифметическая представляет собой состоятельную, несмещенную, эффективную и достаточную оценку генеральной средней. Этим и обуславливается предпочтение, отдаваемое средней арифметической в ряду остальных выборочных характеристик.
Несмещенность оценки проявляется в том, что ее математическое ожидание при любом объеме выборки равно значению оцениваемого параметра в генеральной совокупности. Если это требование не выполняется, то оценка является смещенной.
Условие несмещенности оценки направлено на устранение систематических ошибок оценивания.
При решении задач оценивания применяют также асимптотически несмещенные оценки, для которых при увеличении объема выборки математическое ожидание стремится к оцениваемому параметру генеральной совокупности.
Состоятельность статистических оценок проявляется в том, что с увеличением объема выборки оценка все больше и больше приближается к истинному значению оцениваемого параметра или, как говорят, оценка сходится по вероятности к искомому параметру, или стремится к своему математическому ожиданию. Лишь состоятельные оценки имеют практическую значимость.
^ Эффективная оценка – это такая оценка несмещенного параметра, которая обладает наименьшей дисперсией при данном объеме выборки. На практике дисперсия оценки обычно отождествляется с ошибкой оценки.
В качестве меры эффективности оценкипринимают отношение минимально возможной дисперсии к дисперсии другой оценки.
Оценка, обеспечивающая полноту использования всей содержащейся в выборке информации о неизвестной характеристике генеральной совокупности, называется достаточной (исчерпывающей).
Соблюдение рассмотренных выше свойств статистических оценок дает возможность считать выборочные характеристики для оценки параметров генеральной совокупности лучшими из возможных.
Важнейшая задача математической статистики состоит в том, чтобы по выборочным данным получить наиболее рациональные, «правдивые» статистические оценки искомых параметров генеральной совокупности. Различают два вида статистических выводов: статистическая оценка; проверка статистических гипотез.
Основная задача получения статистических оценок заключается в выборе и обосновании наилучших оценок, обеспечивающих возможность содержательной оценки неизвестных параметров генеральной совокупности.
Задача оценки неизвестных параметров может быть решена двумя способами:

· неизвестный параметр характеризуется одним числом (точкой) - используется метод точечной оценки;

· интервальная оценка, то есть определяется интервал, в котором с некоторой вероятностью может находиться искомый параметр.

^ Точечная оценка неизвестного параметра заключается в том, что конкретное числовое значение выборочной оценки принимается за наилучшее приближение к истинному параметру генеральной совокупности, то есть неизвестный параметр генеральной совокупности оценивается одним числом (точкой), определенным по выборке. При таком подходе всегда существует риск совершить ошибку, поэтому точечная оценка должна дополняться показателем возможной ошибки при определенном уровне вероятности.
В качестве средней ошибки оценки принимается ее среднее квадратическое отклонение.

Тогда точечная оценка генеральной средней может быть представлена в виде интервала где - выборочная средняя арифметическая.
При точечной оценке применяют несколько методов получения оценок по выборочным данным:

1. метод моментов, при котором моменты генеральной совокупности заменяются моментами выборочной совокупности;

1. метод наименьших квадратов;

2. метод максимального правдоподобия.
Во многих задачах требуется найти не только числовую оценку параметра генеральной совокупности, но и оценить ее точность и надежность. Особенно это важно для выборок относительно малого объема. Обобщением точечной оценки статистического параметра является его интервальная оценка – нахождение числового интервала, содержащего с определенной вероятностью оцениваемый параметр.
17.Понятие интервальной оценки параметров распределения

При оценке вероятностных характеристик по ограниченному числу опытов могут быть допущены ошибки, т. е. отклонения этой оценки от истинного значения характеристики случайной величины.

Чтобы убедиться в том, что мы не допускаем чрезмерно грубой ошибки в оценке какой-то вероятностной характеристики, в теории вероятностей и математической статистике пользуются так называемыми доверительными интервалами и доверительными вероятностями.

Интервальной называют оценку, которая определяется двумя числами – концами интервала.

Допустим, что для изучения некоторой случайной величины X (признака генеральной совокупности) необходимо по статистическим данным произвести оценку неизвестного ее параметра θ (это может быть М(Х), D(Х) или р) с определенной степенью точности и надежности, т. е. надо указать границы, в которых практически достоверно лежит этот неизвестный параметр θ.

Это означает, что надо найти такую выборочную оценку для искомого параметра θ, при которой с наибольшей вероятностью (надежностью) будет выполняться неравенство:

Отсюда видно, что чем меньше e, тем точнее характеризуется неизвестный параметр θ с помощью выборочной оценки . Следовательно, число eхарактеризует точность оценки параметра θ.

Надежность выполнения неравенства оценивается числом g (α = 1 – γ), которое называют доверительной вероятностью:

 

g = Р( ).

 

Итак, число e характеризует точность оценки параметра θ; число g – характеризует надежность оценки параметра θ.

В практических задачах либо заранее задается надежность g (риск α) и надо найти точность оценки, либо, наоборот, задается точность e, а требуется определить надежность оценки.

Как правило, доверительную вероятность g задают числом, близким к единице: 0,95; 0,97; 0,99; 0,999.

Формула (1.11) означает, что с вероятностью g неизвестное значение параметра θ находится в интервале Ig = ( – e, + e).

Очевидно, чем больше требуется точность e (т. е., чем меньше длина интервала), тем меньше вероятность накрыть интервалом Ig искомый параметр θ, и, наоборот, с уменьшением точности e (увеличением длины интервала) увеличивается надежность g накрыть интервалом Ig параметр θ (рис. 1.5).

 

 

Рис. 1.5. Доверительный интервал

Замечание. Если число g = 0,95, это означает, что в среднем в 95 случаях из 100 интервал Ig накроет параметр θ и в 5 случаях из 100 не накроет его.

Оценка , будучи функцией случайной выборки, является случайной величиной, ε также случайна: ее значение зависит от вероятности γ и, как правило, от выборки. Поэтому доверительный интервал случаен и выражение (1.11) следует читать так: «Интервал ( –ε, +ε) накроет параметр θ с вероятностью γ», а не «Параметр θ попадет в интервал ( –ε, +ε) с вероятностью γ».

В формуле (1.11) границы доверительного интервала симметричны относительно точечной оценки . Однако не всегда удается построить интервал, обладающий таким свойством. Для получения доверительного интервала наименьшей длины при заданном объеме выборки п и заданной доверительной вероятности γ в качестве оценки параметра θ следует брать эффективную или асимптотически эффективную оценку.

Существует два подхода к построению доверительных интервалов. Первый подход, если его удается реализовать, позволяет строить доверительные интервалы при каждом конечном объеме выборки п. Он основан на подборе такой функции , называемой в дальнейшем статистикой, чтобы

1) ее закон распределения был известен и не зависел от θ;

2) функция была непрерывной и строго монотонной по θ.

Задавшись доверительной вероятностью γ, связанной с риском α формулой γ = 1 – α, находят двусторонние критические границы и , отвечающие вероятности α. Тогда с вероятностью γ выполняется неравенство

 

Решив это неравенство относительно θ, находят границы доверительного интервала для θ. Если плотность распределения статистики симметрична относительно оси Оу, то доверительный интервал симметричен относительно .

Второй подход, получивший название асимптотического подхода, более универсален; однако он использует асимптотические свойства точечных оценок и поэтому пригоден лишь при достаточно больших объемах выборки.

Рассмотрим первый подход на примерах доверительного оценивания параметров нормального распределения.

При выборе уровня значимости необходимо учитывать мощность критерия при альтернативной гипотезе. Иногда большая мощность критерия оказывается существеннее малого уровня значимости, и его значение выбирают относительно большим, например 0,2. Такой выбор оправдан, если последствия ошибок второго рода более существенны, чем ошибок первого рода. Например, если отвергнуто правильное решение "продолжить работу пользователей с текущими паролями", то ошибка первого рода приведет к некоторой задержке в нормальном функционировании системы, связанной со сменой паролей. Если же принято решения не менять пароли, несмотря на опасность несанкционированного доступа посторонних лиц к информации, то эта ошибка повлечет более серьезные последствия.

В зависимости от сущности проверяемой гипотезы и используемых мер расхождения оценки характеристики от ее теоретического значения применяют различные критерии. К числу наиболее часто применяемых критериев для проверки гипотез о законах распределения относят критерии хи-квадрат Пирсона, Колмогорова, Мизеса, Вилкоксона, о значениях параметров – критерии Фишера, Стьюдента.


18.Статистическая проверка гипотез. Мощность критерия. Критические области

Статистическая гипотеза представляет собой некоторое предположение о законе распределения случайной величины или о параметрах этого закона, формулируемое на основе выборки [3, 5, 11]. Примерами статистических гипотез являются предположения: генеральная совокупность распределена по экспоненциальному закону; математические ожидания двух экспоненциально распределенных выборок равны друг другу. В первой из них высказано предположение о виде закона распределения, а во второй – о параметрах двух распределений. Гипотезы, в основе которых нет никаких допущений о конкретном виде закона распределения, называютнепараметрическими, в противном случае – параметрическими.

Гипотезу, утверждающую, что различие между сравниваемыми характеристиками отсутствует, а наблюдаемые отклонения объясняются лишь случайными колебаниями в выборках, на основании которых производится сравнение, называют нулевой (основной) гипотезой и обозначают Н0. Наряду с основной гипотезой рассматривают иальтернативную (конкурирующую, противоречащую) ей гипотезу Н1. И если нулевая гипотеза будет отвергнута, то будет иметь место альтернативная гипотеза.

Различают простые и сложные гипотезы. Гипотезу называют простой, если она однозначно характеризует параметр распределения случайной величины. Например, еслиl является параметром экспоненциального распределения, то гипотеза Н0 о равенстве l =10 – простая гипотеза. Сложной называют гипотезу, которая состоит из конечного или бесконечного множества простых гипотез. Сложная гипотеза Н0 о неравенстве l >10 состоит из бесконечного множества простых гипотез Н0 о равенствеl =bi , где bi – любое число, большее 10. Гипотеза Н0 о том, что математическое ожидание нормального распределения равно двум при неизвестной дисперсии, тоже является сложной. Сложной гипотезой будет предположение о распределении случайной величины Х по нормальному закону, если не фиксируются конкретные значения математического ожидания и дисперсии.

Проверка гипотезы основывается на вычислении некоторой случайной величины – критерия, точное или приближенное распределение которого известно. Обозначим эту величину через z, ее значение является функцией от элементов выборки z=z(x1, x2, …, xn). Процедура проверки гипотезы предписывает каждому значению критерия одно из двух решений – принять или отвергнуть гипотезу. Тем самым все выборочное пространство и соответственно множество значений критерия делятся на два непересекающихся подмножества S0 и S1. Если значение критерия z попадает в область S0, то гипотеза принимается, а если в область S1, – гипотеза отклоняется. Множество S0 называется областью принятия гипотезы или областью допустимых значений, а множество S1 – областью отклонения гипотезы или критической областью. Выбор одной области однозначно определяет и другую область.

Принятие или отклонение гипотезы Н0 по случайной выборке соответствует истине с некоторой вероятностью и, соответственно, возможны два рода ошибок. Ошибка первого рода возникает с вероятностью a тогда, когда отвергается верная гипотеза Н0 и принимается конкурирующая гипотеза Н1. Ошибка второго рода возникает с вероятностью b в том случае, когда принимается неверная гипотеза Н0, в то время как справедлива конкурирующая гипотеза Н1. Доверительная вероятность – это вероятность не совершить ошибку первого рода и принять верную гипотезу Н0. Вероятность отвергнуть ложную гипотезу Н0 называется мощностью критерия. Следовательно, при проверке гипотезы возможны четыре варианта исходов, табл. 3.1.

 

Гипотеза Н0 Решение Вероятность Примечание
Верна Принимается 1–a Доверительная вероятность
Отвергается a Вероятность ошибки первого рода
Неверна Принимается b Вероятность ошибки второго рода
Отвергается 1–b Мощность критерия

После выбора определенного критерия множество всех его возможных значений разбивают на два непересекающихся подмножества, одно из которых содержит значения критерия, при которых нулевая гипотеза отвергается, а другое – при которых она принимается.

Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают.

Областью принятия гипотезы (областью допустимых значений) называют совокупность значений критерия, при которых гипотезу принимают.

Основной принцип проверки статистических гипотез можно сформулировать так: если наблюдаемое значение критерия принадлежит критической области – гипотезу отвергают, если области принятия гипотезы – гипотезу принимают.

Так как критерий K – одномерная случайная величина, то все ее возможные значения принадлежат некоторому интервалу и, соответственно, должны существовать точки, разделяющие критическую область и область принятия гипотезы. Такие точки называются критическими точками.

Различают одностороннюю (правостороннюю и левостороннюю) и двустороннюю критические области.

Правосторонней называют критическую область, определяемую неравенством , где – положительное число.

Левосторонней называют критическую область, определяемую неравенством , где – отрицательное число.

Двусторонней называют критическую область, определяемую неравенствами , где . В частности, если критические точки симметричны относительно нуля, двусторонняя критическая область определяется неравенствами или равносильным неравенством


19.Статистическая проверка гипотез. Ошибки первого и второго родов.

Ошибки при проверкестат гипотез могут быть двух родов. Ошибка первого рода заключается в отрицании основной гипотезы, когда на самом деле она верна. Ошибка второго рода состоит в том, что отрицаетсяконкурирующая гипотеза, когда она верна.

Чтобы лучше понять определения ошибок, проиллюстрируем введенные понятия с помощью аналогии. В больнице врач принимает решение, направлять пациента на операцию, или нет. Его проблему можно переформулировать и так: ему нужно выбрать между основной гипотезой, что операция необходима, и альтернативной гипотезой, утверждающей, что операция не нужна. При этом врач может ошибиться. Допустим, операция нужна, а она не делается. Скажем то же самое в статистических терминах: основная гипотеза верна, но она отвергается. Как ни говори, в этом случае врач делает ошибку первого рода. Если операция не нужна, а она делается, то есть принимается основная гипотеза, когда она не верна, то врач делает ошибку второго рода.

Может ли врач свести частоту (вероятность) ошибок первого рода к нулю? Да, если всегда будет принимать основную гипотезу. В этом случае все пациенты будут направляться на операцию. Чтобы свести к нулю ошибку второго рода, надо вовсе не делать операций. Понятно, что оба крайних варианта неприемлемы. Хотя есть исключения. Например, если мы будем вакцинацию считать операцией (все же укол, введение прививки, это маленькая, но операция), то получается, что врачи действуют по первому сценарию: делать маленькую "превентивную" операцию всем, чтобы в будущем свести ошибку первого рода к нулю.

«Последствия ошибок могут быть различными" – каков смысл этого утверждения в контексте рассмотренного примера? Если пациенту операция не нужна, но она сделана, (ошибка второго рода) это очень неприятно. Если нужна, но не сделана (ошибка первого рода), то возможен и смертельный исход.

Итак, ошибка первого рода опаснее, но полностью избежать ее не удастся. Кстати, это так не только в медицине, при проверке статистических гипотез ситуация такая же.

Доверь свою работу кандидату наук!
1500+ квалифицированных специалистов готовы вам помочь



Дата добавления: 2015-01-12; просмотров: 130 | Нарушение авторских прав




lektsii.net - Лекции.Нет - 2014-2022 год. (0.043 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав