Студопедия  
Главная страница | Контакты | Случайная страница

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Свойства средней арифметической

Читайте также:
  1. I Кислотно-основные свойства.
  2. I Кислотные и основные свойства
  3. I. Основные свойства живого. Биология клетки (цитология).
  4. I. ПОЧЕМУ МЫ ДОЛЖНЫ ИЗУЧАТЬ СТОРОНЫ И СВОЙСТВА ПЕДАГОГИЧЕСКОГО ПРОЦЕССА?
  5. I. ФИЗИОЛОГИЧЕСКИЕ СВОЙСТВА МИОКАРДА
  6. X небольшой или средней
  7. А ты волшебник? Проверь себя! 42 свойства волшебника!
  8. А. Гестозы средней и тяжелой степени
  9. Абсолютное изменение средней цены
  10. Актуальность и проблематика детектирования NO, продуцируемого в организме. Спектральные свойства NO, требуемые аналитические параметры и выбор аналитического диапазона.

1. Средняя арифметическая постоянной равна самой постоянной: .

2. Если все варианты увеличить (уменьшить) на одну и туже постоянную, то средняя арифметическая увеличивается (уменьшится) на то же число: .

3. Если все варианты увеличить (уменьшить) в одно и то же число раз, то средняя арифметическая увеличивается (уменьшится) во столько же раз: .

4. Сумма отклонений вариантов от их средней арифметической равно нулю:

5. Средняя арифметическая алгебраической суммы нескольких признаков равна такой же сумме средних арифметических этих признаков:

6. Если ряд наблюдений состоит из нескольких групп, общая средняя равна средней арифметической групповых средних, причем весами являются объемы групп: ,

где – общая средняя (средняя арифметическая всего ряда);

– групповая средняя i –ой группы, объем которой равен ni;

l – число групп.

Рассмотренные средние величины называются аналитическими. В статистическом анализе применяют так же и структурные или порядковые средние. К ним относятся мода и медиана.

Модой статистического ряда называется вариант, которому соответствует наибольшая частота.

Сложность в том, что редкая совокупность имеет единственную моду. (Например: 2, 6, 6, 8, 9, 9, 9, 10 – мода = 9).

Если два несмежных значения имеют равную и наибольшую в данной группе частоту, то у этого вариационного ряда есть две моды, такая группа называется бимодальной.

Особенность моды заключается в том, что она не меняется при изменении крайних членов ряда, т.е. обладает определенной устойчивостью к вариации ряда. Для интервального ряда:

, где

– нижняя граница модального интервала;

– ширина интервала группировки;

– частота модального интервала;

– частота интервала, предшествующего модальному;

– частота интервала, следующего за модальным.

Медиана статистического ряда – это значение признака, приходящееся на середину ранжированного ряда наблюдений.

Для дискретного ряда с нечетным числом членов (n= 2 k +1) медиана равна серединному варианту Mе=xk+ 1, а для ряда с четным числом членов (n = 2 k) – полусумме двух серединных вариантов:

.

Для интервального ряда:

, где

– нижняя граница медианного интервала, к которому принадлежит медиана;

– половина объема выборки;

h – ширина медианного интервала;

–частота медианного интервала;

– накопленная частота интервала, предшествующего медианному.

Достоинство медианы заключается в том, что на нее не влияет изменение крайних членов вариационного ряда, если любой из них, меньший медианы, остается меньше нее, а любой, больший медианы, продолжает быть больше нее. Медиана предпочтительнее средней арифметической для ряда, у которого крайние варианты по сравнению с остальными оказались чрезмерно большими или малыми.

Мода наиболее просто вычисляется и при большом количестве измерений достаточно стабильна и близка к медиане и среднему. Медиана вычисляется по сложнее, особенно легко при ранжированных данных. При больших выборках предлагается сначала сгруппировать их, а потом вычислять медиану. Для определения моды и медианы не требуется знание всех остальных значений.

Пример. Найти моду и медиану интервального ряда.

Возрастные группы Число студентов
До 20 лет    
20 — 25    
25 — 30    
30 — 35    
35 — 40    
40 — 45    
45 лет и более    
Итого    

Решение:

В данном примере модальный интервал находится в пределах возрастной группы 25-30 лет, так как на этот интервал приходится наибольшая частота (1054).

Рассчитаем величину моды:

.

Это значит что модальный возраст студентов равен 27 годам.

Вычислим медиану. Медианный интервал находится в возрастной группе 25-30 лет, так как в пределах этого интервала расположена варианта, которая делит совокупность на две равные части (n /2 = 3462/2 = 1731). Далее подставляем в формулу необходимые числовые данные и получаем значение медианы:

Это значит что одна половина студентов имеет возраст до 27,4 года, а другая свыше 27,4 года.

8.2. Показатели вариации как характеристики рассеяния

Средние величины не отражают изменчивости значений признака. Для оценки меры неоднородности (разброса, изменчивости) выборки наряду со средними значениями вычисляют и характеристики рассеяния.

Вариацией какого-либо параметра (показателя) в совокупности наблюдений называется различие его значений у разных элементов этой совокупности. Именно это свойство является объектом исследования большинства методов обработки ЭД.

Вариационный размах – это разность максимального и минимального значений статистического ряда: R=x max x min.

Наибольший интерес представляют меры вариации (рассеяния) наблюдений вокруг средних величин.

Средним линейным отклонением статистического ряда называется средняя арифметическая абсолютных величин отклонений вариантов от их средней:

Выборочной дисперсией s2 статистического ряда называется средняя арифметическая квадратов отклонений вариантов от их средней арифметической:

или .

Для несгруппированного ряда (ni =1): .

Среднее квадратическое отклонение (стандартным отклонением) s статистического ряда – арифметическое значение корня квадратного из выборочной дисперсии:

или .

Размерность стандартного отклонения в отличие от размерности дисперсии совпадает с единицами измерения варьирующего признака, поэтому в практической статистике для того, чтобы охарактеризовать рассеяние признака используют обычно стандартное отклонение, а не дисперсию.

Свойства дисперсии:

1. Дисперсия постоянной равна нулю: .

2. Если все варианты увеличить (уменьшить) на одну и туже постоянную, то дисперсия не изменится: .

3. Если все варианты увеличить (уменьшить) в одно и то же число k раз, то дисперсия увеличивается (уменьшится) в k 2 раз: .

4. Дисперсия равна разности между средней арифметической квадратов вариантов и квадратом средней арифметической: .

5. Если ряд наблюдений состоит из нескольких групп, общая дисперсия равна сумме средней арифметической групповых дисперсий (внутригрупповая дисперсия) и межгрупповой дисперсии («правило сложения дисперсий»):

,

где – общая дисперсия (дисперсия всего ряда);

– средняя арифметическая групповых дисперсий (внутригрупповая дисперсия);

– дисперсия i –ой группы , объем которой равен ni, - групповая средняя;

– межгрупповая дисперсия , где - общая средняя;

l- число групп.

Если требуется сопоставить стандартные отклонения со средними арифметическими этих признаков, то вводится относительный показатель, называемый коэффициентом вариации.

Коэффициент вариации – это процентное отношение среднего квадратического отклонения к средней арифметической:

Коэффициент вариации является относительной мерой рассеяния признака.

Коэффициент вариации используется и как показатель однородности выборочных наблюдений. Считается, что если коэффициент вариации не превышает 10%, то выборку можно считать однородной, т.е. полученной из одной генеральной совокупности.

8.3. Упрощенный способ расчета средней арифметической и дисперсии

Условными называют варианты, определяемые равенством

,

где с и h – специально подобранные числа:

ü с –ложный нуль (новое начало отсчета; чаще всего это середина серединного интервала, если серединных интервалов два, то за с берут середину одного из этих интервалов),

ü h – шаг, т.е разность между любыми двумя соседними первоначальными вариантами (новая единица масштаба).

Упрощенный метод расчета характеристик выборки основан на замене первоначальных вариант на условные. Согласно свойствам средней арифметической и дисперсии

откуда

.

8.4. Начальные центральные моменты

Средняя арифметическая и дисперсия статистического ряда являются частными случаями более общих понятий – моментов статистического ряда.

Начальный моментk–го порядка статистического ряда определяется по формуле:

или

Очевидно, что средняя арифметическая является моментом первого порядка статистического ряда: .

Центральный момент порядка s статистического ряда определяется по формуле:

или

Нетрудно заметить, что при при s =1 первый центральный момент равен нулю, а при s =2 второй центральный момент - это выборочная дисперсия статистического ряда, т.е. .

Центральные моменты удобно рассчитывать по начальным моментам по формулам:

.

Форма распределения выборочной совокупности характеризуется коэффициентом ассиметрии и эксцесса.

Коэффициентом асимметрии статистического ряда называется число:

.

Если , то распределение имеет симметричную форму, т.е. варианты равноудалены от и имеют одинаковую частоту. Если асимметрия – положительная, то распределение сдвигается влево, если отрицательная – вправо.

Эксцесс вариационного ряда называется число:

Эксцесс – это мера крутости кривой распределения. Кривая распределения может быть островершинной, плосковершинной, средне вершинной. Если , то распределение имеет нормальную форму. Если эксцесс– положительный, то полигон имеет более крутую вершину по сравнению с нормальной кривой, если отрицательный – более пологую.

Эти четыре момента составляют набор особенностей распределения при анализе данных.

Глава 9. Оценки параметров распределения и их свойства

Одна из задач математической статистики: по имеющейся выборке оценить значения числовых характеристик исследуемой случайной величины.

Здесь речь идет об оценках (приближенных значениях) основных параметров распределения случайных величин: математического ожидания , дисперсии , среднего квадратического отклонения случайной величины X, ковариации и коэффициента корреляции между двумя любыми случайными величинами X и Y, а также вероятности наступления случайного события p. Для удобства обозначим любой из перечисленных параметров символом (тета).

Статистической оценкой неизвестного параметра распределения называется любая функция от значений выборки , т.е. статистика.

Пусть распределение случайной величины (генеральной совокупности) задается вероятностями (для дискретной случайной величины) или плотностью вероятности (для непрерывной случайной величины), которые зависят от неизвестного параметра . Этим параметром может быть, например, параметр закона Пуассона или параметры а и нормального распределения. На практике о величине параметра можно судить по выборке объема n из генеральной совокупности.

Пусть по выборке объема найдена оценка. При повторении опыта происходит извлечение другой выборки того же объема из генеральной совокупности, и получается другая оценка неизвестного теоретического параметра. Повторяя опыт далее раз, получаем (в общем случае) различных чисел,,…,. Поэтому оценку можно рассматривать как случайную величину, которая может принимать значения,,…,.

Задача состоит в том, чтобы найти такую оценку , которая была бы в определенном смысле наиболее близкой к оцениваемому параметру θ.

Для того чтобы оценка давала «хорошие» приближения она должна быть: несмещенной, эффективной, состоятельной.

Несмещенной оценкой параметра θ называется статистическая оценка , если ее математическое ожидание совпадает со значением оцениваемого теоретического параметра при любом объеме выборки:

.

Смещенной оценкой называется оценка , математическое ожидание которой не равно значению теоретического параметра.

Таким образом, если , то мы будем получать при вычислении оценок систематические ошибки.

Асимптотически несмещенной оценкой называется статистическая оценка , если её математическое ожидание совпадает со значением оцениваемого теоретического параметра:

при .

Смещением оценки называется величина .

Свойство несмещенности является свойством оценок при фиксированном . Такая оценка не всегда дает хорошее приближение теоретического параметра, так как ее возможные значения могут быть значительно рассеяны относительно своего среднего значения. Это означает большую дисперсию , поэтому если в качестве оцениваемого параметра взять его несмещенную оценку, то распределение было бы установлено ошибочно. С минимизацией дисперсии оценки связано требование ее эффективности.

Состоятельной оценкой параметра θ называется статистическая оценка, которая при сходится по вероятности к истинному значению параметра, т.е.

,

Это необходимое свойство оценки, несостоятельными оценками пользоваться не рекомендуется.

Эффективной оценкой называется несмещенная статистическая оценка , если среди всех подобных оценок той же характеристики она имеет наименьшую дисперсию:

.

Так для случайной величиной Х, имеющей нормальный закон распределения с дисперсией σ2,

ü нижняя граница для дисперсий различных несмещенных оценок математического ожидания равна ,

ü нижняя граница для дисперсий различных несмещенных оценок дисперсии равна .

Для случайной величиной Х, выражающеей число наступлений события А в одном испытании имеющей закон распределения

xi    
рi q р

ü нижняя граница для дисперсий различных несмещенных оценок вероятности р равна .

Различают два вида оценок – точечные и интервальные.

Точечными называют такие оценки, которые характеризуются одним числом.

Интервальные оценки задаются двумя числами, определяющими вероятный диапазон возможного значения параметра.

9.1. Точечная оценка параметров распределения

Точечная оценка предполагает нахождение единственной числовой величины, которая и принимается за значение параметра. Такую оценку целесообразно определять в тех случаях, когда объем ЭД достаточно велик. При малом объеме ЭД точечные оценки могут значительно отличаться от истинных значений параметров, что делает их непригодными для использования.

9.1.1. Точечная оценка математического ожидания

В качестве приближенного значения (статистической оценки) математического ожидания будем использовать выборочную среднюю .

Будем рассматривать как случайную величину , а х 1, х 2,…, хп (значения исследуемой случайной величины, составляющие выборку)– как независимые, одинаково распределенные случайные величины Х 1, Х 2,…, Хп, имеющие математическое ожидание а.

Выясним состоятельность, несмещенность и эффективность выборочной средней какточечной оценки математического ожидания.




Дата добавления: 2015-01-12; просмотров: 62 | Поможем написать вашу работу | Нарушение авторских прав




lektsii.net - Лекции.Нет - 2014-2024 год. (0.02 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав