Студопедия  
Главная страница | Контакты | Случайная страница

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Числовые характеристики статистического распределения

Читайте также:
  1. I. Клинико - эпидемиологические характеристики геморрагических лихорадок и геморрагической лихорадки с почечным синдромом.
  2. I. Сущность общественного мнения, его характеристики и проблемы изучения.
  3. II. Практическое задание №1. Ряды распределений и их характеристики
  4. II. Характеристика распределения населения по доходу.
  5. IV. Энергетические характеристики атомов.
  6. Quot; Русская правда" как источник для характеристики социально-правовой структуры древнерусского общества.
  7. V.ХАРАКТЕРИСТИКИ САМОАКТУАЛИЗИРУЮЩИХСЯ ЛЮДЕЙ
  8. V2: Случайные величины и их законы распределения
  9. V2: Статистические оценки параметров распределения
  10. VII.Дискретный вариационный ряд распределения.

Известны различные числовые характеристики случайных величин: математическое ожидание, дисперсия, начальные и центральные моменты различных порядков. Эти числовые характеристики играют большую роль в теории вероятностей. Аналогичные числовые характеристики существуют и для статистических распределений. Каждой числовой характеристике случайной величины X соответствует ее статистическая аналогия. Для основной характеристики положения — математического ожидания случайной величины — такой аналогией является среднее арифметическое наблюденных значений случайной величины:

(4.1)

Где xi — значение случайной величины, наблюденное в i-м опыте, n - число опытов.

Эту характеристику мы будем в дальнейшем называть статистическим средним случайной величины.

Согласно закону больших чисел, при неограниченном увеличении числа опытов статистическое среднее приближается (сходится по вероятности) к математическому ожиданию. При достаточно большом n статистическое среднее может быть принято приближенно равным математическому ожиданию. При ограниченном числе опытов статистическое среднее является случайной величиной, которая, тем не менее, связана с математическим ожиданием и может дать о нем известное представление.

Подобные статистические аналогии существуют для всех числовых характеристик. Условимся в дальнейшем эти статистические аналогии обозначать теми же буквами, что и соответствующие числовые характеристики, но снабжать их значком *.

Рассмотрим, например, дисперсию случайной величины. Она представляет собой математическое ожидание случайной величины:

Х2 = (Х — тх)2:

D(X) = M[X2] – M[(X — mx*)2]. (4.2)

Если в этом выражении заменить математическое ожидание его статистической аналогией—-средним арифметическим, мы получим Я статистическую дисперсию случайной величины X:

(4.3) I

где т*х = М* [X] — статистическое среднее.

Аналогично определяются статистические начальные и центральные моменты любых порядков:

(4.4) I

(4.5)

Все эти определения полностью аналогичны определениям числовых характеристик случайной величины, с той разницей, что в них везде вместо математического ожидания фигурирует среднее арифметическое. При увеличении числа наблюдении, очевидно, все статистические характеристики будут сходиться по вероятности к соответствующим математическим характеристикам и при достаточном п могут быть приняты приближенно равными им.

Нетрудно доказать, что для статистических начальных и центральных моментов справедливы те же свойства, которые были выведены для соответствующих моментов случайных величин. В частности, статистический первый центральный момент всегда равен нулю:

Соотношения между центральными и начальными моментами также сохраняются:

(4.6)

и т. д.

При очень большом количестве опытов вычисление характеристик по формулам (4.1) — (4.5) становится чрезмерно громоздким, и можно применить следующий прием: воспользоваться теми же разрядами, на которые был расклассифицирован статистический материал для построения статистического ряда или гистограммы, и считать приближенно значение случайной величины в каждом разряде постоянным и разным среднему значению, которое выступает в роли «представителя» разряда. Тогда статистические числовые характеристики будут выражаться приближенными формулами:

(4.7)

(4.8). (4.9)

(4.10)

где х, — «представитель» 1-го разряда, рi* — частота 1-го разряда, k —число разрядов.

Как видно, формулы (4.7) — (4.101 полностью аналогичны Формулам, определяющим математическое ожидание, дисперсию, начальные и центральные моменты прерывной случайной величины, с той только разницей, что вместо вероятностей в них стоят частоты р*, вместо математического ожидания тх - статистнческое среднее m*, вместо числа возможных значений случайной величины — число разрядов.

 

В большинстве руководств по теории вероятностей и математической статистике при рассмотрении вопроса о статистических аналогиях для характеристик случайных величин применяется терминология, несколько другая терминология, а именно, статистическое среднее именуется «выборочным средним», статистическая дисперсия—«выборочной дисперсией» и т. д. Происхождение этих терминов следующее. В статистике, особенно сельскохозяйственной и биологической, часто приходится исследовать распределение того или иного признака для весьма большой совокупности индивидуумов, образующих статистический коллектив (таким признаком может быть, например, содержание белка в зерне пшеницы, вес того же зерна, длина или вес тела какого-либо из группы животных и т. д.). Данный признак является случайной величиной, значение которой от индивидуума к индивидууму меняется. Однако, для того, чтобы составить представление о распределении этой случайной величины или о ее важнейших характеристиках, нет необходимости обследовать каждый индивидуум данной обширной совокупности; можно обследовать некоторую выборку достаточно большого объема для того, чтобы в ней были выявлены существенные черты изучаемого распределения. Та обширная совокупность, из которой производится выборка, носит в статистике название генеральной совокупности. При этом предполагается, что число членов (индивидуумов) N в генеральной совокупности весьма велико, а число членов п в выборке ограничено.» При достаточно большом N оказывается, что свойства выборочных (статистических) распределений и характеристик практически не зависят от N; отсюда естественно вытекает математическая идеализация, состоящая в том, что генеральная совокупность, из которой осуществляется выбор, имеет бесконечный объем. При этом отличают точные характеристики (закон распределения, математическое ожидание, дисперсию и т. д.), относящиеся к генеральной совокупности, от аналогичных им «выборочных» характеристик. Выборочные характеристики отличаются от соответствующих характеристик генеральной совокупности за счет ограниченности объема выборки п; при неограниченном увеличении п, естественно, все выборочные характеристики приближаются (сходятся по вероятности) к соответствующим характеристикам генеральной совокупности. Часто возникает вопрос о том, каков должен быть объем выборки п для того, чтобы по выборочным характеристикам можно было с достаточной точностью судить о неизвестных характеристиках генеральной совокупности или о том, с какой степенью точности при заданном объеме выборки можно судить о характеристиках генеральной совокупности. Такой методический прием, состоящий в параллельном рассмотрений бесконечной генеральной совокупности, из которой осуществляется выбор, и ограниченной по объему выборки, является совершенно естественным в тех областях статистики, где фактически приходится осуществлять выбор из весьма многочисленных совокупностей индивидуумов. Для практических задач, связанных с вопросами стрельбы и вооружения, гораздо более характерно другое положение, когда над исследуемой случайной величиной (или системой случайных величин) производится ограниченное число опытов с целью определить те или иные характеристики этой величины. например, когда с целью исследования закона рассеивания при стрельбы производится некоторое количество выстрелов, или с целью исследования ошибки наводки производится серия опытов, в каждом из которых ошибка наводки регистрируется с помощью фотопулемета, и т. д. При этом ограниченное число опытов связано не с трудностью регистрации и обработки, а со сложностью и дороговизной каждого отдельного опыта. В этом случае с известной натяжкой можно также произведенные п опытов мысленно рассматривать как «выборку» из некоторой чисто условной «генеральной совокупности», состоящей из бесконечного числа возможных или мыслимых опытов, которые можно было бы произвести в данных условиях. Однако искусственное введение такой гипотетической «генеральной совокупности» при данной постановке вопроса не вызвано необходимостью и вносит в рассмотрение вопроса, по существу, излишний элемент идеализации, не вытекающий из непосредственной реальности задачи.

Поэтому рекомендуется не использовать термины, содержащие слово «выборка» («выборочное среднее», «выборочная дисперсия», «выборочные характеристики» и т. д.). Термины «статистическое среднее», «статистическая дисперсия», соответствуют им и носят более общий характер.

 

7.5. Выравнивание статистических рядов

Во всяком статистическом распределении неизбежно присутствуют элементы случайности, связанные с тем, что число наблюдений ограничено, что произведены именно те, а не другие опыты, давшие именно те, а не другие результаты. Только при очень большом числе наблюдений эти элементы случайности сглаживаются, и случайное явление обнаруживает в полной мере присущую ему закономерность. На практике мы почти никогда не имеем дела с таким большим числом наблюдений и вынуждены считаться с тем, что любому статистическому распределению свойственны в большей или меньшей мере черты случайности. Поэтому при обработке статистического материала часто приходится решать вопрос о том, как подобрать для данного статистического ряда теоретическую кривую распределения, выражающую лишь существенные черты статистического материала, но не случайности, связанные с недостаточным объемом экспериментальных данных. Такая задача называется задачей выравнивания (сглаживания) статистических рядов.

Задача выравнивания заключается в том, чтобы подобрать теоретическую плавную кривую распределения, с той или иной точки зрения наилучшим образом описывающую данное статистическое распределение (рис. 5.1).

Рис. 5.1.

Задача о наилучшем выравнивании статистических рядов, как и вообще задача о наилучшем аналитическом представлении эмпирических функций, есть задача в значительной мере неопределенная, и решение ее зависит от того, что условиться считать «наилучшим». Например, при сглаживании эмпирических зависимостей очень часто исходят из так называемого принципа или метода наименьших квадратов, считая, что наилучшим приближением к эмпирической зависимости в данном классе функций является такое, при котором сумма квадратов отклонений обращается в минимум. При этом вопрос о том, в каком именно классе функций следует искать наилучшее приближение, решается уже не из математических соображений, а из соображений, связанных с физикой решаемой задачи с учетом характера полученной эмпирической кривой и степени точности произведенных наблюдений. Часто принципиальный характер функции, выражающей исследуемую зависимость, известен заранее из теоретических соображений, из опыта же требуется получить лишь некоторые численные параметры, входящие в выражение функции именно эти параметры подбираются с помощью метода наименьших квадратов.

Аналогично обстоит дело и с задачей выравнивания статистических рядов. Как правило, принципиальный вид теоретической кривой выбирается заранее из соображений, связанных с существом задачи а в некоторых случаях просто с внешним видом статистического распределения. Аналитическое выражение выбранной кривой распределения зависит от некоторых параметров; задача выравнивания статистического ряда переходит в задачу рационального выбора тех значений параметров, при которых соответствие между статистическим и теоретическим распределениями оказывается наилучшим.

Предположим, например, что исследуемая величина X есть ошибка измерения, возникающая в результате суммирования воздействий множества независимых элементарных ошибок; тогда из теоретических соображений можно считать, что величина X подчиняется нормальному закону:

(5.1)

и задача выравнивания переходит в задачу о рациональном выборе параметров m и q в выражении (5.1).

Бывают случаи, когда заранее известно, что величина X распределяется статистически приблизительно равномерно на некотором интервале; тогда можно поставить задачу о рациональном выборе параметров того закона равномерной плотности

 

которым можно наилучшим образом заменить (выровнять) заданное статистическое распределение.

Следует при этом иметь в виду, что любая аналитическая функция f (х), с помощью которой выравнивается статистическое распределение, должна обладать основными свойствами плотности распределения:

(5.2)

Предположим, что, исходя из тех или иных соображений, нами выбрана функция f(х), удовлетворяющая условиям (5.2), с помощью которой мы хотим выровнять данное статистическое распределение; в выражение этой функции входит несколько параметров а, b,...; требуется подобрать эти параметры так, чтобы функция f(x), наилучшим образом описывала данный статистический материал. Один из методов, применяемых для решения этой задачи, — это так называемый метод моментов.

Согласно методу моментов, параметры а, b,... выбираются с таким расчетом, чтобы несколько важнейших числовых характеристик (моментов) теоретического распределения были равны соответствующим статистическим характеристикам. Например, если теоретическая кривая f(x) зависит только от двух параметров а и b, эти параметры выбираются так; чтобы математическое ожидание тх и дисперсия Dx теоретического распределения совпадали с соответствующими статистическими характеристиками тх и Dx. Если кривая f (х) зависит от трех параметров, можно подобрать их так, чтобы совпали первые три момента, и т. д. При выравнивании статистических рядов может оказаться полезной специально разработанная система кривых Пирсона, каждая из которых зависит в общем случае от четырех параметров. При выравнивании эти параметры выбираются с тем расчетом, чтобы сохранить первые четыре момента статистического распределения (математическое ожидание, дисперсию, третий и четвертый моменты) (См., например, В. И. Романовский, Математическая статистика). Оригинальный набор кривых распределения, построенных по иному принципу, дал Н. А. Бородачев (Н. А. Бородачев, Основные вопросы теории точности производства, АН СССР, М, —Л., 1950.). Принцип, на котором строится система кривых Н. А. Бородачева, заключается в том, что выбор типа теоретической кривой основывается не на внешних формальных признаках, а на анализе физической сущности случайного явления или процесса, приводящего к тому или иному закону распределения.

Следует заметить, что при выравнивании статистических рядов нерационально пользоваться моментами порядка выше четвертого так как точность вычисления моментов резко падает с увеличением их порядка.

 

Пример. 1. В п° 3 приведено статистическое распределение боковой ошибки наводки X при стрельбе с самолета по наземной цели. Требуется выровнять это распределение с помощью нормального закона:

Решение. Нормальный закон зависит от двух параметров: т и q. Подберем эти параметры так, чтобы сохранить первые два момента — математическое ожидание и дисперсию — статистического распределения.

Вычислим приближенно статистическое среднее ошибки наводки по формуле (4.7), причем за представителя каждого разряда примем его середину:

тх = -3,5•0,012 -2,5•0,050 -1,5•0,144 -0,5•0,266 +0,5•0,240 +

+1,5•0,176 +2,5•0,092 + 3,5•0,020 = 0,168.

Для определения дисперсии вычислим сначала второй начальный момент по формуле (4.9), полагая s = 2, k = 8

Пользуясь выражением дисперсии через второй начальный момент (формула (7.4.6)), получим:

D*(X) = a*2 – (m*x)2 = 0.126 – 0.028 = 2.098

Выберем параметры m и q нормального закона так, чтобы выполнялись условия:

m= т*х, q 2 = D*x,

то есть примем:

m = 0,168; q = 1,448.

Напишем выражение нормального закона:

 

Пользуясь в табл. 3 приложения, вычислим значения f (х) на границах разрядов

 

X —4 —3 —2 —1          
f(х) 0,004 0,025 0,090 0,199 0,274 0,234 0,124 0,041 0,008

 

Построим на одном графике (рис. 5.2) гистограмму и выравнивающую ее кривую распределения.

Рис. 5.2.

Из графика видно, что теоретическая кривая распределения f (х), сохраняя в основном существенные особенности статистического распределении, свободна от случайных неправильностей хода гистограммы, которые, по-видимому, могут быть отнесены за счет случайных причин.

 

Примечание. В данном примере при определении Dx мы воспользовались выражением (4.6) статистической дисперсии через второй начальный момент. Этот прием можно рекомендовать только в случае, когда математическое ожидание m* исследуемой случайной величины X сравнительно невелико; в противном случае формула (4.6) выражает дисперсию Dx как разность близких чисел и дает весьма малую точность. В случае, когда это имеет место, рекомендуется либо вычислять Dx непосредственно по формуле (4.3), либо перенести начало координат в какую-либо точку, близкую к тх, затем применить формулу (4.6). Пользование формулой (4.3) Равносильно перенесению начала координат в точку т*х это может оказаться неудобным, так как выражение т*. может быть дробным и вычитание тх из каждого х{ при этом излишне осложняет вычисления; поэтому рекомендуется переносить начало координат в какое-либо круглое значение х, близкое к т*х.

 

Пример 2. С целью исследования закона распределения ошибки из мерения дальности с помощью радиодальномера произведено 400 измерений дальности. Результаты опытов представлены в виде статистического ряда.

 

h (•*) 20; 30 30; 40 40; 50 50; 60 60; 70 70; 80 80; 90 90; loo
Mi                
Pi* 0,052 0,180 0,165 0,095 0,128 0,140 0,160 0,080

Выровнять статистический ряд с помощью закона равномерной плотности.

Решение. Закон равномерной плотности выражается формулой

и зависит от двух параметров а и b. Эти параметры следует выбрать так, чтобы сохранить первые два момента статистического распределения — математическое ожидание m*xи дисперсию D*x. Известны выражения математического ожидания и дисперсии для закона равномерной плотности:

Для того чтобы упростить вычисления, связанные с определением статистических моментов, перенесем начало отсчета в точку Х0=60 и примем за представителя каждого разряда его середину. Ряд распределения примет вид'- -

 

X~’ —35 -25 —15 —5        
Pi* 0,052 0,180 0,165 0,095 0,128 0,140 0,160 0,080

где х~’ — среднее для разряда значение ошибки радиодальномера X' при новом начале отсчета.

приближенное значение статистического среднего ошибки X' равно:

Второй статистический момент величины X' равен:

откуда статистическая дисперсия:

Переходя к прежнему началу отсчета, получим новое статистическое среднее:

и ту же статистическую дисперсию:

Параметры закона равномерной плотности определяются уравнениями:

Решая эти уравнения относительно а и b, имеем:

а =23,6; b = 96,9, откуда

На рис. 5.3. показаны гистограмма и выравнивающий ее закон равномерной плотности f(x).

Рис. 5.3




Дата добавления: 2015-01-12; просмотров: 113 | Поможем написать вашу работу | Нарушение авторских прав




lektsii.net - Лекции.Нет - 2014-2024 год. (0.014 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав