Студопедия  
Главная страница | Контакты | Случайная страница

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Общие сведения. Статистические методы планирования активного эксперимента явля­ются одним из эмпирических способов получения математического описа­ния сложных объектов

Читайте также:
  1. I. Общие компетенции.
  2. I. ОБЩИЕ МЕТОДИЧЕСКИЕ УКАЗАНИЯ
  3. I. ОБЩИЕ ПОЛОЖЕНИЯ
  4. I. ОБЩИЕ ПОЛОЖЕНИЯ
  5. I. ОБЩИЕ ПОЛОЖЕНИЯ
  6. I. ОБЩИЕ ПОЛОЖЕНИЯ
  7. I. ОБЩИЕ ПОЛОЖЕНИЯ
  8. I. ОБЩИЕ ПОЛОЖЕНИЯ
  9. I. ОБЩИЕ ПОЛОЖЕНИЯ
  10. I. ОБЩИЕ ПОЛОЖЕНИЯ

 

Статистические методы планирования активного эксперимента явля­ются одним из эмпирических способов получения математического описа­ния сложных объектов исследования, т.е. уравнения связи отклика объекта у и независимых управляемых входных переменных (факторов) х=(x1,x2,…,xk).

При этом математическое описание представляется в виде некоторого полинома — отрезка ряда Тейлора, в который разлагается неизвестная зависимость в окрестности основной точки x, например:

M{y}=j(x1,x2,…,xn)=b0+åbjxj+åbjlxjxl+åbjjxj2, j,l=1..k, l<j (1.1)

где bj,bjl ,bjj – теоретические коэффициенты:

; ;

 

Вследствие наличия неуправляемых и даже неконтролируемых факто­ров изменение величины у носит случайный характер, поэтому функцио­нальная зависимость j(x) не дает точной связи между управляемыми факторами x(i) и откликом объекта yi, в каждом i-м опыте, а лишь между управляемыми факторами и математическим ожиданием случайной вели­чины y:

M{yi}=j(x(i)) (1.2)

где j(x) – уравнение регрессии у по х; x(i)=(x1(i), x2(i),…, xn(i)) – i-я точка пространства независимых управляемых факторов (факторного пространства).

В таком случае по результатам эксперимента можно отыскать оценку уравнения регрессии у=j(x) в форме некоторого полинома

уМ=b0+åbjxj+åbjlxjxl+åbjjxj2, j,l=1..k, l<j (1.3)

где коэффициенты b0, b1,…, bj,…, bjj являются лишь оценками теоре­тических коэффициентов регрессии b0, b1, bj, bjj соответственно, а уМ оценкой М{y}, вычисленной по уравнению регрессии (1.3). Пусть x(i)(i=1,N) — точки факторного пространства, в которых проводится эксперимент. Тогда задача отыскания оценок коэффициентов уравнения регрессии (1.3) по результатам опытов в N точках факторного пространст­ва является типичной задачей множественного регрессионного анализа в том случае, если выполняются следующие предпосылки:

1. Результаты наблюдений отклика y1, y2,…, yN в N точках фактор­ного пространства представляют собой независимые нормально распреде­ленные случайные величины, т.е. на них воздействуют нормально распре­деленные случайные помехи x, с нулевым математическим ожиданием M[x].

2. Дисперсии s2{y1} (i=1,N) равны. Это значит, что дисперсия s2{y1} не зависит от значения входных переменных x и получаемые при проведении многократных повторных наблюдений над величиной y в любых точках x(i) факторного пространства выборочные оценки диспер­сии si (у) однородны (воспроизводимость с равной точностью).

3. Независимые управляемые факторы x1, x2,…, xk измеряются с пренебрежимо малыми ошибками по сравнению с ошибкой x, в определе­нии у (имеется в виду влияние их ошибок на величину у по сравнению с влиянием неуправляемых и неконтролируемых факторов).

Для локального участка в пределах заданной точности поверхность отклика может быть аппроксимирована полиномом первой степени

yM=b0+åbjxj j=0..k (1.4)

Положение локального участка задается координатами базовой (центральной) точки (x10, x20,…, xk0), называемой центром экспери­мента, и величиной интервалов варьирования Dx1, Dx2,…, Dxk.

Выбор координат базовой точки должен отвечать следующим услови­ям:

— центр эксперимента принимается в точке обычного номинального режима

функционирования исследуемой системы (объекта);

— базовая точка может находиться в центре области ограничения факторов хi, если они имеются в наличии, а другой информации о целевой функции нет;

— если имеется какая-то информация относительно положения экс­тремума целевой функции, то целесообразно центр эксперимента выбрать вблизи предполагаемого оптимума.

Интервалы варьирования выбираются исходя из следующих сообра­жений. Большие интервалы варьирования не позволяют определить осо­бенности поверхности отклика. Слишком малые интервалы обусловлива­ют рост погрешностей в оценке составляющих градиента за счет возраста­ния ошибки наблюдений. Кроме того, необходимо, чтобы входные и вы­ходные переменные не выходили за допустимую область:

xj min£xj£xj max, j=1,k (1.5)

где xj min, xj max — нижняя и верхняя границы изменения j-го фактора.

В общем случае выбор локального участка (центра плана и интерва­лов варьирования) зависит от вида поверхности отклика. В лабораторной работе начальные координаты центра плана принимаются равными сере­дине области определения факторов, а начальные значения интервалов варьирования обычно принимаются равными 1...5% от величины указан­ной области.

При построении плана эксперимента в локальной области факторно­го пространства используется кодировка уровней факторов с помощью формулы

где хj кодированное значение уровня фактора; хj~ реальное значение уровня фактора в натуральных единицах; хj0~ значение фактора в центре плана в натуральных единицах; D x j~— интервал варьирования в натуральных единицах.

Если число факторов известно и планирование проводится на двух уров­нях, то число опытов, необходимое для реализации всех возможных ком­бинаций уровней факторов, будет

N=2k

Условия эксперимента можно записать в виде таблицы, где строки соответствуют различным опытам, а столбцы — значениям факторов. На­пример, для двух факторов условия эксперимента приведены в табл. 1.1.

Таблица 1.1

Номер Фактор   Отклик
  х1 х2 у
  -1 -1 у1
  +1 -1 у2
  -1 +1 у3
  +1 +1 у4

Сформированный подобным образом план эксперимента называется

двухуровневым полным факторным экспериментом (ПФЭ) типа 2k. Для его построения можно воспользоваться следующим приемом: в первом столбце знаки меняются поочередно, во втором — чередуются через два, в третьем — через четыре, в четвертом — через восемь и т.д.

План, соответствующий построенной таким образом матрице плани­рования (МП), обладает следующими свойствами:

1) симметричность относительно центра эксперимента — алгебраи­ческая сумма элементов вектор-столбца каждого фактора равна нулю:

åx(i)j=0, i=1,N, j=1,k

2) условие нормировки — сумма квадратов элементов каждого столб­ца равна числу опытов:

å (x(i)j)2=N, i=1,N, j=1,k

3) ортогональность матрицы — скалярное произведение любых двух векторов-столбцов матрицы равна нулю:

åx(i)j* x(i)u =0, j¹u, i=1,N, j,u=1,k

Полный факторный эксперимент дает возможность вычислить неза­висимо коэффициенты, соответствующие не только линейной части моде­ли (1.1), но и эффектам взаимодействия. Во многих практических задачах влияние взаимодействий (произведений факторов) второго и более высо­ких порядков отсутствует или пренебрежимо мало. Кроме того, на первых этапах исследования часто достаточно получить в первом приближении лишь линейную аппроксимацию изучаемого уравнения связи при мини­мальном количестве опытов. Поэтому неэффективно использовать ПФЭ для оценивания коэффициентов лишь при линейных членах и некоторых парных произведениях из-за избыточного числа точек плана (2k), в осо­бенности при большом числе факторов k (для определения (k+1) коэффи­циентов линейной модели достаточно (k + 1) точек плана эксперимента).

Дробным факторным экспериментом (ДФЭ) называется эксперимент, реализующий часть (дробную реплику) полного факторного эксперимен­та. Он позволяет получить, например, линейное приближение искомой функциональной зависимости М {у} = j(х) в некоторой небольшой ок­рестности точки базового режима при меньшем числе опытов.

Так, для решения трехфакторной (k = 3) задачи регрессии в линейном приближении можно ограничиться четырьмя вариантами варьирования, если для плана ПФЭ типа 22 переменных х 1, х 2 произведение х 1, х 2 приравнять третьему независимому фактору х 3. Использование матрицы планирования, представленной в табл. 1.2, позволяет найти свободный член b 0 и три оценки коэффициентов регрессии при линейных членах

b1, b2, b3 (из четырех опытов нельзя получить более четырех оценок коэффициентов регрессии).

 

 

Таблица 1.2

n X0 X1 X2 X3 X1 X2 X1 X3 X2 X3 X1X2X3
  +1 -1 -1 +1 +1 -1 -1 +1
  +1 +1 -1 -1 -1 -1 +1 +1
  +1 -1 +1 -1 -1 +1 -1 +1
  +1 +1 +1 +1 +1 +1 +1 +1

 

Применение ДФЭ всегда связано со смешиванием, т.е. с совместным оцениванием нескольких теоретических коэффициентов математической модели. В рассматриваемом случае каждый из найденных коэффициентов b1 включает в себя оценки двух теоретических коэффициентов регрессии:

b0®b0+b123; b1®b1+b23; b2®b2+b13; b3®b3+b12;

Действительно, указанные теоретические коэффициенты в таком пла­нировании не могут быть найдены раздельно, поскольку столбцы МП для линейных членов и парных произведений совпадают (полностью коррелированы). Рассмотренный план ДФЭ представляет половину плана ПФЭ типа 2 3 и называется полурепликой от ПФЭ типа 2 3 или планом типа N = 23-1 (табл. 1.2).

При большом числе k факторов для получения линейного приближе­ния можно построить дробные реплики более высокой степени дробности. Так, при k= 5 можно составить дробную реплику (четвертьреплику) на основе ПФЭ типа 2 3, приравняв два из пяти факторов к взаимодействиям трех других факторов: парному и тройному. Будем обозначать тип дроб­ной реплики записью 2 k-p, если р факторов приравнены к произведени­ям остальных k - р факторов. Дробность реплики при этом равна

1/2p.

При планировании ДФЭ недопустимо произвольное разбиение ПФЭ на части. Для правильного планирования ДФЭ необходимо использовать все имеющиеся сведения теоретического и интуитивного характера об объекте и выделить те факторы и произведения факторов, влияние кото­рых на отклик существенно. При этом смешивание нужно производить так, чтобы линейные коэффициенты b0, b1, …, bk были смешаны с коэффициентами при взаимодействиях самого высокого порядка (так как обычно они в модели отсутствуют) или при тех взаимодействиях, о кото­рых априори известно, что они не оказывают влияния на отклик.

Для построения плана ДФЭ типа 2 k-p выбирается k - р факторов и для них строится ПФП. Значения оставшихся p факторов определяются приравниванием их различным взаимодействиям (парным, тройным и т.д.) предшествующих факторов. Эти выражения называются генерирую­щими соотношениями. Так, в рассмотренном выше примере при построении полуреплики типа 2 3-1 переменная x была задана генерирующим соотношением х3 = х1 х2.

Умножив обе части генерирующего соотношения на переменную, для задания которой оно использовалось, получим выражение, называемое определяющим контрастом (1 = х 1 х 2 х 3, так как всегда х 1 х 1 = 1). Совокупность всех определяющих контрастов, а также их произведений составляет обобщающий определяющий контраст (ООК).

Значение ООК позволяет для всех факторов определить, с какими эффектами взаимодействия смешаны их линейные эффекты. Перемножив поочередно каждый из независимых факторов на ООК, получим x1=x2x3, x2=x1x3, x3=x1x2. Собственно сам ООК зада­ет систему смешивания для центра плана x0=x1x2x3.

Отсюда легко находятся смешиваемые теоретические коэффициенты регрессии и их оценки:

b0®b0+b123; b1®b1+b23; b2®b2+b13; b3®b3+b12;

Если априори можно принять, что коэффициенты при всех парных и тройном взаимодействиях равны нулю, то реализация этой полуреплики позволит получить раздельные оценки всех четырех линейных коэффици­ентов регрессии.

Для четвертьреплики в пятифакторном планировании типа 25-2 должны быть заданы два генерирующих соотношения, например:

x4=x1x2x3, x5=x1x2,

причем полагаем b123= 0, т.е. x1,x2,x3 все вместе не взаимодейст­вуют и b12= 0, т.е. x1,x2 также не взаимодействуют. Определяющие контрасты для этой реплики согласно приведенным выше правилам имеют вид

1=x1x2x3x4, 1=x1x2x5

Обобщающий определяющий контраст, построенный на основе всех полученных определяющих контрастов и их произведений, полностью характеризует разрешающую способность реплик высокой степени дроб­ности. Так, в данном случае ООК имеет вид

1= x1x2x3x4= x1x2x5=x3x4x5.

Совместные оценки здесь определяются вспомогательными соотно­шениями

x0=x1x2x3x4=x1x2x5=x3x4x5;

x1=x2x3x4=x2x5=x1x3x4x5;

x2=x1x3x4=x1x5=x2x3x4x5;

x1x3=x2x4=x2x3x4=x1x4x5;

x3=x1x2x4=x1x2x3x5=x4x5;

x4=x1x2x3=x1x2x4x5=x3x5;

x5=x1x2x3x4x5=x1x2=x3x4;

Эти вспомогательные соотношения позволяют установить, какие столбцы МП окажутся линейно зависимыми и, следовательно, совместной оценкой каких теоретических коэффициентов является тот или иной выбо­рочный коэффициент регрессии:

b0®b0+b1234+b125+b345;

b1®b1+b234+b25+b1345;

b2®b2+b134+b15+b2345;

b3®b3+b124+b1235+b45;

b4®b4+b123+b1245+b35;

b5®b5+b12345+b12+b34;

b13®b13+b24+b235+b145;

b14®b14+b23+b245+b135;

Разрешающая способность этой четвертьреплики невысокая и равна трем, так как все теоретические линейные коэффициенты регрессии сме­шаны с коэффициентами при парных взаимодействиях. Следует иметь в виду, что план ДФЭ всегда можно дополнить до плана ПФЭ недостающи­ми дробными репликами. В данном примере для остальных трех четвертьреплик генерирующие соотношения запишутся в виде

x4=x1x2x3;

x5=-x1x2;

 

x4=-x1x2x3;

x5=x1x2;

 

x4=-x1x2x3;

x5=-x1x2;

а обобщающие определяющие соотношения — в виде

1=x1x2x3x4=-x1x2x5=-x3x4x5;

1=-x1x2x3x4=-x1x2x5=-x3x4x5;

1=-x1x2x3x4=-x1x2x5=x3x4x5;

Осуществление этих дополняющих четвертьреплик означает реализа­цию ПФЭ в целом и, следовательно, раздельное оценивание всех теорети­ческих коэффициентов регрессии.

С учетом свойств матрицы планирования формулы для вычисления оценок коэффициентов регрессии bj и bj1 принимают вид

; ; ; j,l=1,..,k, j¹l (1.6)

Поскольку они определяются по результатам эксперимента (случай­ные величины), то и значения их также случайны, т.е. определяются с погрешностями. Может случиться, что абсолютная величина некоторых коэффициентов приблизительно равна погрешностям их определения или даже меньше. Такие коэффициенты считаются незначимыми. Физически незначимость коэффициента по какому-либо фактору хj означает, что приращение целевой функции, вызванное изменением фактора хj, соиз­меримо с погрешностями измерения целевой функции.

Для ортогональных планов ПФЭ и ДФЭ дисперсии коэффициентов регрессии равны между собой и определяются следующим образом:

sbj2=sbjl2=Dвос/N,

где Dвос - s 2{у} — дисперсия воспроизводимости, характеризующая

ошибку наблюдений. Для ее определения в одной из точек плана (обычно в центре) производится q независимых наблюдений выходной переменной у. Оценка Dвос будет

 

;

где у 0j значение выходной переменной в i-м наблюдении.

Проверка значимости коэффициентов b j состоит в проверке статис­тической гипотезы H0: bj = 0. С этой целью используется статистика

U j=bj/ sbj, подчиненная t-распределению Стьюдента c nвос =q -1 числом степеней свободы. Если вычисленное значение ½ U j ½< ta, то гипотеза принимается и коэффициент bj незначим. Значение ta берется из таблицы t -распределения (приложение 2) при заданном уровне значи­мости a.

Аналогично может быть проверена значимость коэффициентов рег­рессии bjl.

Статистическая незначимость оценки коэффициента регрессии может быть обусловлена следующими причинами:

— данный j-й фактор не имеет функциональной связи с откликом, т.е. bj = 0;

— уровень хj0 базового режима x0 находится в точке частного экстремума функции отклика по фактору xj и тогда

bj=¶y/¶xj=0;

— интервал варьирования D xj выбран малым;

— вследствие влияния неуправляемых и неконтролируемых факторов велика ошибка воспроизводимости эксперимента.

Если значимы все коэффициенты регрессии, полученная модель может быть использована для исследования системы.

Если часть коэффициентов регрессии значима, а часть незначима, то можно провести дополнительную серию опытов с тем же центром плана (или с его переносом) и новыми интервалами варьирования по незначи­мым факторам.

Возможны другие способы получения значимых коэффициентов — увеличение числа параллельных опытов и достройка плана путем перехода к реплике меньшей дробности.

Если все коэффициенты незначимы, следует увеличить интервалы варьирования D хj (j=1,k) по всем факторам.

Следует отметить, что найденные по формулам (1.6) параметры моде­ли могут быть использованы только при подстановке в модель (1.4) нор­мированных значений переменных (1.5). Для получения линейной регрес­сионной модели, использующей значения входных переменных в нату­ральных единицах, необходимо произвести пересчет коэффициентов мо­дели по формулам

; ; j=1,..,k

где b — коэффициенты модели в нормированной системе координат; а — коэффициенты модели в абсолютной системе координат.

Для модели первого порядка с парными взаимодействиями формулы пересчета коэффициентов имеют вид

;

 

, i=1..k;

 

, i,j=1..k, i>j

Для проверки гипотезы об адекватности математического описания опытным данным достаточно оценить отклонение предсказаний по полу­ченному уравнению регрессии величины отклика уMi от результатов на­блюдений yi в одних и тех же i -x точках факторного пространства. Рас­сеяние результатов наблюдений вблизи уравнения регрессии, оцениваю­щего истинную функцию отклика, можно охарактеризовать с помощью дисперсии адекватности

,

где (k + 1) — число членов аппроксимирующего полинома. Дисперсия адекватности определяется с числом степеней свободы nад=N-(k+1).

Проверка гипотезы об адекватности состоит, по сути дела, в сопостав­лении дисперсии адекватности D ад с оценкой дисперсии воспроизводимости отклика Dвос. Если эти оценки дисперсий однородны, то матема­тическое описание адекватно представляет результаты опыта, если же нет, то описание считается неадекватным. Проверку гипотезы об адекватности производят с использованием F -критерия Фишера, который характери­зуется отношением

F=Dад/Dвос.

Если найденное эмпирически значение критерия F меньше критичес­кого Fкр, найденного из приложения 1 для соответствующих степеней свободы числителя vад = N - (k+l) и vвос = q-1 знаменателя при заданном уровне значимости a, то гипотезу об адекватности принимают. В противном случае гипотезу отвергают и математическое описание признается неадекватным.

Проверка адекватности возможна только при числе степеней свободы nад и nвос больше нуля. Если число N вариантов варьирования плана ПФЭ равно числу оценок коэффициентов регрессии N = k + 1, то для проверки гипотезы об адекватности математического описания степеней свободы не остается (n =0). Если же некоторые оценки коэффициен­тов регрессии оказались незначимыми, то число членов проверяемого уравнения в этом случае меньше числа N вариантов варьирования N > k + 1 и для проверки гипотезы об адекватности останется одна или несколько степеней свободы (nад > 0). Однако в этом случае необходи­мо исключить незначимые коэффициенты bj из уравнения регрессии и пересчитать величину D ад.

Если гипотеза об адекватности отвергается, необходимо переходить к более сложной форме математического описания либо, если это возмож­но, проводить эксперимент с меньшим интервалом варьирования D xj. Следует отметить, что максимальная величина интервала варьирования определяется условием адекватного описания объекта в области варьиро­вания. Если при больших интервалах варьирования математическая мо­дель неадекватна, то возникают систематические ошибки в определении коэффициентов, для уменьшения которых следует сузить область варьиро­вания. Однако с уменьшением интервала варьирования появляется целый рад новых трудностей: растет отношение помехи к полезному сигналу, что приводит к необходимости увеличения числа параллельных опытов для выделения полезного сигнала на фоне шума, иначе оценки коэффициентов могут стать статистически незначимыми.

Если линейная модель неадекватна, то необходимо оценить значи­мость влияния квадратичных членов уравнения (1.1) на выходную пере­менную. С этой целью используется статистика

,

подчиненная t - распределению Стьюдента с числом степеней свободы nboc = q - 1.Если U < ta, найденного из приложения 2 при заданном уровне значимости a, то влияние факторов хj2 незначимо и им можно пренебречь. В противном случае нужно переходить к уравнению регрессии более высокого порядка.

 

 

Варианты задания области изменения факторов и значимых взаимодействий представлены в табл. 1.3.

Таблица 1.3

Номер варианта Границы области допустимых значений факторов Значимые взаимодействия
Х1 Х2 Х3 Х4 Х5
  0;30 -10;40 0;70 -50;20 -15;15 x1x3, x1x4
  40;100 25;45 -10;80 20;100 25;65 x1x3, x1x5
  10;70 10;80 -15;65 50;90 40;100 x2x3, x3x4
  40;90 -20;20 10;60 50;100 -15;45 x1x4, x1x5
  20;60 0;60 -15;75 0;40 10;60 x1x4, x3x4
  10;60 -15;75 40;90 50;80 0;100 x1x3, x2x3
  45;85 40;120 30;100 20;70 50;120 x1x3, x3x4
  50;125 -20;50 20;80 40;90 30;80 x2x4, x2x5

 

Для проведения эксперимента и получения значений функции от­клика в заданных точках плана используется стандартная программа BLACKBOX, входящая в состав математического обеспечения кафед­ры. Способы обращения к программе и организации ввода данных представляются преподавателем.

 

Содержание отчета

 

Отчет должен содержать:

— задание;

— матрицы планирования эксперимента, составленные из кодирован­ных и реальных значений входных переменных;

— результаты эксперимента;

— результаты расчетов оценок коэффициентов регрессий и диспер­сий;

— результаты проверки значимости коэффициентов и адекватности модели;

— выводы по работе.

 

Контрольные вопросы

 

1. Каким образом формируется матрица планирования при ПФЭ?

2. Какими свойствами обладает матрица планирования?

3. Как осуществляется выбор интервала варьирования? Его допусти­мые максимальные и минимальные значения.

4. Дробные реплики. Значение реплик и составление для них матриц планирования.

5. Почему желательна симметрия уравнений регрессии относительно коэффициентов?

6. Каково допустимое минимальное число экспериментов при задан­ном числе факторов?

7. Полуреплики 2 4-1 заданы: одна — определяющим контрастом 1=x1x2x3x4, другая — генерирующим соотношением х 4 = - x1 х2. Какая из этих полуреплик обладает большей разрешающей способностью?

8. Матрица планирования (ДФЭтипа25-1) задана генерирующими соотношениями x4=-x1x3; x5=x1x3x2. Найти систему смешивания основных факторов.

9. Как проверить значимость оценок коэффициентов регрессии?

10. При каких условиях оценки коэффициентов регрессии незначимы и как эти условия устранить?

11. Как проверить адекватность модели?

 




Дата добавления: 2014-12-19; просмотров: 18 | Поможем написать вашу работу | Нарушение авторских прав




lektsii.net - Лекции.Нет - 2014-2024 год. (0.031 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав