logo
ПОСОБИЕ по численным для издания

4.8 Критерии оптимального планирования

Следующей проблемой после выбора типа функции η является определение таких численных значений неизвестных параметров θ1, …, θт, при которых функция регрессии будет достаточно хорошо (или даже наилучшим образом) описывать эмпирические данные. Для её решения прежде всего необходимо задать критерий, который определял бы степень соответствия эмпирических данных и регрессионной зависимости. Любой такой критерий должен учитывать отклонения между измеренными значениями у1 ..., yN и приближенными значениями.

Критерии оптимального выбора θ могут быть заданы различными способами. Например, наилучшим могут считаться те θ, для которых величины минимальны.

, , (4.58)

Многие экспериментальные ситуации таковы, что нельзя (по крайней мере без дополнительных экспериментов) задать один критерий оптимальности, но можно указать множество критериев α(ξ)}, каждый из которых желательно минимизировать выбором ξ. При этих условиях задача планирования многокритериальна.

Можно утверждать, что специфической задачей теории планирования эксперимента является конструирование критерия его оптимальности. Второй задачей является экстремальная (может быть очень сложная) задача. Можно выделять некоторые классы экстремальных задач теории планирования эксперимента, допускающих специальные методы исследования, но роль общей теории решения экстремальных задач приуменьшить нельзя. В соответствии с этой точкой зрения основное внимание уделяется критериям оптимальности, их конструированию и их свойствам. При конструировании критерия важную роль играет априорная информация, находящая свое отражение в высказываемой экспериментатором гипотезе модели изучаемого явления.

Эксперимент как активное воздействие на объект с целью получения необходимого эффекта требует на свою реализацию некоторого расхода ресурсов: материальных, временных, трудовых и др. Эксперимент может быть оптимизирован по двум граничным направлениям:

1) если исследователь может израсходовать на эксперимент весь имеющийся в наличии ресурс, то естественно его стремление получить максимально возможный объем новой информации о поведении, структуре, надежности и других сторонах исследуемого объекта;

2) если исследователю задан уровень необходимого эффекта или объем информации о поведении объекта, то естественно его стремление к тому, чтобы достигнуть результата при минимальном расходе ресурсов (уменьшая количество опытных установок и образцов, сокращая сроки работы, не привлекая специалистов определенного уровня и т.п.).

На основании вышеизложенного следуют выводы, определяющие некоторые основные принципы оптимального планирования эксперимента. Во-первых, из системы нормальных уравнений для определения L неизвестных оценок bi в модели, линейной по параметрам, следует, что необходимо и достаточно, чтобы матрица Х содержала L разных строк. Следовательно, минимальное число опытов в плане Nmin = L (насыщенный план), а избыточность опытов NL полезна не с алгебраической, а со статистической точки зрения. Во-вторых, ковариационная матрица D определяет не только численные значения вектора Β неизвестных оценок коэффициентов модели, но и характеристики точности модели как в целом, так и отдельных ее параметров. Диагональные элементы матрицы cii оценивают дисперсии оценок каждого коэффициента S2{bi}, следовательно, точность оценок будет различной, если эти элементы не равны между собой. Внедиагональные элементы cij определяют корреляцию оценок коэффициентов модели и если ρ{bi bj}≠0, то работа исследователя с моделью усложниться. В-третьих, ковариационная матрица D = ХТХ-1 не зависит от результатов эксперимента и, следовательно, может быть исследована до его реализации. Результаты такого анализа могут служить основой для конструирования матрицы плана Х некоторым оптимальным (с точки зрения целей исследования системы) образом до проведения опытов. До опыта можно исследовать и меру точности предсказания выхода d= ХТ Dx, связанную только с расположением опытных точек, использовать результаты анализа для повышения точности модели и т.п.

Исследование матриц D, мер точности d и других статистических характеристик с целью конструирования матриц плана Х и есть одно из направлений оптимального алгоритмизированного планирования эксперимента. Оптимальность оценивается по большому числу критериев, каждый из которых приобретает ту или иную ценность для экспериментатора в зависимости от целей его исследований. Эти критерии в абстрактной математической форме обобщают ту массу пожеланий, которые выдвигают к результатам исследований. Ниже приведены критерии, имеющие наибольшее распространение в материаловедении и технологии и наиболее важны для решения прикладных технико-экономических задач.

Из анализа формул следуют критерии, связанные с определением и минимизацией дисперсии оценок коэффициентов модели:

а) оценки коэффициентов модели будут независимыми только при ρ{bi bj}=0, что приводит к диагональности матрицы [D]. При этом угол поворота Ω=0 и направление главных осей эллипсоида рассеяния (γ и π в линейной однофакторной модели) совпадает с направлением координатных осей пространства параметров, а размеры его большого и малого диаметров могут определяться как индивидуальные доверительные интервалы оценок bi. План, обеспечивающий ρ{bi bj}=0, называется ортогональным (рисунок 12, д). В таком плане суммы по всем N опытам равны 0, а для двухуровневых планов, кроме того, действительно соотношение:

(4.59)

б) для минимизации обобщенной дисперсии, пропорциональной объему эллипсоида рассеяния оценок параметра, а для линейной однофакторной модели – площади эллипса , необходимо минимизировать определитель ковариационной матрицы или максимизировать определитель информационной матрицы [М], в частности . План, соответствующий требованию mindet [М]-1 на множества планов, отвечает критерию D-оптимальности (determinant) (рисунок 12, а). Этот критерий наиболее тесно связан с центральными идеями математической статистики (с теорией эффективных оценок) и является одним из важнейших в современной математической теории эксперимента. План обеспечивает максимальную величину определителя главной матрицы (информационной) и минимальную величину определителя матрицы дисперсий (это транспонированная информационная матрица);

в) минимальная средняя дисперсия оценок коэффициентов связана с поиском суммы квадратов длин осей эллипсоидов рассеяния (для эллипса из: или минимума длины диагонали многомерного прямоугольника, описанного вокруг эллипсоида. Для этого минимизируется след матрицы t2[D](или [(11)+(00)]→min). Такой критерий носит название А-оптимальность (averadge variance) (рисунок 12, б);

Рисунок 12 – Взаимосвязь критериев оптимальности с эллипсом рассеяния: аD-оптимальность; бА-оптимальность; в– параметры эллипса; г – Е-оптимальность; д – ортогональность

г) для минимизации максимальной оси эллипсоида рассеяния ( ) минимакс собственного значения (eigen value) матрицы [D] - критерий Е-оптимальности (рисунок 12, г). В этом случае отдельные оценки параметров модели не будут обладать слишком большими дисперсиями и ковариациями.

С оценками коэффициентов модели связаны и такие критерии оптимальности планов, как минимакс дисперсии оценок коэффициентов (minimax cii) и минимум суммы относительных ошибок оценок min .

Из анализа меры точности d следуют критерии, связанные с ошибкой модели в целом:

а) если необходимо обеспечить минимум средней дисперсии оценки выхода или , то должна быть минимальная функция , что соответствует критерию Q-оптимальности;

б) минимуму максимального значения дисперсии оценки min( )max соответствует minimax d, а критерий называется G-оптимальность (general variance);

в) постоянство дисперсии предсказания на равных расстояниях от центра эксперимента – ротатабельность – обеспечивается при d=f{ρ},где ρ= ;

г) если в пределах (|ρ|≤1), желательно обеспечить постоянство дисперсии предсказания ≈сonst, униформность, то должно обеспечиваться кроме ротатабельности, и условия d≈сonst, что достигается повторением опытов, в частности в центре плана.

К числу критериев, облегчающих процедуру экспериментов и построение моделей, можно отнести следующие:

а) минимизация числа опытов, то есть близость числа опытов N к числу оцениваемых параметров модели α. По-видимому, особый интерес этот критерий будет вызывать у экспериментатора на первом поисковом этапе исследования, когда можно получить даже не очень точное представление об объекте, но при минимуме затрат материальных и временных ресурсов;

б) простота вычислений коэффициентов модели;

в) композиционность плана – возможность использовать точки плана первого этапа в плане второго этапа в случае, если модель первого этапа (полином степени m, например, линейный) неадекватно описывает поведение системы (требуется описание полиномом степени m+1, например, квадратичным).

Наличие такого большого числа, часто несовместимых критериев оптимальности, с одной стороны, усложняет принятие решения о выборе плана экспериментатором, с другой стороны, дает ему возможность построить (или выбрать) план в соответствии с целями данного этапа исследований. В настоящее время в результате развития общей методологии математической теории эксперимента теперь нет необходимости выбирать один какой-нибудь критерий, а появилась возможность построения компромиссных планов достаточно хороших с позиций разных критериев [7].