logo search
Исследование систем управление - Малин

Регрессионный анализ

Регрессионный анализ ставит своей задачей исследование зависимости одной случайной величины от ряда других случайных и неслучайных величин (регрессия — зависимость математического ожидания случайной величины от значений других случайных величин). Например, после проведения N экспериментов на статистической модели получен набор реализаций случайных величин {Xi, Yi}, i = 1, 2, 3, ..., п, где X является независимой переменной, a Yфункцией. Обработка этого массива случайных величин позволяет представить их в виде детерминированной линейной регрессивной модели типа:

Y = a + bY, (3.1)

где коэффициенты а и b рассчитываются согласно методу наименьших квадратов таким образом, чтобы квадраты отклонений случайных величин Yi от значений функций (3.1) на множестве X i были наименьшими, т.е.

В случае нескольких независимых переменных регрессивная модель представляется линейным полиномом

где хj(0) являются базовыми значениями всех k переменных, в окрестностях которых анализируется характер исследуемого процесса.

Выражение (3.3) представляет собой линейную функцию, однако, если значения Ах. достаточно велики или функция Y существенно нелинейна, то можно использовать разложение более высокого порядка (см. [6.44]).

При анализе регрессионной модели (3.3) значения коэффициентов bj показывают степень влияния j-й переменной на функцию Y, что позволяет разделить все переменные на существенные и несущественные. Однако наибольший интерес регрессионная модель представляет для прогноза поведения функций Y. В практической деятельности регрессионный анализ часто используется для создания так называемой эмпирической модели, когда, обрабатывая результаты наблюдений (или характеристики существующих систем), получают регрессионную модель и используют ее для оценки перспективных систем или поведения системы при гипотетических условиях (см. [6.44]).

Точность и надежность получаемых оценок зависят от числа наблюдений (реализаций, экспериментов) и расположения прогностических значений х относительно базовых (т.е. известных на некоторый момент времени) хj(0). Чем больше разность хj, тем меньше точность прогноза.