3.2.2 Второй этап – определение точечных оценок распределения
В вероятностных (стохастических системах) наряду с необходимостью действует случайность. Под случайным событием понимается факт, который в результате испытания (осуществления правил) может произойти или не произойти. Мерой объективной возможности случайного события А является вероятность:
Р{A}(0≤P{A}≤1) (3.26)
Случайной величиной Y называется величина, значения которой подвержены некоторому неконтролируемому разбросу при повторении данного процесса (наблюдения, эксперимента). Поведение случайной величины полностью описывается функцией распределения вероятностей F{Y}, которая показывает вероятность того, что случайная величина Y примет значения меньше Yа:
F{Y}=P{Y≤Ya}; (-∞≤Y≤Ya) (3.27)
Исчерпывающими вероятностными характеристиками случайной величины являются дифференциальная и интегральная функции распределения. Однако некоторые основные свойства случайных величин могут быть описаны более просто с помощью определенных числовых параметров. Наибольшую роль среди них на практике играют два параметра, характеризующие центр рассеяния (центр распределения) случайной величины и степень ее рассеяния вокруг этого центра. Наиболее распространенной характеристикой центра распределения является математическое ожидание Мх случайной величины Х (часто называемое также генеральным средним значением). Математическим ожиданием дискретной случайной величины называют сумму произведений всех ее возможных значений на их вероятности.
Пусть случайная величина Х может принимать только значения Х1, Х2,…Хn, вероятности которых соответственно равны р1, р2,…рn. Тогда математическое ожидание М(х) случайной величины Х определяется равенством:
М(х) = Х1р1 + Х2р2 +…+ Хnрn. (3.28)
Если дискретная случайная величина Х принимает счетное множество возможных значений, то М(х)=∑Хiрi , (р - вероятность появления значений Хi). Вероятностный смысл полученного результата таков: математическое ожидание приближенно равно (тем точнее, чем больше число испытаний) среднему арифметическому наблюдаемых значений случайной величины.
Степень рассеяния случайной величины Х относительно МХ может быть охарактеризована с помощью генеральной дисперсии S2:
(3.29)
где Xi – выборочная совокупность;
X – среднее значение выборочной совокупности;
N – объем выборочной совокупности.
Если же значения признака Х1, Х2,…Хк имеют соответственно частоты N1, N2,…Nk, причем N1+N2+…+Nk=Ni, то
(3.30)
где Ni – частоты выборочной совокупности.
то есть генеральная дисперсия есть средняя взвешенная квадратов отклонений и весами, равными соответствующим частотам.
Кроме дисперсии для характеристики рассеяния значений признака генеральной совокупности вокруг своего среднего значения пользуются сводной характеристикой – средним квадратическим отклонением. Генеральным средним квадратическим отклонением (стандартом) называют квадратный корень из генеральной дисперсии:
(3.31)
где S2 – генеральная дисперсия;
S – среднее квадратическое отклонение.
Кроме того, безразмерная характеристика – υ – коэффициент вариации
υ= (3.32)
Форма кривой распределения характеризуется коэффициентами асимметрии А и коэффициентом островершинности (эксцесс) – Е.
(3.33)
Существует левосторонняя и правосторонняя ассиметрия (рисунок 6).
а б в
Рисунок 6 – Ассиметрия: левосторонняя (а) и правосторонняя (в), б - кривая нормального рапределения
Эксцесс или коэффициент крутости:
(3.34)
Стандартное значение Е = 0; Е < 0 – плосковершинные; Е > 0 – островершинные (рисунок 7).
Две случайные величины называются независимыми, если f(x,y)=f(x)f(y). Как и в одномерном случае, основные свойства двумерной совокупности величин x, y могут быть охарактеризованы с помощью ряда числовых параметров. При этом в качестве наиболее употребительных параметров, описывающих поведение каждой из случайных величин в отдельности, как и выше, применяют математическое ожидание и дисперсия соответствующей случайной величины:
Рисунок 7 – Эксцесс: а – островершинная кривая, б- кривая нормального рапределения, в – плосковершинная кривая
S2x S2y, Sx Sy. Кроме подобного рода параметров для двумерной совокупности могут быть построены параметры, характеризующие степень взаимозависимости переменных X и Y. Простейшими из них являются ковариация двух случайных величин (называемая также корреляционным моментом) - cov (x,y),
а также нормированный показатель связи – коэффициент корреляции:
(3.35)
По своему физическому смыслу коэффициент корреляции является далеко не исчерпывающей характеристикой статистической связи, характеризуя лишь степень линейной зависимости между X и Y. Коэффициент корреляции меняется в пределах -1≤ ≤1. Если =1, то случайные величины полностью положительно коррелированны, то есть y=а0+а1х1, где а0 и а1 – постоянные, причем а1>0. Если же , то случайные величины некоррелированны а1=0. В этом случае, когда Х и Y независимые величины, для них , следовательно, они и некоррелированны. Этот коэффициент характеризует наличие или отсутствие линейной функциональной связи. Вычисляется на основе ковариации.
Некоррелированность не следует смешивать с независимостью. Независимые случайные величины всегда некоррелированы. Однако, обратное утверждение неверно: некоррелированные величины могут быть зависимы и даже функционально. Таким образом, коэффициент корреляции характеризует степень приближения зависимости между случайными величинами к линейной функциональной зависимости. Значение коэффициента корреляции определяет насколько зависимость между случайными переменными величинами близка к линейной функциональной зависимости. Коэффициент корреляции часто применяют при определении существования линейной связи между величинами. Если предварительный графический анализ указывает на какую-либо тесноту связи, то полезно вычислить коэффициент корреляции. В том случае, если величина коэффициента корреляции находится в пределах |1….0,75|, то можно с уверенностью считать, что независимо от вида этой связи, она достаточно тесна для того, чтобы исследовать её форму.
Смысл статистических методов заключается в том, чтобы по выборке ограниченного объема N, то есть по некоторой части генеральной совокупности высказать суждение о ее свойствах в целом. Подобное суждение может быть получено путем оценивания параметров генеральной совокупности с помощью некоторых подходящих функций от результатов наблюдений – оценок.
При многократном извлечении выборок одного и того же объема и последующем нахождении множества оценок одного и того же параметра получатся различные числовые значения этих оценок, изменяющиеся от одной выборки к другой случайным образом. Иными словами, любая оценка произвольного параметра есть случайная величина. Сам оцениваемый параметр является неслучайной величиной. Для оценивания одного и того же параметра можно использовать в принципе различные оценки. Чтобы выбрать наилучшую из них, необходимо сформулировать некоторые требования к свойствам оценок, желательные с точки зрения практики.
Основными свойствами оценок являются свойства несмещенности, эффективности и состоятельности. Оценка θn параметра θ называется несмещенной, если её математическое ожидание равно оцениваемому параметру θ, то есть
М( ) = θ (3.36)
Если это равенство не выполняется, то оценка может либо завышать значение θ, (то есть М( )> ), либо занижать его (то есть М( )< ). В обоих случаях это приводит к систематическим (одного знака) ошибкам в оценке параметра θ. Требование несмещенности гарантирует отсутствие систематических ошибок при оценке параметров.
Несмещенная оценка , которая имеет наименьшую дисперсию среди всех возможных несмещенных оценок параметра θ, вычисленных по выборкам одного и того же объема, называется эффективной оценкой.
Оценка параметра θ называется состоятельной, если она подчиняется закону больших чисел, то есть выполняется следующее равенство:
{P ε} = 1 (3.37)
Состоятельность оценки означает, что чем больше объем выборки, тем больше вероятность того, что ошибка оценки не превысит сколь угодно малого положительного числа ε.
Точечные оценки – это оценки некоторых неизвестных числовых параметров распределения. Они представляют собой числа, полученные путем подстановки выборочных значений Х1, Х2,…ХN в формулу для оценивания искомого параметра. Математическое ожидание и дисперсию S2 обычно оценивают с помощью следующих соотношений:
Мх= = (3.38)
S2= (3.39)
Указанные оценки являются состоятельными и несмещенными. Для выборки из нормальной совокупности оценка Х, кроме того, является эффективной.
Если объем выборки не ограничен (N → ∞), то дисперсия параметра S2x стремится к эффективной или, как говорят, она асимптотически эффективна. Несмещенность оценки S2 достигается использованием в знаменателе формулы величины ν = N-1, вместо очевидного на взгляд значения N. Величину ν называют числом степеней свободы. Она равна разности между числом имеющихся экспериментальных значений N, по которым вычисляют оценку дисперсии, и количеством дополнительных параметров, входящих в формулу для оценки этой дисперсии и вычисляемых в виде линейных комбинаций тех же самых наблюдений.
Недостаток точечной оценки, – неизвестно с какой точностью они дают оцениваемый параметр, если для большого числа наблюдений точность обычно бывает достаточной для практических выводов, то для выборок небольшого объема вопрос о точности оценок очень существенен. Поэтому более информа-тивный способ оценивания неизвестных параметров состоит не в определении единичного точечного значения, а в построении интервала, в котором с задан-ной степенью достоверности окажется оцениваемый параметр θ.
- Содержание
- Предисловие
- Введение
- 1 Исторический обзор применения моделирования
- 2 Основы системного анализа и моделирования
- 2.1 Этапы системного анализа
- 2.2 Существующие подходы анализа системы
- 2.3 Понятие о моделировании. Классификация моделей
- 2.4 Основные этапы и принципы моделирования
- 3 Элементы математической статистики
- 3.1 Понятие о математической статистике
- 3.2 Задачи математической статистики
- 3.2.1 Первый этап – сбор и первичная обработка данных
- 3.2.2 Второй этап – определение точечных оценок распределения
- 3.2.3 Третий этап – определение интервальных оценок, понятие о статистической гипотезе
- 3.2.4 Четвертый этап – аппроксимация выборочного распределения теоретическим законом
- 3.3 Области применения статистических методов обработки данных
- 3.3.1 Статистический контроль прочности бетона
- 3.3.2 Метод множественной корреляции
- 4 Статистическое планирование эксперимента
- 4.1 Понятие о планировании эксперимента. Основные задачи эксперимента
- 4.2 Понятие о полиноме, отклике, факторах и уровнях варьирования, факторном пространстве
- 4.3 Первичная статистическая обработка результатов эксперимента
- 4.4 Математическая модель эксперимента. Метод наименьших квадратов
- 4.5 Получение некоторых эмпирических формул
- 4.6 Метод наименьших квадратов для функции нескольких переменных
- 4.7 Дисперсионная матрица оценок
- 4.8 Критерии оптимального планирования
- 4.9 Планы для построения линейных и неполных квадратичных моделей
- 4.10 Планы для построения полиномиальных моделей второго порядка
- 4.11 Регрессионный анализ модели
- 4.12 Анализ математической модели
- 4.13 Решение оптимизационных задач
- 4.14 Моделирование свойств смесей
- 4.15 Принципы имитационного моделирования
- 4.16 Решение рецептурно-технологических задач на эвм в режиме диалога
- 5 Основные виды задач, решаемых при организации, планировании и управлении строительством
- 5.1 Математические модели некоторых задач в строительстве
- 5.2 Примеры решения некоторых задач
- 5.2.1 Решение транспортной задачи
- 5.2.2 Решение задачи о ресурсах
- 5.2.3 Решение задачи нахождения оптимальной массы фермы
- 5.3 Организационные задачи
- 6 Моделирование в строительстве
- 6.1 Модели линейного программирования
- 6.2 Нелинейные модели
- 6.3 Модели динамического программирования
- 6.4 Оптимизационные модели (постановка задач оптимизации)
- 6.5 Модели управления запасами
- 6.6 Целочисленные модели
- 6.7 Цифровое моделирование (метод перебора)
- 6.8 Вероятностно-статистические модели
- 6.9 Модели теории игр
- 6.10 Модели итеративного агрегирования
- 6.11 Организационно-технологические модели
- 6.12 Графические модели
- 6.13 Сетевые модели
- 7 Организационное моделирование систем управления строительством
- 7.1 Основные направления моделирования систем управления строительством
- 7.2 Аспекты организационно-управленческих систем (моделей)
- 7.3 Деление организационно-управленческих моделей на группы
- 7.4 Виды моделей первой группы
- 7.5 Виды моделей второй группы
- Список использованных источников