logo
Konspekt_lektsy_po_ASOU_7

13.2. Основные понятия надежности

Надежность системы - способность сохранять дееспособность в заданных условиях функционирования. Говоря о дееспособности, выделим критерий отказа системы. Отказ – это событие, вследствие возникновения которого система теряет способность выполнять заданное предназначение. Эти два понятия определенным образом выражаются друг через друга: отказ – это потеря дееспособности. Но в той или иной информационной системе конкретное определение отказа зависит от многих факторов: предназначения системы, выполняемого задания, требований к выполнению данной конкретной функции и т.д.

В теории надежности разделяют две основных категории отказов: внезапные и постепенные.

Внезапный отказ возникает вследствие скачкообразного изменения выходного параметра системы, в результате чего он оказывается за областью допустимых значений. Причинами внезапных отказов являются, например, обрывы, нарушения контактов, короткие замыкания и т.п. По характеру проявления такой отказ стойкий, т.е. приводит к потере дееспособности аппаратуры на время ликвидации отказа.

Постепенный отказ возникает вследствие дрейфов параметров системы под воздействием внешних факторов: изменения температуры среды, влажности, напряжения питания, времени и т.д. Дрейфы приводят к отказу в момент превышения выходным параметром допустимого значения. Так как дрейф параметров может быть оборачиваемым, дееспособность системы во многих случаях восстанавливается при уменьшении интенсивности внешнего воздействия.

Отказы, которые самоустраняются, называются сбоями.

Компьютер, состоящий в составе информационной системы, может выйти из строя не только вследствие сбоя операционной системы, действий пользователя или злоумышленника, а и в результате сбоя аппаратного устройства. Даже наилучшие операционные системы являются надежными настолько, насколько надежной является аппаратная платформа. Отказы аппаратных устройств, их компонент приводят в лучшем случае к простоям системы, в худшем – к потере данных. В связи с этим нельзя игнорировать следующее:

- любое механическое или электронное устройство рано или поздно откажет, в том числе жесткий диск или материнская плата;

- электрическая энергия, используемая для питания большинства компьютерных систем, может быть непредсказуемо выключена, искажена шумами или всплесками.

Высокая сложность и миниатюрные размеры электронных устройств делают их очень чувствительными к качеству электропитания. В тоже время качество современной энергосистемы не рассчитана на соответствующие требования к питанию компьютерных систем. Выделяют 4 типа проблем, свойственных энергосистемам:

- выключение питания;

- «шумы» электронапряжения – причиной являются электромагнитные облучения от неэкранированных устройств и природных явлений, что приводит отказам некоторых чувствительных устройств;

- всплески напряжения – внезапное превышение максимально допустимого уровня, что может вывести из строя оборудование;

- падение напряжения – краткосрочное снижение амплитуды напряжения, до уровня, недостаточного для нормального функционирования устройств; реакцией на падение напряжения может быть самовольная перезагрузка компьютера, в результате чего могут быть потеряны данные или повреждены аппаратные устройства.

Наиболее эффективной защитой при использовании некачественных систем питания являются источники бесперебойного питания.

Основные классификационные признаки отказов представлены в таблице 13.1.

Таблица 13.1

Классификация отказов

Признак классификации

Вид отказов

Характер изменения параметра до момента отказа

Внезапная

Постепенная

Сбои

Степень потери полезных свойств

Полная

Частичная

Восстанавливаемость полезных свойств

Необратимая

Обратимая

Связь с другими отказами

Независимая

Зависимая

Наличие внешних признаков

Явная

Неявная

Причина возникновения

Конструктивная

Технологическая

Эксплуатационная

Период возникновения

Период наработки

При работе нормальная эксплуатация

Период старения

При сохранении

При испытаниях

Цена отказа

Простои техники (убытки от ремонта)

Невыполнение задания (потери от этого)

Моральные убытки

В зависимости от характера обслуживания различают системы восстанавливаемые и невосстанавливаемые.

Система называется невосстанавливаемой, если ее использование прекращается сразу после первого отказа.

Информационные системы бывают простыми и сложными.

Простыми системами считаются те, в которых четко определен признак отказа, т.е. можно указать элемент, отказ которого приводит к отказу системы.

Надежностьсвойство сохранять во времени в установленных границах значения всех параметров, которые характеризуют способность выполнять необходимые функции в заданных режимах и условиях применения, технического обслуживания, ремонта, хранения и транспортирования. Надежность – комплексное свойство, включающее безотказность, ремонтопригодность, сохранность и долговечность, а также безопасность, отказоустойчивость и живучесть.

Безотказность свойство непрерывно сохранять дееспособное состояние в течение некоторого времени или определенной наработки.

Ремонтопригодностьсвойство восстанавливать дееспособность в процессе технического обслуживания и ремонта.

Сохранностьсвойство непрерывно сохранять исправное и дееспособное состояние во время сохранения, после сохранения или транспортирования.

Долговечностьсвойство сохранять дееспособное состояние до момента наступления пограничного состояния при установленной системе технического обслуживания и ремонта (пограничное состояние – состояние объекта, при котором его дальнейшая эксплуатация или технически невозможна, или экономически невыгодна).

Эти составляющие надежности общепризнаны и используются для анализа широкого класса систем и устройств.

Способность устройства или системы сохранять дееспособность при нарушении режимов и условий эксплуатации, а также в случаях отказа отдельных элементов системы характеризуется такими свойствами, как отказоустойчивость и живучесть.

Отказоустойчивость свойство устройства или системы сохранять полную или частичную дееспособность в случаях отказов отдельных элементов, не связанных с внешними нерегламентированными действиями.

Живучестьсвойство устройства или системы сохранять полную или частичную дееспособность в случаях отказов отдельных элементов, связанных с внешними нерегламентированными действиями.

Безопасностьспособность системы функционировать, не переходя в опасное состояние. Для информационных систем это свойство не является существенным в сравнении, например, с системами атомной энергетики.

Эффективность и уровень надежности ИС зависит от таких основных факторов:

Обеспечение необходимого уровня надежности требует проведения специального комплекса работ, выполняемых на разных стадиях создания и эксплуатации систем управления.

При решении вопросов, связанных с обеспечением требуемого уровня надежности СУ, учитываются следующие особенности:

- каждая система управления – многофункциональная система, функции которой имеют существенно различную значимость и соответственно характеризуются разным уровнем требований к надежности их выполнения;

- возможно возникновение некоторых исключительных (аварийных, критических) ситуаций, представляющих сочетание отказов или ошибок функционирования системы и способных привести к значительным нарушениям функционирования объекта управления (авариям);

- в функционировании систем управления участвуют различные виды ее обеспечения и персонал, ИТ которых могут в той или иной степени влиять на уровень надежности системы управления;

- в состав каждой СУ входит большое количество разнородных элементов: технических, программных, эргатических и других, при этом в выполнении одной функции информационной технологии управления обычно участвуют несколько различных элементов, а один и тот же элемент может участвовать в выполнении нескольких функций системы.

При решении вопросов надежности систем управления количественное описание, анализ, оценку и обеспечение надежности проводят по каждой функции СУ в отдельности. В необходимых случаях используют также анализ возможности возникновения в системе аварийных ситуаций, ведущих к значительным техническим, экономическим или социальным потерям вследствие аварии объекта управления (или управляющего комплекса в целом), что требует разработки информационных технологий, блокирующих развитие чрезвычайных ситуаций.

Функции систем управления делят на простые и составные. Для некоторых систем управления возможно построение составной функции наиболее общего вида, отображающей функционирование СУ в целом. Перечень функций и видов их отказов, по которым задаются требования к надежности конкретной системы управления, а также критерии этих отказов устанавливает заказчик по согласованию с разработчиком и вносит в техническое задание. Для установления критериев отказов составляют перечень признаков или параметров, по которым может быть обнаружен факт возникновения каждого отказа, а при необходимости – количественных (критериальных) значений этих параметров.

Если для некоторой СУ определено несколько видов отказов, существенно различающихся по причинам возникновения или по вызываемым ими последствиям, то безотказность и ремонтопригодность по этой функции задают отдельно по каждому виду отказов. При этом критерии отказов устанавливают по каждому виду отказов.

Перечень рассматриваемых аварийных ситуаций, по которым задают требования к надежности, составляет заказчик по согласованию с разработчиком и вносит в техническое задание с указанием, при каких условиях эксплуатации рассматривают возникновение каждой из приведенных аварийных ситуаций.

Уровень надежности СУ зависит от надежности и других свойств ее технического обеспечения (комплекса технических средств), программного обеспечения и персонала, участвующего в функционировании СУ, а также от:

- состава и уровня надежности используемых технических средств, их взаимосвязи в надежностной структуре комплекса технических средств СУ (КТС СУ);

- состава и уровня надежности используемых программных средств, их содержания (возможностей) и взаимосвязи в структуре программного обеспечения СУ (ПО СУ);

- уровня квалификации персонала, организации работы и уровня надежности действий персонала СУ; рациональности распределения задач, решаемых системой, между КТС СУ, ПО СУ и персоналом СУ;

- режимов, параметров и организационных форм технической эксплуатации КТС СУ;

- степени использования различных видов резервирования (структурного, информационного, временного, алгоритмического, функционального);

- степени использования методов и средств технической диагностики; реальных условий функционирования СУ.

Совокупность технических, программных и эргатических элементов СУ (технических и программных средств и части персонала СУ), выделяемая из всего состава СУ по признаку участия в выполнении некоторой (i-й) функции системы, образует i-ю функциональную подсистему СУ (ФП СУ).

Анализ надежности СУ в реализации ее функций проводят по каждой ФП СУ в отдельности с учетом уровня надежности и других свойств входящих в нее технических, программных и эргатических элементов.

Выбор состава показателей надежности СУ производят на основе установленных техническим заданием перечня функций системы, перечня видов их отказов и перечня аварийных ситуаций, по которым регламентируют требования к надежности.

Требуемые численные значения выбранных показателей надежности СУ (требования к надежности) устанавливаются по определенным критериям на основе анализа влияния отказов СУ в выполнении ее функций и аварийных ситуаций на эффективность функционирования управляющего комплекса (СУ и объект управления) в целом, а также затрат, связанных с обеспечением надежности.

Оценку надежности СУ проводят на различных стадиях создания и эксплуатации СУ.

При разработке СУ проводят проектную (априорную) оценку надежности системы. При опытной и промышленной эксплуатации СУ проводят экспериментальную (апостериорную) оценку надежности системы.

Оценку надежности СУ производят с учетом надежности КТС СУ и, при необходимости, с учетом надежности ПО СУ и действий персонала СУ. Необходимость учета надежности ПО СУ и действий персонала СУ при оценке надежности СУ на разных стадиях создания и эксплуатации устанавливают техническим заданием на СУ.

13.3. Показатели надежности СУ

В качестве показателей надежности СУ используют показатели, характеризующие надежность реализации функций системы и опасность возникновения в системе аварийных ситуаций.

Описание надежности СУ по функциям (по ФП СУ) осуществляют:

- по отдельным составляющим надежности с помощью единичных показателей;

- по нескольким составляющим надежности с помощью комплексных показателей надежности.

Для описания надежности СУ по непрерывно выполняемым функциям (Н-функции) и по дискретно выполняемым функциям (Д-функции) используют различные показатели.

Описание безотказности и ремонтопригодности СУ по Н-функциям осуществляют с помощью единичных или комплексных показателей надежности.

Основными единичными показателями безотказности являются:

- средняя наработка системы на отказ в выполнении i-й функции (средняя наработка на отказ i-й ФП СУ) - ;

- вероятность безотказного выполнения системой i-й функции (вероятность безотказной работы i-й ФП СУ) – в течение заданного времени .

Допускается использовать следующие показатели:

- среднюю наработку системы до отказа в выполнении i-й функции (средняя наработка до отказа i-й ФП СУ_ - ;

- параметр потока отказов системы в выполнении i-й функции (параметр потока отказов i-й ФП СУ) – Ωi ;

- интенсивность отказов системы в выполнении i-й функции (интенсивность отказов i-й ФП СУ) - λi.

Основными единичными показателями ремонтопригодности являются:

- среднее время восстановления способности системы к выполнению i-й функции после отказа (среднее время восстановления i-й ФП СУ) - ;

- вероятность восстановления в течение заданного времени способности системы к выполнению i-й функции после отказа (вероятность восстановления i-й ФП СУ за время τ) - .

Используют такие комплексные показатели безотказности и ремонтопригодности, как:

- коэффициент готовности системы к выполнению i-й функции (коэффициент готовности i-й ФП СУ) - ;

- коэффициент технического использования системы по i-й функции (коэффициент технического использования i-й ФП СУ) - ;

- коэффициент сохранения эффективности системы по i-й функции (коэффициент сохранения эффективности i-й ФП СУ) - .

Описание безотказности и ремонтопригодности СУ по Д-функции осуществляют с помощью комплексных показателей надежности.

Основной комплексный показатель безотказности и ремонтопригодности системы в отношении выполнения ею iД-функции – вероятность успешного выполнения системой заданной процедуры i-й функциональной подсистемой СУ) – Li.

Дополнительным комплексным показателем безотказности и ремонтопригодности системы в отношении выполнения ею iД-функции является вероятность успешного выполнения и последовательно поступающих запросов Li(n) .

Описание надежности СУ по аварийным ситуациям осуществляют с помощью комплексных показателей надежности, которые характеризуют:

- опасность возникновения аварийной ситуации в течение некоторого заданного интервала времени нормального функционирования системы;

- опасность возникновения аварийной ситуации в результате воздействия на систему внешнего экстремального фактора.

Для описания надежности СУ по аварийным ситуациям могут быть использованы следующие показатели:

- средняя наработка системы до возникновения в ней j-й аварийной ситуации при нормальных условиях функционирования СУ - ;

- вероятность возникновения в системе j-й аварийной ситуации в течение заданного времени τ при нормальных условиях функционирования ИТУ – Qj(τ);

- вероятность возникновения в системе j-й аварийной ситуации в результате воздействия s-го экстремального воздействующего фактора фs - Qjs}.

Допускается также использование следующих показателей:

- вероятность отсутствия (невозникновения) в системе j-й аварийной ситуации в течение заданного времени τ при нормальных условиях функционирования СУ – Pj(τ);

- вероятность отсутствия (невозникновения) в системе j-й аварийной ситуации в результате воздействия s-го экстремального воздействующего фактора фsPj{фs}.

Описание долговечности СУ осуществляют по СУ в целом или, при необходимости, по отдельным ее подсистемам с помощью единичных показателей надежности.

Основными показателями долговечности являются:

- средний ресурс i-й подсистемы СУ (СУ в целом) - ;

- средний срок службы i-й подсистемы СУ (СУ в целом) - .

Допускается также использовать следующие показатели:

- γ-процентный ресурс i-й подсистемы СУ (СУ в целом) - ;

- γ-процентный срок службы i-й подсистемы СУ (СУ в целом) - .

В обоснованных случаях кроме показателей надежности СУ допускается использовать показатели, установленные ГОСТ 27.002-83, ГОСТ 13216-74, ГОСТ 21623-76.