Определение
Пример MDP с 3 состояниями и 2 действиями
Чтобы определить марковский процесс принятия решений нужно задать 4-кортеж, где
конечное число состояний,
конечное число действий (часто представляется в виде,конечное число действий доступных из состояния),
вероятность, что действиев состоянииво времяперейдет в состояниеко времени,
вознаграждение получаемое после перехода в состояниеиз состонияс вероятностью перехода.
См. также
Теория игр
Q-обучение
Линейная частичная информация
Материал из Википедии — свободной энциклопедии
Перейти к: навигация,поиск
Содержание
|
Общее описание
Теория линейной частичной информации(англ. Linear Partial Information — LPI), применяемая для принятия решений на основаниинечёткой логики(англ. fuzzy logic) при неполной или неаккуратной доступной информации. ШвейцарскийматематикЭдуард Кофлеризобрёл эту теорию в 1970 году.
Определение
Любая стохастическая частичная информация SPI(p)которую можно считать решением системы линейныхнеравенств, называется линейной частичной информациейLPI(p)описывающейапостериорную вероятностьp. Эту информацию считаем нечёткостью линейной частичной информации об апостериорной вероятностиp, соответствующей представлению линейной нечёткой логики.
Избранная библиография
Эдуард Вафлер– Entscheidungen bei teilweise bekannter Verteilung der Zustände, Zeitschrift für OR, Vol. 18/3, 1974
Эдуард Вафлер- Extensive Spiele bei unvollständiger Information, in Information in der Wirtschaft, Gesellschaft für Wirtschafts- und Sozialwissenschaften, Band 126, Берлин 1982
Эдуард Кофлер- Equilibrium Points, Stability and Regulation in Fuzzy Optimization Systems under Linear Partial Stochastic Information (LPI), Proceedings of the International Congress of Cybernetics [1] and Systems, AFCET, Париж 1984, pp. 233-240
Эдуард Кофлер- Decision Making [2]under Linear Partial Information[3]. Proceedings of the European Congress EUFIT,Ахен, 1994, p. 891-896.
Эдуард Кофлер- Linear Partial Information with Applications. Proceedings of ISFL 1997 (International Symposium on Fuzzy Logic), Цюрих, 1997, p.235-239.
- Теория игр
- История
- Представление игр
- Экстенсивная форма
- Нормальная форма
- Характеристическая функция
- Применение теории игр
- Описание и моделирование
- Нормативный анализ (выявление наилучшего поведения)
- Типы игр Кооперативные и некооперативные
- Симметричные и несимметричные
- С нулевой суммой и с ненулевой суммой
- Параллельные и последовательные
- С полной или неполной информацией
- Игры с бесконечным числом шагов
- Дискретные и непрерывные игры
- Метаигры
- См. Также
- Примечания
- Литература
- Стохастическая игра
- История
- Применение
- Некооперативная игра
- Некооперативная игра в нормальной форме
- Некооперативная игра в развернутой форме
- Принципы оптимальности
- Кооперативная игра (математика)
- Математическое представление
- Свойства характеристической функции
- Примеры игр
- Решение кооперативных игр
- Литература
- Свойства
- См. Также
- Источники
- Формальное определение
- История возникновения
- Дальнейшие свойства
- Вектор Шепли
- Формальное определение
- Аксиоматика вектора Шепли
- Литература
- Антагонистическая игра
- Дифференциальные игры
- Литература
- Литература
- Сетевые игры
- Литература
- Кооперативные стохастические игры
- Литература
- Марковский процесс принятия решений
- Определение
- Дилемма заключённого
- Классическая дилемма заключённого
- Обобщённая форма
- Похожая, но другая игра
- Примеры из реальной жизни
- Повторяющаяся дилемма заключённого
- Психология обучения и теория игр
- Восточная философия
- Генетика
- Игрок (теория игр)
- Литература
- Типы стратегий
- Литература
- Терминология
- Формальные определения
- Доминирование и равновесия Нэша
- Последовательное исключение доминируемых стратегий
- Литература