Характеристика, общая постановка задачи динамического программирования и их реализация. Стохастические задачи динамического программирования. Принцип оптимальности и уравнения Беллмана. Дискретно динамическая модель оптимального распределения ресурсов.
При низкой оригинальности работы "Динамическое программирование: Дискретно динамическая модель оптимального распределения ресурсов", Вы можете повысить уникальность этой работы до 80-100%
Динамическое программирование - метод оптимизации, приспособленный к операциям в которых процесс принятия решений может быть разбит на этапы (шаги). Если модели линейного программирования можно использовать в экономике для принятия крупномасштабных плановых решений в сложных ситуациях, то модели ДП применяются при решении задач значительно меньшего масштаба, например, при разработке правил управления запасами, устанавливающими момент пополнения запасов и размер пополняющего заказа; при разработке принципов календарного планирования производства и выравнивания занятости в условиях колеблющегося спроса на продукцию.Отыскание оптимальной стратегии принятия набора последовательных решений, в большинстве случаях, производится следующим образом: сначала осуществляется выбор последнего во времени решения, затем при движении в направлении, обратном течению времени, выбираются все остальные решения вплоть до исходного. Обычно условия, в которых принимается решение, называют "состоянием" системы. Нет необходимости выяснять, как возникло то ил иное состояние или каковы были предшествующие решения. Независимо от того, отыскивают оптимальные решения с помощью табличного метода и последующего поиска или аналитическим путем, обычно быстрее и выгоднее производить выбор по одному решению в один момент времени, переходя затем к следующему моменту и т.д. Тогда уже не нужно рассматривать последовательно 1,2,3…решения, чтобы достичь решения с большим номером.Каково бы ни было состояние системы S в результате какого-либо числа шагов, на ближайшем шаге нужно выбирать управление так, чтобы оно в совокупности с оптимальным управлением на всех последующих шагах приводило к оптимальному выигрышу на всех оставшихся шагах, включая данный. Принцип оптимальности утверждает, что для любого процесса без обратной связи оптимальное управление таково, что оно является оптимальным для любого подпроцесса по отношению к исходному состоянию этого подпроцесса. Поэтому решение на каждом шаге оказывается наилучшим с точки зрения управления в целом. Обозначим через условный максимум целевой функции, полученной при оптимальном управлении на n-k-1 шагах, начиная с k-го до конца, при условии, что к началу k-го шага система находилась в состоянии .Фактически эта функция равна Управление Xk на k-м шаге, при котором достигается максимум в (*), обозначается через и называется условным оптимальным управлением на k-м шаге(в правую часть уравнения (*) следует вместо Sk подставить выражение найденное из уравнений состояния).В практике планирования довольно часто встречаются задачи, в которых на состояние системы и на значение критерия заметное влияние оказывают случайные факторы. В таких задачах управляемый процесс не полностью определяется начальным состоянием системы и выбранным управлением, а в какой-то мере зависит от случая. Для нахождения оптимального решения многоэтапных экстремальных стохастических задач с аддитивным критерием можно использовать метод динамического программирования. В результате преобразования известный вектор состояния переходит в случайный вектор состояния с функцией распределения , которая зависит от известного состояния , случайного состояния и управления . Поэтому, прежде чем принять решение на (i-1)-м этапе, необходимо положить, что действительное значение вектора состояния наблюдалось и известно.Составить оптимальный план ежегодного распределения средств между двумя предприятиями в течении 3-летнего планового периода при следующих условиях: 1.Начальная сумма равна 400 (S0); Вложенные средства в размере X приносят для предприятия 1 доход f1(x) и возвращаются в размере 60% от X; На предприятии 2 доход f2(x) и возвращаются в размере 20% от X; 4.Ежегодно распределить все начальные средства, получаемые из возвращенных средств; Построение модели ДП и применение метода ДП для решения сводиться к следующим моментам: 1.
План
Оглавление
Введение
1.Общая постановка задачи динамического программирования
2.Принцип оптимальности и уравнения Беллмана
3.Стохастические задачи динамического программирования
4. Дискретно динамическая модель оптимального распределения ресурсов
Список использованной литературы
Введение
Динамическое программирование - метод оптимизации, приспособленный к операциям в которых процесс принятия решений может быть разбит на этапы (шаги). Такие операции называются многошаговыми.
Если модели линейного программирования можно использовать в экономике для принятия крупномасштабных плановых решений в сложных ситуациях, то модели ДП применяются при решении задач значительно меньшего масштаба, например, при разработке правил управления запасами, устанавливающими момент пополнения запасов и размер пополняющего заказа; при разработке принципов календарного планирования производства и выравнивания занятости в условиях колеблющегося спроса на продукцию.
В реально функционирующих больших экономических системах еженедельно требуется принимать микроэкономические решения. Модели ДП ценны тем, что позволяют на основе стандартного подхода с использованием при минимальном вмешательстве человека принимать такие решения. И если каждое взятое в отдельности решение малосущественно, то в совокупности эти решения могут оказать большое влияние на прибыль.