Методы прогнозного моделирования. Влияние различных параметров договоров и характеристик клиентов на факт расторжения договоров страхования. Построение моделей разрыва контракта по желанию клиента и из-за неуплаты с помощью логистической регрессии.
Аннотация к работе
Процедура призвана осуществить пенсионное обеспечение и выплаты денежных средств при реализации таких рисков как утрата трудоспособности или потеря кормильца семьи. Факторами, влияющими на данную ситуацию, могут быть, с одной стороны, снижение доверия граждан к государственной пенсионной системе, а, с другой - стремление в случае непредвиденных обстоятельств или после выхода на пенсию обеспечить себе и близким людям достойный уровень жизни. Но, тем не менее, по мере того, как данный вид страхования приобретает все большую популярность, в России, становятся актуальными исследования, связанные с предсказанием поведения людей, страхующих свою жизнь. С ее помощью может быть получена информация о потенциальном поведении потребителя, помогающая грамотно организовать работу, связанную с поддержкой договоров страхования жизни. Актуальность работы обусловлена тем, что выявление среди клиентов страховых компании группы риска, состоящей из людей, более других склонных к расторжению договора страхования жизни, позволяет вести целенаправленную работу по их удержанию.В сущности, страхование является особым видом экономической деятельности, связанной с перераспределением риска нанесения ущерба материальным интересам. Федеральный закон «Об организации страхового дела в Российской Федерации» выделяет следующие основные субъекты страхования: страхователи и страховщики [4]. Страхователями являются заключившие со страховщиками договоры страхования юридические лица и дееспособные физические лица. Страховщиками являются страховые организации, которые занимаются следующими активностями: - оценка страховых рисков; Данная процедура предполагает обязательство страховщика заплатить обозначенную сумму денег в случае смерти страхователя или его дожития до определенного возраста в обмен на уплату страховых премий [5].Прекращение выплаты установленной премии и расторжение договора могут быть обусловлены как личными причинами клиента, так и экономической ситуацией в стране. Во-первых, клиент, расторгнувший договор, получает выкупную сумму, закрепленную в договоре, и некоторый инвестиционный доход. Однако это, в любом случае, будет меньше той суммы, которая была уплачена страхователем. Следует отметить, что разрыв договора страхования может происходить по ряду причин, среди которых можно выделить следующие: - расторжение договора по собственному желанию; Также договор, расторгнутый изза смерти или дожития клиента, воспринимается как один из ожидаемых и стандартных сценариев развития отношений со страхователем и не создает проблем для работы компании.Проблемой, которая решается в данной работе, является недополучение прибыли от выплат страховых премий по договорам, вызванное их досрочным расторжением. С клиентами, классифицированными как наиболее склонными к расторжению договора страхования жизни, сотрудники компании смогут вести дополнительную работу, направленную на удержание. Подобные активности могут привести к увеличению лояльности клиентов, уменьшению числа расторгнутых договоров и, как результат, повышению прибыльности бизнеса страховой компании. В рамках данной модели прогнозируется не только факт расторжения, но и его причина, то есть расторжение договора по собственному желанию или изза неуплаты страховых взносов. Клиент, отказывающийся от договора по собственному желанию, и клиент, перестающий платить премию, очевидно, имеют различные мотивы подобного поведения и, следовательно, требуют разного подхода удержания.Суть класса методов заключается в вычислении функций правдоподобия каждого из классов для объекта выборки, по ним рассчитывается экспериментальные вероятности классов. Метод чаще применяют в качестве простейшего эталон для сравнения с другими моделями [15]. Метод k ближайших соседей (k-nearest neighbor algorithm) представляет собой примитивный метрический классификатором для определения класса объектов. Среди преимуществ данного метода можно выделить устойчивость к влиянию выбросов в выборке, что обусловлено малой вероятностью для такого наблюдения оказаться среди k-ближайших соседей, несложная программная реализация и широкий простор для модификации алгоритма с помощью подбора наиболее подходящих метрик для рассматриваемой задачи. В свою очередь, главным недостатком является потребность использовать все наблюдения для классификации одного лишь объекта, что значительно усложняет практическое применение алгоритма [14].Методы описательной статистики позволяют выявить влияние различных параметров договоров и характеристик клиентов на факт расторжения договоров страхования. В описательной статистике можно выделить три основных метода агрегирования данных: - табличное представление; В работе для описания статистических характеристик исследуемой базы используются таблицы сопряженности. Также, для поиска связи между категориальными переменными используется критерий согласия Пирсона (критерий согласия ).Отличительной особенностью бинарной логистической регрессии является характер предсказываемой переменной - она принимает только
План
Оглавление
Введение
Глава 1. Теоретические предпосылки исследования
1.1 Страхование жизни: характеристика и особенности
1.2 Причины расторжения договоров
1.3 Постановка проблемы
1.4 Методы бинарной классификации
Глава 2. Статистические методы моделирования страхования жизни
2.1 Методы описательной статистики
2.2 Бинарная логистическая регрессия
2.3 Регрессия Кокса
2.4 Random Forest
2.5 Моделирование на основе нейронных сетей
2.6 Анализ качества бинарных классификаторов
2.7 Проблема несбалансированных выборок
Глава 3. Моделирование расторжения договоров страхования жизни на основе статистических методов
3.1 Подготовка информационной базы исследования
3.2 Структура страхового портфеля
3.3 Модели расторжения договоров страхования жизни
3.3.1 Бинарная логистическая регрессионная модель
3.3.2 Регрессия Кокса
3.3.3 Модель на основе метода Random Forest
3.3.4 Нейросетевая модель
3.5 Сравнительный анализ моделей расторжения договоров
Заключение
Список литературы
Приложение
Введение
Страхование жизни является неотъемлемой частью в системе страховой защиты интересов человека. Процедура призвана осуществить пенсионное обеспечение и выплаты денежных средств при реализации таких рисков как утрата трудоспособности или потеря кормильца семьи. Страхование жизни на российском рынке страховых услуг является одним из самых быстрорастущих сегментов [1]. Факторами, влияющими на данную ситуацию, могут быть, с одной стороны, снижение доверия граждан к государственной пенсионной системе, а, с другой - стремление в случае непредвиденных обстоятельств или после выхода на пенсию обеспечить себе и близким людям достойный уровень жизни. Но, тем не менее, по мере того, как данный вид страхования приобретает все большую популярность, в России, становятся актуальными исследования, связанные с предсказанием поведения людей, страхующих свою жизнь.
Понимание и предсказание поведения своего клиента является актуальной проблемой для страхового дела, как и для любого другого бизнеса. Следует отметить, что, не будучи использованной для прогнозирования будущих действий потребителя, любая клиентская база данных не может считаться до конца раскрывшей свой потенциал. Находить закономерности и зависимости в больших массивах исторических данных и делать предсказания насчет поведения клиентов позволяют методы прогностической аналитики. С ее помощью может быть получена информация о потенциальном поведении потребителя, помогающая грамотно организовать работу, связанную с поддержкой договоров страхования жизни.
Актуальность работы обусловлена тем, что выявление среди клиентов страховых компании группы риска, состоящей из людей, более других склонных к расторжению договора страхования жизни, позволяет вести целенаправленную работу по их удержанию. В конечном итоге, данные активности должны привести к уменьшению оттока клиентов и, как следствие, положительно сказаться на финансовых показателях страховой компании.
Объектом исследования является портфель договоров страхования жизни страховой компании.
Предмет исследования - факт расторжения договоров клиентами компании.
Целью данной работы является прогнозирование преждевременного расторжения договоров страхования жизни с учетом параметров договоров и социально-демографических характеристик клиентов.
Для достижения цели необходимо решить следующие задачи: - подготовить информационную базу к исследованию;
- выявить влияние параметров договоров и социально-демографических характеристик клиентов на факт расторжения договоров страхования;
- разработать модели прогнозирования факта расторжения договоров страхования, учитывающие причины, лежащие в основе события;
- определить оптимальные пороги отсечения для разработанных моделей бинарных классификаторов;
- сравнить полученные модели и выбрать наиболее адекватно предсказывающую факт и причину расторжения.
Структура и объем работы. Данная работа имеет следующую структуру: введение, три главы, заключение, список литературы, состоящий из 49 наименований, и 9 приложений.
В первой главе «Теоретические предпосылки исследования» содержится краткое описание предметной области страхового дела в целом и страхования жизни в частности. Также дана краткая характеристика существующих предиктивных моделей и сформулирована проблема, решаемая в данной работе.
Во второй главе «Статистические методы моделирования страхования жизни» дано теоретическое описание используемых математических моделей предиктивной аналитики и описательной статистики.
В третьей главе «Моделирование расторжения договоров страхования жизни на основе статистических методов» проиллюстрированы результаты применения предиктивных моделей на практике, проанализировано качество каждой из них и сделан вывод о наиболее подходящей предиктивной модели.