Выбор публичных показателей для построения, обучения и тестирования модели нейронной сети, которая будет использована в основе информационной системы прогнозирования банкротства банков. Обзор моделей прогнозирования банкротства кредитных организаций.
Аннотация к работе
Однако, на данный момент, практически каждую неделю какая-нибудь кредитная организация теряет возможность продолжать свою деятельность изза банкротства. "Кредитная организация считается неспособной удовлетворить требования кредиторов по денежным обязательствам, о выплате выходных пособий и (или) об оплате труда лиц, работающих или работавших по трудовому договору, и (или) исполнить обязанность по уплате обязательных платежей, если соответствующие обязанности не исполнены ею в течение четырнадцати дней после наступления даты их исполнения и (или) стоимость имущества (активов) кредитной организации недостаточна для исполнения ее обязательств перед кредиторами и (или) обязанности по уплате обязательных платежей." - Статья 189.8 в редакции от 29.06.2015 №186-ФЗ [1]. Однако, помимо организаций, лишенных лицензии вследствие собственно банкротства, в данной работе также рассматриваются ликвидированные банки и банки, в данный момент функционирующие, но подверженные риску. Прямо сейчас потенциальной инновацией в оценке вероятности банкротства может оказаться машинное обучение, которое может, оперируя большим количеством изменяющихся данных, предсказать будущее поведение банка и его риск ликвидации или потери лицензии. Данная работа рассматривает различные модели оценки вероятности банкротства на примере как обанкротившихся, так и все еще функционирующих российских кредитных организаций, и применяет их с использованием технологий машинного обучения для нахождения новых факторов, влияющих на отзыв лицензии и предупреждения новых случаев банкротства.[2] Он применил t-критерий Стьюдента для сравнения фирм как держателей активов, а наборы данных при сравнении являлись собственно наборами активов.Эдвард Альтман применил ранее уже существовавший множественный дискриминационный анализ, ранее использовавшийся в биологии и бихевеоризме. "МДА - это метод, используемый для классификации наблюдений по двум или нескольким априорным группам в зависимости от индивидуальных характеристик наблюдения, удобный в том случае, когда необходимо качественное, а не количественное объяснение" [3]. Альтман в качестве этого ряда выбрал финансовые показатели: оборотный капитал, нераспределенная прибыль, EBIT, продажи - деленые на активы - и собственный капитал, деленый на обязательства. Тем не менее, в процессе создания, применения и тестирования моделей прогнозирования финансовой устойчивости предприятий и кредитных организаций по всему миру, построенных с использованием МДА, были обнаружены недостатки этого метода, к сожалению, не позволяющие использовать его с полной точностью и эффективностью.Данная работа интересна тем, что авторы в первую очередь разделили российские банки на кластеры и для каждого из них строили свою модель оценки финансовой устойчивости. Разбиение позволило проверить структурную неоднородность рассматриваемых кредитных организаций и отличить воздействие одних и тех же факторов на результат - вероятность банкротства различных кластеров. В качестве критериев разбиения были выбраны следующие показатели: · валюта баланса, характеризующая размер банка; · отношение общей суммы кредитов нефинансовым организациям к валюте баланса, что отражает вовлеченность банка в кредитование реального сектора; Выделение кластеров в исходной выборке позволило более детально и более глубоко изучить взаимосвязи в кластерах, характерные для отдельных видов кредитных организаций, однако также показало, что существуют и параметры, присущие различным кластерам и даже всем кластерам одновременно.DEA - анализ среды функционирования или оболочечный анализ данных - это статистическая модель, основанная на методах линейного программирования и позволяющая сравнивать объекты по уровню их технической эффективности. Анализ среды функционирования применяется для сравнения сложных социальных, финансовых и технических систем. Для того, чтобы не сравнивать каждую систему в группе попарно, строится граница эффективности путем оптимизации выпуска на основе входящих и исходящих показателей. В исследованиях, направленных на прогнозирование банкротства, используется понятие обратной эффективности или неустойчивости, и строится граница банкротства. Дело в том, что при сборе сведений для модели зачастую требуется доступ к весьма детальной внутренней информации относительно финансовой деятельности кредитных организаций и бизнес-процессах на производстве.Идея в основании этого метода заключается в выделении двух групп среди исследуемых сущностей, количественном описании многочисленных сочетаний переменных, определяющих эти сущности и выделении тех, которые наиболее часто и эксклюзивно встречаются в каждой группе [7]. Если какая-то переменная встречается только в одной группе, она считается характерной чертой этой группы, если встречается в обеих, но в одной чаще, а в другой - реже, то она считается характерной чертой той группы, в которой встречается чаще, а если же переменная равномерно соответствует обеим группам, то она считается преобладающей хара
План
Оглавление
Введение
Глава 1. Исследование предметной области
1.1 Обзор моделей прогнозирования банкротства
1.1.1 Z-модель Альтмана
1.1.2 Logit-модель
1.1.3 Data Envelopment Analysis
1.1.4 Метод распознавания признаков
1.2 Типы нейронных сетей и способы уменьшения ошибки
1.2.1 Персептроны
1.2.2 Ассоциативная память
1.2.3 Сверточные нейронные сети
1.3 Выбор факторов, влияющих на банкротство российских банков
1.3.1 Показатели, указанные в банковской отчетности
1.3.2 Макроэкономические показатели
1.3.3 Формирование и оптимизация вводных показателей
Глава 2. Проектирование информационной системы
2.1 Разработка бизнес-модели приложения
2.1.1 Требования к системе
2.1.2 Диаграммы прецедентов
2.1.3Диаграммы деятельности
2.1.4 Модель базы данных
2.2 Разработка пользовательского интерфейса
Глава 3. Проектирование нейронной сети
3.1 Первая модель со смешанными параметрами
3.2 Проектирование и обучение модели
3.3 Оценка значимости показателей
3.4 Эксперимент с исключением показателей
3.5 Эксперимент с расширением выборки
3.6 Вторая модель с макроэкономическими показателями
3.7 Влияние изменения показателей на прогнозируемый результат
3.8 Эксперимент с исключением показателей
3.9 Третья модель с показателями ликвидности
3.10 Проектирование и обучение модели
3.11 Оценка значимости показателей
3.12 Объединение результатов действия моделей
3.13 Обоснование использования результатов моделей
3.14 Применение результатов прогнозирования моделей
Заключение
Библиографический список
Приложение А. Макроэкономические параметры
Приложение Б. Пример собранной отчетности
Приложение В. Техническое задание
Приложение Г. Формула второй модели
Приложение Д. Формула третьей модели
Приложение Е. Листинг программы
Введение
Очень важное место в российской экономике занимает банковский сектор, общая деятельность которого строго регулируется, а частные нарушения отдельных кредитных организаций подлежат наказанию и отзыву их лицензий. Однако, на данный момент, практически каждую неделю какая-нибудь кредитная организация теряет возможность продолжать свою деятельность изза банкротства. Во многих случаях это происходит изза недостаточного капитала, рискованных вложений или необдуманных решений, но, иногда, проблемы, с которыми сталкиваются банки, менее очевидны.
"Кредитная организация считается неспособной удовлетворить требования кредиторов по денежным обязательствам, о выплате выходных пособий и (или) об оплате труда лиц, работающих или работавших по трудовому договору, и (или) исполнить обязанность по уплате обязательных платежей, если соответствующие обязанности не исполнены ею в течение четырнадцати дней после наступления даты их исполнения и (или) стоимость имущества (активов) кредитной организации недостаточна для исполнения ее обязательств перед кредиторами и (или) обязанности по уплате обязательных платежей." - Статья 189.8 в редакции от 29.06.2015 №186-ФЗ [1].
Однако, помимо организаций, лишенных лицензии вследствие собственно банкротства, в данной работе также рассматриваются ликвидированные банки и банки, в данный момент функционирующие, но подверженные риску.
За последние полвека, по запросу различных кредитных организаций или в рамках собственного исследования, было разработано множество систем, которые могут указать на конкретные недостатки того или иного банка, однако это не спасает современные кредитные организации. Прямо сейчас потенциальной инновацией в оценке вероятности банкротства может оказаться машинное обучение, которое может, оперируя большим количеством изменяющихся данных, предсказать будущее поведение банка и его риск ликвидации или потери лицензии.
Только за последний год эта участь постигла более сотни кредитных организаций по всей России, девять из которых были в списке ста крупнейших российских банков. Эти девять банков были многообещающими, и их состояние казалось полностью здоровым, но подобные случаи не должны оставаться неожиданными - наверняка существовали какие-то показатели, которые можно было учесть и по ним предсказать риск банкротства.
Вопрос оценки вероятности банкротства широко освещен в литературе, наиболее ранние модели освещены еще в конце шестидесятых годов прошлого века У. Бивером и Э. Альтманом. Крайне широко эта тема раскрыта в работах зарубежных авторов: А. Клэра и Р. Пристли, Ж. Колари, М. Капуто и Д. Вагнера, П. Майера и Х. Пайфера.
Также, исследованием причин нарушения финансовой устойчивости кредитных организаций занимались и в России, и в работе Ланина и Веннета можно обнаружить различные причины банкротства. Помимо этих исследователей среди российских авторов, банкротство изучали Головань С.А., Карминский А.М., Копылов А.В., Пересецкий А.А., Евдокимов А.М. и прочие.
Данная работа рассматривает различные модели оценки вероятности банкротства на примере как обанкротившихся, так и все еще функционирующих российских кредитных организаций, и применяет их с использованием технологий машинного обучения для нахождения новых факторов, влияющих на отзыв лицензии и предупреждения новых случаев банкротства.
Целью данной работы является проектирование нейросети, способной оценивать вероятность банкротства кредитной организации на основе публичных сведений, а также разработка WEB-приложения, через которое будет реализован функционал конечной информационной системы. Для достижения этих целей необходимо решить несколько задач: · изучить ранее использованные модели прогнозирования банкротства банков, собрать данные о текущем состоянии банковского сектора России в целом и банков в частности и выбрать ряд параметров, с использованием которых будет производиться машинное обучение;
· исследовать возможности машинного обучения, применимые в данной области, подготовить данные для обучения и тестирования модели, обучить модель, протестировать ее, оценить качество и найти оптимальный горизонт прогнозирования;
· провести эксперименты по выявлению значимости показателей и влиянию отдельных показателей на результат, разработать модель информационной системы;
· выбрать необходимые для реализации функционала инструменты;
· разработать базу данных для хранения сведений и результатов работы нейронной сети;
· разработать сборщик данных для получения новых сведений;
· разработать и применить пользовательский интерфейс в форме WEB-приложения;
· включить в приложение возможности сборщика данных, их хранения и обработки.
В первой главе данной работы выполняются задачи анализа предметной области прогнозирования банкротства кредитных организаций, поиска и обзора существующих математических моделей прогнозирования и проведенных ранее исследований. Помимо этого, совершается выбор публичных показателей, которые впоследствии можно использовать для построения, обучения и тестирования модели нейронной сети, которая будет использована в основе информационной системы прогнозирования банкротства банков.
Рассматриваются как внутренние показатели - нормативы ликвидности - так и внешние, относящиеся к экономике страны в целом и банковскому сектору в частности. После сбора информации проводится предварительная подготовка данных для выявления неполных и ненадежных сведений.
Во второй главе данной работы описан процесс проектирования информационной системы в форме WEB-приложения, синтаксического анализатора для сбора данных, базы данных и прогнозирующей системы. Также рассмотрены требования, выдвигаемые к системе, и описаны действия системы в различных ситуациях в форме диаграмм прецедентов (USECASE) и деятельности (activity). Для администратора выдвинуты рекомендации по использованию системы.
Помимо этого, описан пользовательский интерфейс системы и различные страницы, которые пользователь может посетить в зависимости от его действий.
В третьей главе рассказывается об экспериментах, проведенных со статистическими данными, приводятся доводы и выводы, которые можно сделать из этих экспериментов. Также в ней приводится логика прогнозирования, которую можно вывести из действия сетей и демонстрируется результат их работы. В конце главы находятся рекомендации о том, как следует интерпретировать этот результат.