Хранилище данных и аналитическая отчетность в банковском ритейле

Внедрение кредитно-скоринговой системы, призванной, в первую очередь, автоматизировать процесс обработки заявок, дополнительно позволит решить ряд сопутствующих задач, представляющих серьезный интерес для банка, а именно:

  • создать консолидированный источник информации, аккумулирующий в себе как сведения по кредитам, так и по другим направлениям деятельности банка;
  • развернуть на базе платформы полнофункциональную систему отчетности, позволяющую за считанные секунды и без привлечения IT-специалистов получать любую интересующую пользователя информацию, актуальную на текущий момент времени.

Хранилище данных

Хранилище данных (ХД) является одним из ключевых компонентов кредитно-скоринговой системы, и вместе с оперативной (транспортной) БД они образуют в ней подсистему хранения (см. статью Компоненты кредитно-скоринговой системы). Основное назначение ХД в рамках кредитно-скоринговой системы – это поддержка автоматизированного процесса принятия решения по заявкам. Дополнительно данный ресурс аналитической платформы может брать на себя ряд других задач вспомогательного характера, связанных с вопросами хранения и консолидации информации в банке (рисунок 1).

Консолидация

Рисунок 1 – Консолидация банковской информации

Возможность сосредоточения информации из разнородных, а также физически распределенных источников (например, данные из разных отделов, подразделений банка) в едином централизованном ресурсе следует рассматривать как прикладную, но неосновную задачу хранилища кредитно-скоринговой системы. В первую же очередь ХД призвано накапливать данные по кредитам, в том числе:

  • анкетные данные заемщиков;
  • заключенные кредитные договора;
  • качество ведения кредитных договоров (погашения, задержки);
  • результаты обработки заявок в системе
    • присвоенные на этапах проверки статусы анкеты (Одобрить/Отказать);
    • выявленные несоответствия заемщика требованиям кредитной программы;
    • время прохождения по отдельному этапу проверки и т.п.

Для работы кредитно-скоринговой системы необходимо наличие в ХД как минимум трех таблиц (рисунок 2):

  1. Заявки (рисунок 2, а)
  2. Статусы (рисунок 2, б)
  3. Погашения (рисунок 2, в)

Минимальный набор таблиц в ХД

Рисунок 2 – Минимальная структура ХД

Таблица Заявки предназначен для хранения информации по движению кредитных анкет (когда поступила, какое отделение и т. п.), а также самих анкетных характеристик заемщика и параметров запрошенной им ссуды.

Таблица Статусы включает в себя сведения о результатах обработки заявки кредитно-скоринговой системой. В общем случае соответствующая таблица будет иметь поля примерно следующего вида (таблица 1):

Таблица 1 – Пример данных процесса «Статусы»

ID заявки Номер этапа Порядковый номер ошибки Решение по этапу Код причины отказа Время отработки
113718
stage_1
0 из 0
true
-
26.01.2010 15:24:36
113718
stage_2
0 из 0
true
-
26.01.2010 15:24:41
...
...
...
...
...
...
113718
stage_i
1 из 1
false
i_17
26.01.2010 15:24:00
113718
stage_total
1 из 1
false
i_17
26.01.2010 15:24:04

Поле Порядковый номер ошибки вводится для поддержания уникальности записей на случай, если в процессе обработки заявки на отдельном этапе проверки будет выявлено сразу несколько несоответствий заемщика предъявленным к нему требованиям кредитной политики банка.

Поле Код причины отказа хранит информацию о выявленных проблемных сторонах анкеты, по причинам которых кредит не может быть выдан (либо выдан, но с информированием кредитного эксперта об обнаруженных особых случаях, например, нечеткое соответствие с записью из «черных» списков). Перечень и расшифровка кодов причин отказа хранятся в отдельном справочнике системы. Символ «i» в записи «i_17» соответствует номеру этапа.

Назначение прочих полей таблицы 1 можно понять исходя из их названия.

Таблица Погашения необходим для хранения информации по качеству обслуживания кредитного долга заемщиком.

Помимо отчетности данные из таблиц Заявки и Погашения используются в целях построения скоринговых карт автоматизированной системы проверки потенциальных заемщиков.

В общем случае использование хранилища данных позволяет:

  • консолидировать информацию по заявкам, выданным кредитам и последующему их погашению;
  • снизить нагрузку на оперативную базу данных;
  • хранить «очищенные» данные, дополнительно обеспечив их целостность и непротиворечивость, что крайне важно для построения скоринговых моделей, особо чувствительных к аномалиям.

Аналитическая отчетность

Аналитическая отчетность является частью функционала кредитно-скоринговой системы, позволяющей в кротчайшие сроки получать интересующие пользователя данные, представляя их в удобной для него форме. Базовая отчетность включает 4 группы отчетов:

  1. Динамика потребительского кредитования;
  2. Социально-экономические портреты лиц, обратившихся за кредитами;
  3. Сводная информация по работе системы;
  4. Анализ задолженности.

Отчетность представляет собой набор многомерных таблиц, кросс-диаграмм и графиков, просматриваемых при помощи специализированных приложений (рисунок 3).

Список отчетов

Рисунок 3 – Базовая отчетность кредитно-скоринговой системы

  1. Динамика потребительского кредитования позволяет проанализировать суммы выданных кредитов в разрезе дней и торговых отделов, пики обращений по часам, дням недели и др. Примеры таких отчетов и соответствующих графиков приведены на рисунках 4, 5 и 6.

    OLAP

    Рисунок 4 – Отчет по выданным кредитам в разрезе торговых точек



    Интенсивность по дням недели

    Рисунок 5 – Средняя интенсивность поступления заявок по дням недели



    Интенсивность по часам

    Рисунок 6 – Средняя интенсивность поступления заявок в зависимости от времени

  2. Набор отчетов Социально-экономические портреты заемщиков позволяет получить ответы на следующие вопросы:
    • Какие размеры ссуд пользуются наибольшим спросом?
    • С каким личным доходом чаще обращаются за кредитом? (рисунок 7)
    • Распределение по полу, возрасту, социальному статусу, образованию и т.д.

    Гистограмма для дохода

    Рисунок 7 – Гистограмма распределения заемщиков по доходу

  3. Отчеты Сводная информация по работе системы позволяют оценить эффективность принятого на «вооружение» банком механизма проверки заемщиков, причем как в плане самого бизнес-процесса (выражаемого в первую очередь в частоте срабатывания «правил отсева»), так и в плане производительности автоматизированной системы. На рисунке 8 приведен пример отчета из данного набора, отражающий процент отказов по кредитным заявкам.

    Процент отклонений и одобрений

    Рисунок 8 – Процент отклонения заявок системой по этапам

  4. Отчеты, посвященные анализу задолженностей, характеризуют динамику изменения некоторого показателя, выражающего агрегированную величину недополученных средств, а также уровня просрочек (в днях) на заданную дату. На рисунке 9 можно увидеть пример такого отчета.

    Просрочка

    Рисунок 9 – Анализ задолженности

Средства реализации

Одним из наиболее удобных инструментов для решения выше обозначенных задач, включающих весь необходимый для этого функционал, является Deductor. Реализованные в нем технологии позволяют на базе единой платформы пройти все этапы построения кредитно-скоринговой системы: от создания хранилища данных до разработки алгоритмов автоматической проверки заявок и визуализации полученных результатов.

Интегрированное в платформу хранилище данных Deductor Warehouse позволит решить задачу консолидации и предоставить аналитику единый источник информации, характеризуемый следующими ключевыми моментами:

  • богатый семантический слой;
  • высокая производительность;
  • гибкие механизмы фильтрации данных;
  • непротиворечивость и целостность данных;
  • простота и удобство работы.

Входящее в состав приложение Deductor Viewer позволит создать удобную в использовании конечным пользователем систему аналитической отчетности. Встроенное в Deductor OLAP-ядро, поддерживающее мощные механизмы манипулирования кубами, обеспечивает возможность выполнения операций с данными «на лету», в том числе:

  • произвольно размещать измерения/факты;
  • фильтровать, сортировать и группировать данные по любым показателям;
  • детализировать информацию;
  • строить кросс-диаграммы и много другое.