Транзакционный скоринг как средство идентификации и оценки клиента

12.04.2018

Источник: Futurebanking

Сергей Голицын, управляющий директор – начальник управления инструментов и моделей Сбербанка в колонке для FutureBanking рассказывает о практике и результатах применения транзакционного скоринга в Сбербанке.

Банковский бизнес переживает нелегкие времена. С одной стороны, на рынок давит снижение реальных доходов на фоне роста закредитованности населения, с другой – всеобщая диджитализация и намечающаяся конкуренция со стороны ИТ-компаний вынуждают банки трансформироваться. Сейчас кредиты нужно давать максимально быстро и удобно, за минимум визитов и с минимумом предоставляемой клиентом информации.

В итоге клиент в несколько кликов на смартфоне может направить заявки в любое количество банков, вынудив тех участвовать в своего рода тендере, и выбрать максимально комфортные условия. Офис в проходном месте уже не помогает, перед банком стоит задача гибко «играть» в рамках, определяемых кредитным риском, и стоимостью заимствования денег. При прочих равных с наилучшим предложением выйдет та кредитная организация, которая максимально точно оценит клиента.

В оценке клиента, помимо качества используемых математических алгоритмов, большое значение имеет количество доступной информации. Если клиент со своего мобильного телефона рассылает множество заявлений на кредит, то это будет примерно один и тот же массив информации. И конкурентное преимущество получит тот банк, который обладает транзакционными данными этого клиента.

Это может быть информация по движению его денежных средств (депозиты, кредитные и дебетовые счета) или информация по платежам клиента, которые пошли на расчетные счета организации-получателя, находящиеся в банке. Помимо того что транзакционная информация является очень детализированной, она еще имеет направление (кто платил, кому платил, за какую услугу и прочее). Все это позволяет не просто использовать ее в виде плоского вектора различных атрибутов, но и создавать так называемые графы связей, на основании которых можно с большой долей вероятности определить периметр возможных коммуникаций клиента, связанных с ним лиц, принадлежность определенным социальным группам и многое другое.

Подробнее о построении графов связей с использованием транзакционных данных для установления скрытых зависимостей между заемщиками Сергей Голицын расскажет 18 апреля на Scoring Days 2018. Использование этого метода дает +10 процентных пунктов GINI при детектировании мошеннических сделок. Программа конференции.

Математически клиент может быть представлен в виде цепочки совершенных им событий-транзакций, которые невозможно каким-либо образом изменить. Поэтому транзакционный след является своего рода цифровым идентификатором клиента, который не подделать, и при достаточном количестве таких транзакций его степень надежности будет существенно выше, чем у всех имеющихся биометрических идентификаторов.

Непосредственно о применимости транзакционных данных для оценки кредитных рисков физических лиц: мы проводили внутренние эксперименты, насколько точно данная информация может предсказывать риски невозврата кредитов (например, выход на просрочку 90+ в первые 6 и 12 месяцев). Для этого были разработаны модели по данным транзакций дебетовых и кредитных карт и отдельно – по данным счетов и депозитов. Качество всех получившихся моделей находилось в диапазоне 45–60 единиц Джини. И самое интересное – то, что предсказание ближайшего дефолта (на горизонте в 6 месяцев) было существенно точнее, а значит, платежная транзакционная информация хорошо позволяла предугадывать вещи, связанные с мошенничеством или неумением пользоваться кредитным продуктом.

Качество такого скоринга по сравнению с рыночными бенчмарками, которые используются для оценки клиентов физических лиц, оказывается выше. Причем оценка получается не просто лучше скоринга, построенного исключительно на анкетных данных, но даже не хуже скоринга с использованием кредитной истории. Это позволяет качественно оценивать клиента без кредитной истории вообще.

Получается, что наличие транзакционных данных решает проблему кредитования без анкеты автоматически, поскольку мы можем предсказывать возникновение проблем у клиента с качеством не хуже бенчмарков. При этом информацию по цепочкам платежей невозможно подделать, а значит, и не надо верифицировать. Строго говоря, не существует инструмента, который можно было бы защитить от подделки на 100 %, но осмысленно симулировать правильное платежное поведение – сложная и затратная для мошенника задача без какой-либо гарантии успеха. Анкету подделать гораздо проще.

Также стоит отдельно отметить, что именно транзакционные данные в банковском бизнесе являются той настоящей Big Data, на основании которой мы можем строить модели классического machine-learning-подхода и с каждым годом набирающего популярность deep-learning-подхода. Эти модели потенциально обладают максимальной степенью разделяющей способности, а значит, позволяют существенно снизить кредитные риски, повысить качество таргетированных кампаний продаж, улучшить клиентский отклик и многое другое.

Банки начинают все больше ценить и использовать возможности транзакционных данных в системах принятия решений. Без сомнения, борьба за умное, удобное и быстрое клиентское обслуживание будет становиться все острее – на пользу клиенту.
Возврат к списку новостей
Рекламодателю