Схильність
Ігор Лакоза
Ігор Лакоза
• Директор з моделювання та великих даних, Департамент по управлінню
ризиками, Сенс банк
• майже 20ти річний досвід роботи з даними, як з реляційними (small data) так і Big
Data
• З них 7 років спеціалізуюсь у сфері Data Science (CV, NLP, tabular data) у фінансах та
рітейлі
2
Історія AI
• 1956 – заснування FICO, використання данних кредитних бюро застосування
скорингу у банках в процесі кредитування
• 1958 - персептрон
• 1962 – Джон Тьюке, математик, запропонував запровадити термін аналіз даних
(data analysis)
• 1974 – поява терміну data science на додачу до computer science
• 1989 – FICO score
• 2010 deep neural networks (робота з відео, зображеннями, людською мовою)
• 2017 Трансформери
• LLM
3
Від
скорингу
до
схильності
4
Бінарна класифікація
Незалежні змінні
Таргет для скорингу: «прострочка 30+ в
наступні пів року»
Таргет для моделі схильності: «оформлення
кредитної картки після комунікації»)
Результати
5
- Загальна конверсія – 4.4%
- Є групи, в яких конверсія більше ніж в 10! разів більша
Поточні
результати
• 50 моделей схильності
• Фічастор на 3000 фіч (кредитні, некредитні,
транзакційні і т.д.)
• Технології: pyspark, GCP (Big Query +
WorkBench), airflow
• 20Гб даних в день в форматі parquet
6
Далі буде
7
• Онлайн схильність
• Розширення фічастору
• Застосування схильності у всіх каналах продажу
Ефект від схильності
• Економія на росзилках
• Персоналізація
• Інсайти в даних
8

Igor Lakoza: Використання моделей схильності (UA)

  • 1.
  • 2.
    Ігор Лакоза • Директорз моделювання та великих даних, Департамент по управлінню ризиками, Сенс банк • майже 20ти річний досвід роботи з даними, як з реляційними (small data) так і Big Data • З них 7 років спеціалізуюсь у сфері Data Science (CV, NLP, tabular data) у фінансах та рітейлі 2
  • 3.
    Історія AI • 1956– заснування FICO, використання данних кредитних бюро застосування скорингу у банках в процесі кредитування • 1958 - персептрон • 1962 – Джон Тьюке, математик, запропонував запровадити термін аналіз даних (data analysis) • 1974 – поява терміну data science на додачу до computer science • 1989 – FICO score • 2010 deep neural networks (робота з відео, зображеннями, людською мовою) • 2017 Трансформери • LLM 3
  • 4.
    Від скорингу до схильності 4 Бінарна класифікація Незалежні змінні Таргетдля скорингу: «прострочка 30+ в наступні пів року» Таргет для моделі схильності: «оформлення кредитної картки після комунікації»)
  • 5.
    Результати 5 - Загальна конверсія– 4.4% - Є групи, в яких конверсія більше ніж в 10! разів більша
  • 6.
    Поточні результати • 50 моделейсхильності • Фічастор на 3000 фіч (кредитні, некредитні, транзакційні і т.д.) • Технології: pyspark, GCP (Big Query + WorkBench), airflow • 20Гб даних в день в форматі parquet 6
  • 7.
    Далі буде 7 • Онлайнсхильність • Розширення фічастору • Застосування схильності у всіх каналах продажу
  • 8.
    Ефект від схильності •Економія на росзилках • Персоналізація • Інсайти в даних 8