ANG. Argument Next Gen
Proposal № 2026-04 / Confidential
Data Platform Proposal · ГК Интерлизинг

Строим data-платформу
с нуля — без переплат
за будущее.

Архитектура, рассчитанная на ваш реальный объём данных сегодня и на кратный рост — без переписывания завтра.

Объём данных
1.5 ТБ
Стартовый стек
4 компонента
Time-to-Production
10–12 нед.
Размещение
On-premise
01 — Контекст

Что мы понимаем про ваш бизнес

Лизинговая компания — это договорный бизнес с долгим циклом, сложным скорингом и плотной регуляторной отчётностью. Платформа должна одинаково хорошо работать для операционки, аналитики и регулятора.

Управленческая аналитика

Портфель, платежи, просрочка, маржинальность сделок, эффективность менеджеров и филиалов в режиме близком к real-time.

BI · SUPERSET · CLICKHOUSE

Регуляторная отчётность

ЦБ РФ, ФНС, МСФО — данные должны быть прослеживаемы, версионируемы и восстанавливаемы с точностью до транзакции.

AUDIT · LINEAGE · REPLAY

Скоринг и риск

Быстрая проверка клиента, оценка портфельного риска, прогнозные модели по дефолтам — фундамент для ML-задач завтра.

ML-READY · FEATURE STORE
Честный архитектурный взгляд

1.5 ТБ — это ещё не "Big Data". И это хорошо.

На этом объёме мы не навязываем вам Hadoop, громоздкий Lakehouse или десяток компонентов "на вырост". Стартуем с того, что реально решает задачи сегодня — и закладываем архитектуру, в которой Iceberg, Trino, Spark-ML и MinIO появятся тогда, когда они понадобятся, без переписывания.

Это экономит вам 30–40% бюджета первого года и снижает операционные риски: меньше компонентов — меньше точек отказа, меньше людей в эксплуатации.

02 — Архитектура

Архитектура: MVP и путь роста

Переключайтесь между этапами. Каждый компонент — кликабелен: наведите, чтобы увидеть его роль в контуре.

01 · Sources
Источники
АБС core
ERP
CRM sales
Files Excel/CSV
02 · Ingestion
Доставка
Kafka streaming
Debezium CDC
Airflow batch
03 · Storage / Compute
Ядро
ClickHouse DWH
PostgreSQL meta
04 · Consumption
Потребление
Superset BI
REST API apps
Excel / 1С export

MVP-принцип: минимальный набор, покрывающий 80% задач аналитики и регуляторной отчётности. Kafka — для будущей интеграционной шины, ClickHouse — для DWH и витрин, Airflow — для всех регулярных процессов, Superset — для быстрого BI.

01 · Sources
Источники
АБС + CDC real-time
External API БКИ/ФНС
Events веб/моб
02 · Ingestion
Доставка
Kafka Connect scale
NiFi integrations
Airflow orchestration
03 · Lakehouse
Хранилище 2 слоя
ClickHouse hot/BI
Iceberg cold/history
MinIO S3 storage
Spark ETL/ML
04 · Consumption
Потребление
Superset BI
Trino ad-hoc
ML-service scoring

Когда переходить: рост данных до 10+ ТБ, появление ML-задач, требование единого federated-запроса по всем источникам, регуляторика с длинной историей. Компоненты подключаются без остановки MVP.

01 · Sources
Все каналы
All internal unified
Partners API b2b
IoT / Telematics авто
02 · Streaming
Event-driven
Kafka + Schema Registry
Flink stream proc
Airflow DAG mesh
03 · Data Platform
Полный Lakehouse
ClickHouse cluster
Iceberg + Catalog
MinIO multi-tier
Spark on K8s
Feature Store
04 · Products
Data Products
BI self-service
ML platform
Data API gateway
Regulatory hub

Целевое состояние: data platform как внутренний продукт компании. Data mesh, self-service BI, ML-платформа, единый каталог данных. Путь к этому состоянию — эволюционный, а не революционный.

03 — Стек MVP

Почему именно эти компоненты

По каждому компоненту — конкретная роль в контуре Интерлизинга и примеры рабочих сценариев. Без маркетинга и общих слов.

Kafka
Event Backbone

Единая шина событий между системами. Интегрирует АБС, 1С, CRM без прямых point-to-point связок. Вы получаете реплики данных в реальном времени без нагрузки на мастер-системы.

Сценарии в лизинге
CDC из АБС: новые договоры, платежи, просрочки
События от CRM: воронка сделок в реальном времени
Интеграционная шина для будущих микросервисов
ClickHouse
Analytical Core

Колоночная СУБД, которая держит миллиардные таблицы и отвечает за секунды. Это ядро платформы: здесь живёт DWH, витрины, аналитика для BI и API.

Сценарии в лизинге
Витрины портфеля, графиков платежей, просрочек
Дашборды Superset с отзывчивостью <1 сек
Быстрый скоринг и аналитика риска
Airflow
Orchestration

Мозг платформы. Расписания, зависимости, retries, SLA, алерты. Все регулярные процессы — от ночных загрузок до формирования регуляторной отчётности — живут здесь с прозрачным логированием.

Сценарии в лизинге
Ночные загрузки справочников и агрегатов
Формирование отчётности ЦБ, МСФО
SLA-контроль готовности витрин
Spark
Heavy ETL · optional MVP

Наше мнение: на 1.5 ТБ Spark избыточен для чистого ETL — ClickHouse справится. Но оставляем его в MVP как задел под ML-задачи и сложные расчёты (реконсиляция, историческая переработка).

Когда реально нужен
ML: скоринг, прогноз дефолтов, сегментация клиентов
Тяжёлые join'ы на истории >100 млн строк
Обработка Iceberg-данных при переходе на Этап 2
04 — Дорожная карта

План внедрения по неделям

Три фазы. Каждая даёт измеримый результат и независимую ценность. Если остановитесь после первой — у вас уже работающая платформа.

01
Недели 1–4

Фундамент и Discovery

→ Инфраструктура · модели · соглашения

Аудит источников (АБС, 1С, CRM). Развёртывание окружений DEV/PROD на ваших мощностях. Согласование data-контрактов и моделей ключевых доменов: договоры, платежи, клиенты, предметы лизинга.

Kubernetes / Helm-стенды
CI/CD для DAG и SQL
Data-contracts v1
Мониторинг + алерты
02
Недели 5–8

Ingestion и ядро DWH

→ Kafka · Airflow · ClickHouse

Первые потоки данных в реальном времени через Kafka + CDC. Классические ночные батчи через Airflow. В ClickHouse — raw + stage + core-слои для 3–5 ключевых доменов.

CDC потоки из АБС/1С
ClickHouse DWH 3 слоя
10+ production DAG
Витрины портфеля
03
Недели 9–12

BI, Hand-over и эксплуатация

→ Superset · документация · обучение

Развёртывание Superset, 10+ дашбордов для бизнеса, регламенты эксплуатации, обучение вашей команды. Платформа выходит в production и переходит под совместное сопровождение.

10+ BI-дашбордов
Runbook'и и SLA
Обучение команды
Production-сдача
05 — Что вы получаете

Эффект в цифрах

Ориентиры по результатам похожих внедрений на сопоставимом объёме данных и в родственных индустриях (банки, финансовые сервисы).

10×
Ускорение отчётов
vs прямые запросы к АБС
<1 сек
Отклик дашбордов
ClickHouse + Superset
3 мес
Time-to-production
от старта до BI в проде
0 lock-in
Open-source стек
нет вендорной зависимости
06 — Почему ANG

Работаем как ваш архитектор

Мы строим не "коробку на продажу", а платформу, в которой ваша команда будет хозяином с первого дня.

— 01

Репозиторий, а не магия

Весь код платформы — в вашем GitLab. Helm-чарты, Terraform, DAG'и, SQL — всё прозрачно и воспроизводимо. Никаких "секретных ноу-хау" в голове одного инженера.

— 02

Опыт enterprise-контура

Работаем в периметре банков, госструктур, производств. Понимаем, что такое on-premise, закрытый интернет, сертифицированное ПО, регуляторные требования и процедуры ИБ.

— 03

Трансфер знаний с первого дня

Каждая фаза сопровождается документацией и обучением. К концу MVP ваша команда самостоятельно пишет DAG'и, расширяет модель данных и ведёт эксплуатацию.

Готовы обсудить?

Следующий шаг — двухчасовая discovery-сессия с вашей ИТ-командой и бизнесом. Мы уточняем источники, приоритеты и формируем детальный план + смету за 5 рабочих дней.