● СИСТЕМА АКТИВНА last update:

Единая платформа данных для 3000 инстансов 1С

ANG Platform консолидирует все инстансы 1С ДИТ Москвы в единое хранилище, обеспечивает аналитику с SLA до 2 секунд и сокращает TCO в 3–5 раз по сравнению с коробочными BI-решениями.

ИНСТАНСОВ 1С

3 000

● 2 987 онлайн

СОБЫТИЙ В СЕК

42 180

● пиковая нагрузка

ЛАТЕНЦИЯ P95

1.8с

● SLA выдержан

ДАННЫХ В ХРАНИЛИЩЕ

847ТБ

Iceberg + MinIO, compressed

Карта инстансов 1С

Каждая ячейка — отдельный инстанс. Наведи курсор или кликни.

OK Sync Warning Error

01 · ПРОБЛЕМА

Данные в 3000 изолированных контурах

Отчёт по всей Москве собирается неделями. Каждый инстанс — своя БД, свои форматы, свои регламенты.

02 · ЧТО НЕ МАСШТАБИРУЕТСЯ

Классические DWH и Hadoop-дистрибутивы

DWH упирается в вертикальный scale и цену лицензий. Hadoop медленный на аналитических запросах и требует больше людей на эксплуатацию.

03 · ЧТО ДАЁТ ANG

Lakehouse-архитектура на open-source

Единое хранилище на Iceberg + MinIO, ClickHouse/Trino для SQL за секунды, работа с существующей шиной (Denvik, Modus, 1Бит). Без vendor lock-in.

Архитектура для 3000 инстансов 1С

Кликни на компонент — увидишь его роль, параметры и код.

SOURCES

3000× 1С

ERP · ЖКХ · Кадры · Финансы

● connected

▶▶▶

INGEST

Шина + NiFi + Kafka

Denvik/Modus/1Бит · CDC · Batch

42K events/sec

▶▶▶

STORAGE

Iceberg + MinIO

Parquet · ACID · Time Travel

847 TB

VIZ

Superset + Pixbi

Дашборды · Self-service

◀◀◀

QUERY

Trino + ClickHouse

Federated SQL · OLAP

p95: 1.8s

◀◀◀

PROCESS

Spark + Airflow

ETL · ML · Scheduled

всё — on-premise · Deckhouse Kubernetes · без внешних сервисов · Реестр отечественного ПО

Кликни на компонент в схеме выше, чтобы увидеть детали.

Реальные сценарии ДИТ Москвы

Нажми на сценарий — увидишь SQL, время выполнения и результат.

trino://ang-cluster.dit.mos/iceberg

Engine: Trino Rows scanned: — Execution: —

ready

RESULT

СРАВНЕНИЕ ВРЕМЕНИ ВЫПОЛНЕНИЯ

ANG vs классический DWH · Arenadata Hadoop · Selena

Сравнение архитектурных подходов к консолидации данных из 3000 инстансов 1С. Шина данных (Denvik / Modus / 1Бит) — уровень транспорта, обсуждается отдельно.

Критерий	ANG Platform	Классический DWH	Arenadata Hadoop	Selena
Архитектурная парадигма	Lakehouse	Централизованный DWH	Data Lake (HDFS)	Платформа на Hadoop
Масштаб 3000 инстансов 1С	✓ Нативно	~ Сложно, узкое горлышко ETL	✓	✓
Единое хранилище (object storage)	✓ Iceberg + MinIO	✗ Только СУБД	~ HDFS	~ HDFS
Открытый табличный формат	✓ Apache Iceberg	✗ Проприетарный	~ Hive / ORC	~ Hive-совместимо
ACID-транзакции на lake-слое	✓ Iceberg MERGE	✓ В БД	✗	~ Ограниченно
SQL p95 < 2с на 100+ ТБ	✓ ClickHouse + Trino	~ Требует cube/aggr	✗ Hive/Impala медленно	~ Зависит от движка
Разделение storage и compute	✓ Полное	✗ Монолит	✗ HDFS = colocated	~ Частичное
Горизонтальное масштабирование	✓ Независимо по слоям	✗ Вертикально	✓ Но через HDFS	✓
Time travel / версионность данных	✓ Iceberg snapshots	✗	✗	✗
Kubernetes-native	✓ Deckhouse K8s	✗ Bare-metal	~ Частично	~ Частично
Потоковая обработка + batch в одном стеке	✓ Flink + Spark	✗ Batch only	~ Kafka + Spark	~ Spark Streaming
Федеративные SQL (Iceberg + CH + PG)	✓ Trino	✗	~ Через доп. слой	~ Ограниченно
Data Science / ML workloads	✓ Spark + Python + vLLM	✗ Выгрузка наружу	✓ Spark MLlib	✓
Open-source стек без vendor lock-in	✓ 100%	✗ Проприетарно	✓	✓
Реестр отечественного ПО	✓	~ Зависит от вендора	✓	✓
Стоимость хранения (₽/ТБ)	Низкая (MinIO + Parquet)	Высокая (enterprise БД)	Низкая	Средняя

Почему Lakehouse, а не DWH

• Классический DWH требует жёсткой схемы на входе — при 3000 разнородных 1С это сразу боттлнек
• DWH не масштабируется горизонтально без огромных затрат — нельзя просто "добавить узел"
• ML/DS поверх DWH всегда через выгрузку — дублирование данных и задержка

Почему Lakehouse, а не Hadoop

• Arenadata / Selena построены на HDFS — storage и compute неразделимы, сложнее масштабировать
• Hive/Impala не дают SQL за секунды на сотнях ТБ — нужны кубы или внешние OLAP
• Нет ACID и time travel из коробки — для госданных это критичный аудит
• Kubernetes-нативность ниже — эксплуатация дороже

Честные ограничения ANG

• Продукт моложе Arenadata и Selena — меньше референсов в госсегменте, это мы закрываем пилотами и совместной работой
• Требуется квалифицированная команда эксплуатации (DevOps + DE) — но это общая история для любого Lakehouse
• Экосистема коннекторов к редким источникам меньше — наращиваем через NiFi-процессоры

АРХИТЕКТУРНОЕ УТОЧНЕНИЕ

Denvik, Modus и Первый Бит — это слой транспорта данных (шина/коннекторы из 1С), а не альтернативы платформе. В целевой архитектуре ДИТ они работают в связке с ANG: транспорт доставляет изменения из 1С → ANG Platform хранит, обрабатывает и отдаёт данные. Это разные уровни стека, не конкуренты.

TCO за 3 года · 3000 инстансов 1С

Оценка в рублях, on-premise. Настрой параметры — увидишь, как меняется картина.

Инстансов 1С 3000

Объём данных, ТБ 850

Пользователей BI 500

Горизонт, лет 3

ЭКОНОМИЯ ANG vs СРЕДНЕЕ

₽ 0 М

—

TCO ЗА ВЕСЬ ГОРИЗОНТ (МЛН ₽)

ANG PLATFORM

₽ —

КЛАССИЧЕСКИЙ DWH

₽ —

ARENADATA HADOOP

₽ —

SELENA

₽ —

Методология расчёта

• Железо: среднерыночные цены на 2-сокетные x86-серверы с NVMe, кластер из N узлов (для DWH — вертикальное масштабирование, выше удельная стоимость)
• Софт: ANG — open-source + лицензия поддержки от ООО «Аргумент-Байт». Selena/Arenadata — по публичным прайсам. DWH — ориентир на enterprise-СУБД из Реестра
• Внедрение: ANG — 8-недельный пилот + разворачивание. Для DWH/Hadoop учтена стоимость сайзинг-проекта и дата-моделирования
• OPEX: команда эксплуатации со стороны ДИТ + подписка поддержки вендора
• Цифры оценочные для демонстрации. Финальный расчёт — после скоупинга и подтверждения объёмов данных

Дорожная карта пилота

8 недель от подписания до рабочего прототипа на 10 инстансах. Далее — тиражирование.

Discovery & инфраструктура

Недели 1–2

Аудит 10 референсных инстансов 1С · Развёртывание K8s-кластера · MinIO + Hive Metastore · первые потоки NiFi

Deliverable:

Живой кластер ANG

CDC из 1С + модель данных

Недели 3–4

Настройка CDC-коннекторов · Iceberg-таблицы (bronze/silver/gold) · dbt-модели для ключевых справочников и регистров

Deliverable:

Данные 10 инстансов в Lakehouse

SQL, дашборды, прототип use-case'ов

Недели 5–6

Trino + ClickHouse сверху данных · 3 целевых дашборда в Superset · отработка 5 реальных сценариев ДИТ

Deliverable:

Демо-стенд для ДИТ

Нагрузочное тестирование + приёмка

Недели 7–8

Симуляция нагрузки на 100 инстансов (экстраполяция на 3000) · передача документации · акт приёмки пилота

Deliverable:

Обоснование масштабирования

ПИЛОТ

8 недель

10 инстансов 1С, 3 целевых сценария

МАСШТАБИРОВАНИЕ

4–6 мес

Волнами по 300–500 инстансов с регламентом подключения

ПОЛНЫЙ ВЫХОД

12 мес

Все 3000 инстансов, production SLA, передача эксплуатации

Предлагаем начать с 8-недельного пилота

Фиксированный скоуп, фиксированная цена, рабочий прототип на проде ДИТ в конце