SlideShare une entreprise Scribd logo
1  sur  11
Применение технологии “Больших
данных” в ФНС России
(АСК НДС-2)
Москва
2015
Причины и основания для создания АСК НДС-2
О налоге на добавленную стоимость
Налог на добавленную стоимость являются одним из важнейших источников формирования
доходной части бюджета РФ. На НДС приходится около 40% поступлений в Федеральный
бюджет.
С точки зрения механизма исчисления, НДС достаточно простой налог, но достаточно
уязвимый с точки зрения создания схем уклонения от его уплаты.
Основания для создания автоматизации контроля за уплатой НДС
Основой для создания средств автоматизированного контроля за уплатой НДС является
Федеральный закон от 28.06.2013 № 134-ФЗ «О внесении изменений в отдельные
законодательные акты Российской Федерации в части противодействия незаконным
финансовым операциям». В соответствии с требованиями 134 –ФЗ плательщик НДС обязан с
1-го квартала 2015 года подавать декларацию по НДС, которая будет включать сведения из
книг продаж и покупок, журналов учета выставленных и полученных счетов-фактур.
Реализация требований 134 –ФЗ дала возможность осуществлять автоматизированную
проверку обоснованности вычета НДС, путем осуществления сопоставление сведений,
представленных контрагентами.
Автоматизированная проверка уплаты НДС была реализована путем создания системы АСК
НДС-2.
Общее описание решения
Модуль
Он-лайн сервисов
проверки контрагентов
АРМ
Федеральные
информационные
ресурсы
Данные контрагентов
для проверки
Модуль сопоставления
Кластер
серверов Hadoop
Комплекс
взаимодействия с
налогоплательщиками
Модуль камеральной
налоговой проверки
Oracle Exadata
Результаты
Сопоставлений и
данные по декларациям
Налогоплательщик
Требования о
предоставлении пояснений
Налоговые
декларации
Данные из
ФИР
Данные из
ФИР
Данные из книг и журналов
налоговых деклараций
Основные этапы обработки данных в АСК НДС-2:
• Прием налоговых деклараций
• Обработка данных НД
• Взаимодействие с ИФНС
• Взаимодействие с налогоплательщиками
Характеристика обрабатываемых данных
Проектные требования:
• Плательщиков НДС - 1,5 миллиона
• Количество поданных деклараций
– 2 миллиона
• Количество записей о СФ
подлежащих сопоставлению – 3
миллиарда
Реальные характеристики :
• Количество поданных деклараций до
1,5 миллиона.
• Количество записей о СФ подлежащих
сопоставлению - до 1 миллиарда
Особенности обработки и использования данных
Объем данных за один налоговый период (квартал)
Срок хранения данных и участия их в сопоставлениях - 7 лет
Система должна поддерживает работу 30 000 пользователей
в том числе 2 000 одновременно работающих пользователей
Время ответа на зарос не более секунды на запросах до 1000 записей
не более 5 секунд на запросах в 100 000 записей
Ежесуточное технологическое окно на обработку данных - 5 часов
Во время интерактивного обслуживания пользователей обработка данных не осуществляется
Налогоплательщик имеет право поменять представленные данные неограниченное количество раз
Рассчитанные расхождения могут многократно открываться, закрываться, менять значения
атрибутов
Эволюция архитектуры
Сервер обеспечения
взаимодействия
Расчет сводных данных
Отбор расхождений в выборки
Предоставление доступа к первичной
информации
Расчет агрегатов
Кластер
серверов Hadoop
16 узлов
HDFS
Низкие характеристики производительности пакетной обработки
Большое время выполнения интерактивных запросов
Сложный интерфейс разработки
Модуль сопоставления
Выполнение логических проверок
Расчет КС
Сопоставлениезаписей о СФ
Расчет расхождений
Hbase Информации о записях о СФ
Информации о расхождениях
Агрегаты
Oracle Exadata
Сводные данные по декларациям
Данные бизнес-процесса
Агрегаты
1
Эволюция архитектуры
Сервер обеспечения
взаимодействия
Расчет сводных данных
Отбор расхождений в выборки
Предоставление доступа к первичной
информации
Расчет агрегатов
Кластер
серверов Hadoop
16 узлов
HDFS
Низкие характеристики производительности пакетной обработки
Большое время выполнения интерактивных запросов
Сложный интерфейс разработки
Модуль сопоставления
Выполнение логических проверок
Расчет КС
Сопоставлениезаписей о СФ
Расчет расхождений
Hbase Информации о записях о СФ
Информации о расхождениях
Агрегаты
Oracle Exadata
Сводные данные по декларациям
Данные бизнес-процесса
Агрегаты
1
SPARK
Расчет сводных данных
Отбор расхождений в выборки
Предоставление доступа к
первичной информации
Расчет агрегатов
Кластер
серверов Hadoop
16 узлов
HDFS
Модуль сопоставления
Выполнение логических проверок
Расчет КС
Сопоставлениезаписей о СФ
Расчет расхождений
Hbase
Хранение информации о записях о СФ
Хранение информации о расхождениях
Хранение агрегатов
Oracle Exadata
Сводные данные по декларациям
Данные бизнес-процесса
Агрегаты
2
Нестабильность работы
Большое время выполнения интерактивных запросов
Эволюция архитектуры
Сервер обеспечения
взаимодействия
Расчет сводных данных
Отбор расхождений в выборки
Предоставление доступа к первичной
информации
Расчет агрегатов
Кластер
серверов Hadoop
16 узлов
HDFS
Низкие характеристики производительности пакетной обработки
Большое время выполнения интерактивных запросов
Сложный интерфейс разработки
Модуль сопоставления
Выполнение логических проверок
Расчет КС
Сопоставлениезаписей о СФ
Расчет расхождений
Hbase Информации о записях о СФ
Информации о расхождениях
Агрегаты
Oracle Exadata
Сводные данные по декларациям
Данные бизнес-процесса
Агрегаты
1
SPARK
Расчет сводных данных
Отбор расхождений в выборки
Предоставление доступа к
первичной информации
Расчет агрегатов
Кластер
серверов Hadoop
16 узлов
HDFS
Модуль сопоставления
Выполнение логических проверок
Расчет КС
Сопоставлениезаписей о СФ
Расчет расхождений
Hbase
Хранение информации о записях о СФ
Хранение информации о расхождениях
Хранение агрегатов
Oracle Exadata
Сводные данные по декларациям
Данные бизнес-процесса
Агрегаты
2
Нестабильность работы
Большое время выполнения интерактивных запросов
Hive 2.0.0 (TEZ-LLAP)
Расчет расхождений
Расчет сводных данных
Отбор расхождений в выборки
Предоставление доступа к первичной
информации
Кластер
серверов Hadoop
16 узлов
HDFS
Модуль сопоставления
Выполнение логических проверок
Расчет КС
Сопоставлениезаписей о СФ
Hbase
Oracle Exadata
Данные бизнес-процесса
3
ORC
Хранениеинформации о записях о СФ
Хорошие характеристики производительности при пакетной
обработке.
Удобный интерфейс разработки
Проблемы с большим количеством одновременных запросов
Длительное время отклика
Эволюция архитектуры
Сервер обеспечения
взаимодействия
Расчет сводных данных
Отбор расхождений в выборки
Предоставление доступа к первичной
информации
Расчет агрегатов
Кластер
серверов Hadoop
16 узлов
HDFS
Низкие характеристики производительности пакетной обработки
Большое время выполнения интерактивных запросов
Сложный интерфейс разработки
Модуль сопоставления
Выполнение логических проверок
Расчет КС
Сопоставлениезаписей о СФ
Расчет расхождений
Hbase Информации о записях о СФ
Информации о расхождениях
Агрегаты
Oracle Exadata
Сводные данные по декларациям
Данные бизнес-процесса
Агрегаты
1
SPARK
Расчет сводных данных
Отбор расхождений в выборки
Предоставление доступа к
первичной информации
Расчет агрегатов
Кластер
серверов Hadoop
16 узлов
HDFS
Модуль сопоставления
Выполнение логических проверок
Расчет КС
Сопоставлениезаписей о СФ
Расчет расхождений
Hbase
Хранение информации о записях о СФ
Хранение информации о расхождениях
Хранение агрегатов
Oracle Exadata
Сводные данные по декларациям
Данные бизнес-процесса
Агрегаты
2
Нестабильность работы
Большое время выполнения интерактивных запросов
Hive 2.0.0 (TEZ-LLAP)
Расчет расхождений
Расчет сводных данных
Отбор расхождений в выборки
Предоставление доступа к первичной
информации
Кластер
серверов Hadoop
16 узлов
HDFS
Модуль сопоставления
Выполнение логических проверок
Расчет КС
Сопоставлениезаписей о СФ
Hbase
Oracle Exadata
Данные бизнес-процесса
3
ORC
Хранениеинформации о записях о СФ
Хорошие характеристики производительности при пакетной
обработке.
Удобный интерфейс разработки
Проблемы с большим количеством одновременных запросов
Длительное время отклика
Hive 2.0.0 (TEZ-LLAP)
Расчет расхождений
Расчет сводных данных
Расчет агрегатов
Отбор расхождений в выборки
Предоставление доступа к первичной
информацииКластер
серверов Hadoop
16 узлов
HDFS
Характеристики соответствующие
требованиям
Модуль сопоставления
Выполнение логических проверок
Расчет КС
Сопоставлениезаписей о СФ
Hbase
Oracle Exadata
Данные бизнес-процесса
4
ORC
Хранениеинформации о записях о СФ
Impala
Хранениезаписей о СФ
Отбор расхождений в выборки
Предоставление доступа к первичной
информации
Parquet
Текущее состояние и планы развития
В настоящее время реализован базовый функционал:
• Централизованный доступ к информации предоставленной НП
• Автоматизированная обработка представленной НП информации
• Автоматизированное взаимодействие с налогоплательщиком в части отправки им требований и
получения от них ответов
• Средства оперативной и аналитической обработки полученной информации
Основные направления развития:
• Расчёт и контроль KPI процесса камерального контроля
• Использование в АСК НДС-2 сведений об уплате других налогов
• Использование данных других федеральных ведомств.
• Реализация поиск схем уклонения от уплаты НДС с использованием методов
прогностического моделирования с целью выявления определенных закономерностей и
систематических взаимосвязей между переменными, которые затем можно применить к
новым совокупностям данных
Пример аналитического отчета
Спасибо за внимание!

Contenu connexe

Tendances

Как Microsoft Power BI меняет процесс принятия управленческих решений?
Как Microsoft Power BI меняет процесс принятия управленческих решений?Как Microsoft Power BI меняет процесс принятия управленческих решений?
Как Microsoft Power BI меняет процесс принятия управленческих решений?
FTS Russia
 
Виталий Гаврилов (Ленвендо)
Виталий Гаврилов (Ленвендо)Виталий Гаврилов (Ленвендо)
Виталий Гаврилов (Ленвендо)
Ontico
 
Cервис рекомендаций на виртуальном Hadoop кластере (Роман Зыков)
Cервис рекомендаций на виртуальном Hadoop кластере (Роман Зыков)Cервис рекомендаций на виртуальном Hadoop кластере (Роман Зыков)
Cервис рекомендаций на виртуальном Hadoop кластере (Роман Зыков)
Ontico
 
Использование облачной платформы OpenStack для реализации механизмов обработк...
Использование облачной платформы OpenStack для реализации механизмов обработк...Использование облачной платформы OpenStack для реализации механизмов обработк...
Использование облачной платформы OpenStack для реализации механизмов обработк...
Игорь Мызгин
 
Слоны в облаках
Слоны в облакахСлоны в облаках
Слоны в облаках
Pavel Mezentsev
 
16 декабря, DEV {highload} - конференция о Highload веб-разработке, "Оптимиза...
16 декабря, DEV {highload} - конференция о Highload веб-разработке, "Оптимиза...16 декабря, DEV {highload} - конференция о Highload веб-разработке, "Оптимиза...
16 декабря, DEV {highload} - конференция о Highload веб-разработке, "Оптимиза...
IT-Portfolio
 
SQL Server StreamIinsight - data processing in real time
SQL Server StreamIinsight - data processing in real timeSQL Server StreamIinsight - data processing in real time
SQL Server StreamIinsight - data processing in real time
Денис Резник
 

Tendances (19)

Как Microsoft Power BI меняет процесс принятия управленческих решений?
Как Microsoft Power BI меняет процесс принятия управленческих решений?Как Microsoft Power BI меняет процесс принятия управленческих решений?
Как Microsoft Power BI меняет процесс принятия управленческих решений?
 
Бизнес-аналитика – не роскошь, а средство для принятия решений:
Бизнес-аналитика – не роскошь, а средство для принятия решений:Бизнес-аналитика – не роскошь, а средство для принятия решений:
Бизнес-аналитика – не роскошь, а средство для принятия решений:
 
Переход в Облако для решения «земных» задач
Переход в Облако для решения «земных» задачПереход в Облако для решения «земных» задач
Переход в Облако для решения «земных» задач
 
«Облачная платформа Windows Azure для высоконагруженных проектов»
«Облачная платформа Windows Azure для высоконагруженных проектов»«Облачная платформа Windows Azure для высоконагруженных проектов»
«Облачная платформа Windows Azure для высоконагруженных проектов»
 
Виталий Гаврилов (Ленвендо)
Виталий Гаврилов (Ленвендо)Виталий Гаврилов (Ленвендо)
Виталий Гаврилов (Ленвендо)
 
Как устроено API в AppMetrica
Как устроено API в AppMetricaКак устроено API в AppMetrica
Как устроено API в AppMetrica
 
Простая сложная облачная платформа Azure
Простая сложная облачная платформа AzureПростая сложная облачная платформа Azure
Простая сложная облачная платформа Azure
 
Talksum dec2013 rus_generic
Talksum dec2013 rus_genericTalksum dec2013 rus_generic
Talksum dec2013 rus_generic
 
GRmap Банк
GRmap БанкGRmap Банк
GRmap Банк
 
Cервис рекомендаций на виртуальном Hadoop кластере (Роман Зыков)
Cервис рекомендаций на виртуальном Hadoop кластере (Роман Зыков)Cервис рекомендаций на виртуальном Hadoop кластере (Роман Зыков)
Cервис рекомендаций на виртуальном Hadoop кластере (Роман Зыков)
 
Услуги КРОК в сфере облачных вычислений
Услуги КРОК в сфере облачных вычисленийУслуги КРОК в сфере облачных вычислений
Услуги КРОК в сфере облачных вычислений
 
4 sas and big data short
4 sas and big data short4 sas and big data short
4 sas and big data short
 
Использование облачной платформы OpenStack для реализации механизмов обработк...
Использование облачной платформы OpenStack для реализации механизмов обработк...Использование облачной платформы OpenStack для реализации механизмов обработк...
Использование облачной платформы OpenStack для реализации механизмов обработк...
 
Hadoop in Wikimart. Part 1. Business
Hadoop in Wikimart. Part 1. BusinessHadoop in Wikimart. Part 1. Business
Hadoop in Wikimart. Part 1. Business
 
Как российские ИТ-компании могут зарабатывать на Windows Azure
Как российские ИТ-компании могут зарабатывать на Windows AzureКак российские ИТ-компании могут зарабатывать на Windows Azure
Как российские ИТ-компании могут зарабатывать на Windows Azure
 
Разработка аналитической системы для высоконагруженного медиа, Олег Новиков, ...
Разработка аналитической системы для высоконагруженного медиа, Олег Новиков, ...Разработка аналитической системы для высоконагруженного медиа, Олег Новиков, ...
Разработка аналитической системы для высоконагруженного медиа, Олег Новиков, ...
 
Слоны в облаках
Слоны в облакахСлоны в облаках
Слоны в облаках
 
16 декабря, DEV {highload} - конференция о Highload веб-разработке, "Оптимиза...
16 декабря, DEV {highload} - конференция о Highload веб-разработке, "Оптимиза...16 декабря, DEV {highload} - конференция о Highload веб-разработке, "Оптимиза...
16 декабря, DEV {highload} - конференция о Highload веб-разработке, "Оптимиза...
 
SQL Server StreamIinsight - data processing in real time
SQL Server StreamIinsight - data processing in real timeSQL Server StreamIinsight - data processing in real time
SQL Server StreamIinsight - data processing in real time
 

En vedette

En vedette (9)

Сергей Чернов — Yandex Data Factory — ICBDA 2015
Сергей Чернов — Yandex Data Factory — ICBDA 2015Сергей Чернов — Yandex Data Factory — ICBDA 2015
Сергей Чернов — Yandex Data Factory — ICBDA 2015
 
Александр Фонарев — Rubbles — ICBDA 2015
Александр Фонарев — Rubbles — ICBDA 2015Александр Фонарев — Rubbles — ICBDA 2015
Александр Фонарев — Rubbles — ICBDA 2015
 
Николай Птицын — Synesis — ICBDA 2015
Николай Птицын — Synesis — ICBDA 2015Николай Птицын — Synesis — ICBDA 2015
Николай Птицын — Synesis — ICBDA 2015
 
Роман Постников — «Мегафон» — ICBDA 2015
Роман Постников — «Мегафон» — ICBDA 2015Роман Постников — «Мегафон» — ICBDA 2015
Роман Постников — «Мегафон» — ICBDA 2015
 
Кирилл Чистов — Data-Centric Alliance — ICBDA 2015
Кирилл Чистов — Data-Centric Alliance — ICBDA 2015Кирилл Чистов — Data-Centric Alliance — ICBDA 2015
Кирилл Чистов — Data-Centric Alliance — ICBDA 2015
 
Сергей Кашпоров — Frank Research Group — ICBDA 2015
Сергей Кашпоров — Frank Research Group — ICBDA 2015Сергей Кашпоров — Frank Research Group — ICBDA 2015
Сергей Кашпоров — Frank Research Group — ICBDA 2015
 
Тимур Кузеев — Meta System — ICBDA 2015
Тимур Кузеев — Meta System — ICBDA 2015Тимур Кузеев — Meta System — ICBDA 2015
Тимур Кузеев — Meta System — ICBDA 2015
 
Александр Емешев — Tinkoff — ICBDA 2015
Александр Емешев — Tinkoff — ICBDA 2015Александр Емешев — Tinkoff — ICBDA 2015
Александр Емешев — Tinkoff — ICBDA 2015
 
Михаил Кечинов — REES46 — ICBDA 2015
Михаил Кечинов — REES46 — ICBDA 2015Михаил Кечинов — REES46 — ICBDA 2015
Михаил Кечинов — REES46 — ICBDA 2015
 

Similaire à Александр Мигаловский — ГНИВЦ ФНС России — ICBDA 2015

Стратегия и тактика улучшения производительности BSS систем оператора мобильн...
Стратегия и тактика улучшения производительности BSS систем оператора мобильн...Стратегия и тактика улучшения производительности BSS систем оператора мобильн...
Стратегия и тактика улучшения производительности BSS систем оператора мобильн...
Ontico
 
Informatica Пронет (v.0.3)
Informatica   Пронет (v.0.3)Informatica   Пронет (v.0.3)
Informatica Пронет (v.0.3)
Natasha Zaverukha
 
Презентация Microsoft PowerPoint
Презентация Microsoft PowerPointПрезентация Microsoft PowerPoint
Презентация Microsoft PowerPoint
webhostingguy
 
ОЦО: Решение на базе ECM платформы LanDocs и ABBYY FlexiCapture
ОЦО: Решение на базе ECM платформы LanDocs и ABBYY FlexiCapture ОЦО: Решение на базе ECM платформы LanDocs и ABBYY FlexiCapture
ОЦО: Решение на базе ECM платформы LanDocs и ABBYY FlexiCapture
LANIT
 
Papyrus: общая презентация
Papyrus: общая презентацияPapyrus: общая презентация
Papyrus: общая презентация
Eugene Lobski
 
Продукты и решения Informatica
Продукты и решения  InformaticaПродукты и решения  Informatica
Продукты и решения Informatica
Natasha Zaverukha
 

Similaire à Александр Мигаловский — ГНИВЦ ФНС России — ICBDA 2015 (20)

Microsoft BI User Group: Работаем с 1С эффективно
Microsoft BI User Group: Работаем с 1С эффективноMicrosoft BI User Group: Работаем с 1С эффективно
Microsoft BI User Group: Работаем с 1С эффективно
 
DevConf2013: Особенности применения WebSocket на примере работы в ERP системе.
DevConf2013: Особенности применения WebSocket на примере работы в ERP системе.DevConf2013: Особенности применения WebSocket на примере работы в ERP системе.
DevConf2013: Особенности применения WebSocket на примере работы в ERP системе.
 
DB REPLICATION
DB REPLICATIONDB REPLICATION
DB REPLICATION
 
ФАС - внедрение КРОК-НСИ
ФАС - внедрение КРОК-НСИФАС - внедрение КРОК-НСИ
ФАС - внедрение КРОК-НСИ
 
Управление данными (хранилища данных и OLAP)
Управление данными (хранилища данных и OLAP)Управление данными (хранилища данных и OLAP)
Управление данными (хранилища данных и OLAP)
 
Cеть передачи данных как кровеносная система оператора
Cеть передачи данных как кровеносная система оператораCеть передачи данных как кровеносная система оператора
Cеть передачи данных как кровеносная система оператора
 
Новые сервисы для Retail & Distribution
Новые сервисы для Retail & DistributionНовые сервисы для Retail & Distribution
Новые сервисы для Retail & Distribution
 
Стратегия и тактика улучшения производительности BSS систем оператора мобильн...
Стратегия и тактика улучшения производительности BSS систем оператора мобильн...Стратегия и тактика улучшения производительности BSS систем оператора мобильн...
Стратегия и тактика улучшения производительности BSS систем оператора мобильн...
 
Informatica Пронет (v.0.3)
Informatica   Пронет (v.0.3)Informatica   Пронет (v.0.3)
Informatica Пронет (v.0.3)
 
Презентация Microsoft PowerPoint
Презентация Microsoft PowerPointПрезентация Microsoft PowerPoint
Презентация Microsoft PowerPoint
 
ОЦО: Решение на базе ECM платформы LanDocs и ABBYY FlexiCapture
ОЦО: Решение на базе ECM платформы LanDocs и ABBYY FlexiCapture ОЦО: Решение на базе ECM платформы LanDocs и ABBYY FlexiCapture
ОЦО: Решение на базе ECM платформы LanDocs и ABBYY FlexiCapture
 
Новая платформа сбора показателей
Новая платформа сбора показателейНовая платформа сбора показателей
Новая платформа сбора показателей
 
Логическая витрина данных
Логическая витрина данныхЛогическая витрина данных
Логическая витрина данных
 
СМЭВ СПб и веб-службы на основе SOAP
СМЭВ СПб и веб-службы на основе SOAP СМЭВ СПб и веб-службы на основе SOAP
СМЭВ СПб и веб-службы на основе SOAP
 
Инфо-драйверы роста бизнеса
Инфо-драйверы роста бизнесаИнфо-драйверы роста бизнеса
Инфо-драйверы роста бизнеса
 
IT Management
IT ManagementIT Management
IT Management
 
1С:Управление холдингом 8
1С:Управление холдингом 81С:Управление холдингом 8
1С:Управление холдингом 8
 
Papyrus: общая презентация
Papyrus: общая презентацияPapyrus: общая презентация
Papyrus: общая презентация
 
Продукты и решения Informatica
Продукты и решения  InformaticaПродукты и решения  Informatica
Продукты и решения Informatica
 
VDEL Open Source Enterprise IT Solutions Overview
VDEL Open Source Enterprise IT Solutions OverviewVDEL Open Source Enterprise IT Solutions Overview
VDEL Open Source Enterprise IT Solutions Overview
 

Plus de rusbase

Алексей Благирев, "Открытие" — FinTech Russia 2017
Алексей Благирев, "Открытие" — FinTech Russia 2017Алексей Благирев, "Открытие" — FinTech Russia 2017
Алексей Благирев, "Открытие" — FinTech Russia 2017
rusbase
 

Plus de rusbase (20)

Робоэдвайзинг
РобоэдвайзингРобоэдвайзинг
Робоэдвайзинг
 
Как чат-боты меняют банковское обслуживание
Как чат-боты меняют банковское обслуживание Как чат-боты меняют банковское обслуживание
Как чат-боты меняют банковское обслуживание
 
Как удаленная идентификация повлияет на бизнес модели в финансовой сфере
Как удаленная идентификация повлияет на бизнес модели в финансовой сфере Как удаленная идентификация повлияет на бизнес модели в финансовой сфере
Как удаленная идентификация повлияет на бизнес модели в финансовой сфере
 
Как социальные сети влияют на скоринг
Как социальные сети влияют на скоринг Как социальные сети влияют на скоринг
Как социальные сети влияют на скоринг
 
Искусственный интеллект в кредитном скоринге
Искусственный интеллект в кредитном скорингеИскусственный интеллект в кредитном скоринге
Искусственный интеллект в кредитном скоринге
 
P2P кредитование и народное поручительство
P2P кредитование и народное поручительство P2P кредитование и народное поручительство
P2P кредитование и народное поручительство
 
Francis Bakos, Vitality - FinTech Russia
Francis Bakos, Vitality - FinTech RussiaFrancis Bakos, Vitality - FinTech Russia
Francis Bakos, Vitality - FinTech Russia
 
Руслан Юсуфов, Страхование от кибер-атак - FinTech Russia
Руслан Юсуфов, Страхование от кибер-атак - FinTech RussiaРуслан Юсуфов, Страхование от кибер-атак - FinTech Russia
Руслан Юсуфов, Страхование от кибер-атак - FinTech Russia
 
Алексей Краснопольский, Онлайн-кассы - FinTech Russia
Алексей Краснопольский, Онлайн-кассы - FinTech RussiaАлексей Краснопольский, Онлайн-кассы - FinTech Russia
Алексей Краснопольский, Онлайн-кассы - FinTech Russia
 
Иван Беров, Digital Identity - FinTech Russia
Иван Беров, Digital Identity - FinTech RussiaИван Беров, Digital Identity - FinTech Russia
Иван Беров, Digital Identity - FinTech Russia
 
Алексей Катрич, IoT в InsurTech - FinTech Russia
Алексей Катрич, IoT в InsurTech - FinTech RussiaАлексей Катрич, IoT в InsurTech - FinTech Russia
Алексей Катрич, IoT в InsurTech - FinTech Russia
 
Алексей Архипов, Мастерчейн - FinTech Russia
Алексей Архипов, Мастерчейн  - FinTech RussiaАлексей Архипов, Мастерчейн  - FinTech Russia
Алексей Архипов, Мастерчейн - FinTech Russia
 
Максим Григорьев, Удаленная идентификация - FinTech Russia
Максим Григорьев, Удаленная идентификация - FinTech RussiaМаксим Григорьев, Удаленная идентификация - FinTech Russia
Максим Григорьев, Удаленная идентификация - FinTech Russia
 
Александр Кузьмин, PSD2 - FinTech Russia
Александр Кузьмин, PSD2 - FinTech RussiaАлександр Кузьмин, PSD2 - FinTech Russia
Александр Кузьмин, PSD2 - FinTech Russia
 
Алексей Благирев, "Открытие" — FinTech Russia 2017
Алексей Благирев, "Открытие" — FinTech Russia 2017Алексей Благирев, "Открытие" — FinTech Russia 2017
Алексей Благирев, "Открытие" — FinTech Russia 2017
 
Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017
Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017
Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017
 
Владислав Лисицкий — Rubbles — ICBDA2016
Владислав Лисицкий — Rubbles — ICBDA2016Владислав Лисицкий — Rubbles — ICBDA2016
Владислав Лисицкий — Rubbles — ICBDA2016
 
Андрей Созыкин — ИММ УрО РАН — ICDBA2016
Андрей Созыкин — ИММ УрО РАН — ICDBA2016Андрей Созыкин — ИММ УрО РАН — ICDBA2016
Андрей Созыкин — ИММ УрО РАН — ICDBA2016
 
Александр Яшкин – FANUC Russia – ICBDA2016
Александр Яшкин – FANUC Russia – ICBDA2016Александр Яшкин – FANUC Russia – ICBDA2016
Александр Яшкин – FANUC Russia – ICBDA2016
 
Евгений Быков – Телум – ICBDA2016
Евгений Быков – Телум – ICBDA2016Евгений Быков – Телум – ICBDA2016
Евгений Быков – Телум – ICBDA2016
 

Александр Мигаловский — ГНИВЦ ФНС России — ICBDA 2015

  • 1. Применение технологии “Больших данных” в ФНС России (АСК НДС-2) Москва 2015
  • 2. Причины и основания для создания АСК НДС-2 О налоге на добавленную стоимость Налог на добавленную стоимость являются одним из важнейших источников формирования доходной части бюджета РФ. На НДС приходится около 40% поступлений в Федеральный бюджет. С точки зрения механизма исчисления, НДС достаточно простой налог, но достаточно уязвимый с точки зрения создания схем уклонения от его уплаты. Основания для создания автоматизации контроля за уплатой НДС Основой для создания средств автоматизированного контроля за уплатой НДС является Федеральный закон от 28.06.2013 № 134-ФЗ «О внесении изменений в отдельные законодательные акты Российской Федерации в части противодействия незаконным финансовым операциям». В соответствии с требованиями 134 –ФЗ плательщик НДС обязан с 1-го квартала 2015 года подавать декларацию по НДС, которая будет включать сведения из книг продаж и покупок, журналов учета выставленных и полученных счетов-фактур. Реализация требований 134 –ФЗ дала возможность осуществлять автоматизированную проверку обоснованности вычета НДС, путем осуществления сопоставление сведений, представленных контрагентами. Автоматизированная проверка уплаты НДС была реализована путем создания системы АСК НДС-2.
  • 3. Общее описание решения Модуль Он-лайн сервисов проверки контрагентов АРМ Федеральные информационные ресурсы Данные контрагентов для проверки Модуль сопоставления Кластер серверов Hadoop Комплекс взаимодействия с налогоплательщиками Модуль камеральной налоговой проверки Oracle Exadata Результаты Сопоставлений и данные по декларациям Налогоплательщик Требования о предоставлении пояснений Налоговые декларации Данные из ФИР Данные из ФИР Данные из книг и журналов налоговых деклараций Основные этапы обработки данных в АСК НДС-2: • Прием налоговых деклараций • Обработка данных НД • Взаимодействие с ИФНС • Взаимодействие с налогоплательщиками
  • 4. Характеристика обрабатываемых данных Проектные требования: • Плательщиков НДС - 1,5 миллиона • Количество поданных деклараций – 2 миллиона • Количество записей о СФ подлежащих сопоставлению – 3 миллиарда Реальные характеристики : • Количество поданных деклараций до 1,5 миллиона. • Количество записей о СФ подлежащих сопоставлению - до 1 миллиарда Особенности обработки и использования данных Объем данных за один налоговый период (квартал) Срок хранения данных и участия их в сопоставлениях - 7 лет Система должна поддерживает работу 30 000 пользователей в том числе 2 000 одновременно работающих пользователей Время ответа на зарос не более секунды на запросах до 1000 записей не более 5 секунд на запросах в 100 000 записей Ежесуточное технологическое окно на обработку данных - 5 часов Во время интерактивного обслуживания пользователей обработка данных не осуществляется Налогоплательщик имеет право поменять представленные данные неограниченное количество раз Рассчитанные расхождения могут многократно открываться, закрываться, менять значения атрибутов
  • 5. Эволюция архитектуры Сервер обеспечения взаимодействия Расчет сводных данных Отбор расхождений в выборки Предоставление доступа к первичной информации Расчет агрегатов Кластер серверов Hadoop 16 узлов HDFS Низкие характеристики производительности пакетной обработки Большое время выполнения интерактивных запросов Сложный интерфейс разработки Модуль сопоставления Выполнение логических проверок Расчет КС Сопоставлениезаписей о СФ Расчет расхождений Hbase Информации о записях о СФ Информации о расхождениях Агрегаты Oracle Exadata Сводные данные по декларациям Данные бизнес-процесса Агрегаты 1
  • 6. Эволюция архитектуры Сервер обеспечения взаимодействия Расчет сводных данных Отбор расхождений в выборки Предоставление доступа к первичной информации Расчет агрегатов Кластер серверов Hadoop 16 узлов HDFS Низкие характеристики производительности пакетной обработки Большое время выполнения интерактивных запросов Сложный интерфейс разработки Модуль сопоставления Выполнение логических проверок Расчет КС Сопоставлениезаписей о СФ Расчет расхождений Hbase Информации о записях о СФ Информации о расхождениях Агрегаты Oracle Exadata Сводные данные по декларациям Данные бизнес-процесса Агрегаты 1 SPARK Расчет сводных данных Отбор расхождений в выборки Предоставление доступа к первичной информации Расчет агрегатов Кластер серверов Hadoop 16 узлов HDFS Модуль сопоставления Выполнение логических проверок Расчет КС Сопоставлениезаписей о СФ Расчет расхождений Hbase Хранение информации о записях о СФ Хранение информации о расхождениях Хранение агрегатов Oracle Exadata Сводные данные по декларациям Данные бизнес-процесса Агрегаты 2 Нестабильность работы Большое время выполнения интерактивных запросов
  • 7. Эволюция архитектуры Сервер обеспечения взаимодействия Расчет сводных данных Отбор расхождений в выборки Предоставление доступа к первичной информации Расчет агрегатов Кластер серверов Hadoop 16 узлов HDFS Низкие характеристики производительности пакетной обработки Большое время выполнения интерактивных запросов Сложный интерфейс разработки Модуль сопоставления Выполнение логических проверок Расчет КС Сопоставлениезаписей о СФ Расчет расхождений Hbase Информации о записях о СФ Информации о расхождениях Агрегаты Oracle Exadata Сводные данные по декларациям Данные бизнес-процесса Агрегаты 1 SPARK Расчет сводных данных Отбор расхождений в выборки Предоставление доступа к первичной информации Расчет агрегатов Кластер серверов Hadoop 16 узлов HDFS Модуль сопоставления Выполнение логических проверок Расчет КС Сопоставлениезаписей о СФ Расчет расхождений Hbase Хранение информации о записях о СФ Хранение информации о расхождениях Хранение агрегатов Oracle Exadata Сводные данные по декларациям Данные бизнес-процесса Агрегаты 2 Нестабильность работы Большое время выполнения интерактивных запросов Hive 2.0.0 (TEZ-LLAP) Расчет расхождений Расчет сводных данных Отбор расхождений в выборки Предоставление доступа к первичной информации Кластер серверов Hadoop 16 узлов HDFS Модуль сопоставления Выполнение логических проверок Расчет КС Сопоставлениезаписей о СФ Hbase Oracle Exadata Данные бизнес-процесса 3 ORC Хранениеинформации о записях о СФ Хорошие характеристики производительности при пакетной обработке. Удобный интерфейс разработки Проблемы с большим количеством одновременных запросов Длительное время отклика
  • 8. Эволюция архитектуры Сервер обеспечения взаимодействия Расчет сводных данных Отбор расхождений в выборки Предоставление доступа к первичной информации Расчет агрегатов Кластер серверов Hadoop 16 узлов HDFS Низкие характеристики производительности пакетной обработки Большое время выполнения интерактивных запросов Сложный интерфейс разработки Модуль сопоставления Выполнение логических проверок Расчет КС Сопоставлениезаписей о СФ Расчет расхождений Hbase Информации о записях о СФ Информации о расхождениях Агрегаты Oracle Exadata Сводные данные по декларациям Данные бизнес-процесса Агрегаты 1 SPARK Расчет сводных данных Отбор расхождений в выборки Предоставление доступа к первичной информации Расчет агрегатов Кластер серверов Hadoop 16 узлов HDFS Модуль сопоставления Выполнение логических проверок Расчет КС Сопоставлениезаписей о СФ Расчет расхождений Hbase Хранение информации о записях о СФ Хранение информации о расхождениях Хранение агрегатов Oracle Exadata Сводные данные по декларациям Данные бизнес-процесса Агрегаты 2 Нестабильность работы Большое время выполнения интерактивных запросов Hive 2.0.0 (TEZ-LLAP) Расчет расхождений Расчет сводных данных Отбор расхождений в выборки Предоставление доступа к первичной информации Кластер серверов Hadoop 16 узлов HDFS Модуль сопоставления Выполнение логических проверок Расчет КС Сопоставлениезаписей о СФ Hbase Oracle Exadata Данные бизнес-процесса 3 ORC Хранениеинформации о записях о СФ Хорошие характеристики производительности при пакетной обработке. Удобный интерфейс разработки Проблемы с большим количеством одновременных запросов Длительное время отклика Hive 2.0.0 (TEZ-LLAP) Расчет расхождений Расчет сводных данных Расчет агрегатов Отбор расхождений в выборки Предоставление доступа к первичной информацииКластер серверов Hadoop 16 узлов HDFS Характеристики соответствующие требованиям Модуль сопоставления Выполнение логических проверок Расчет КС Сопоставлениезаписей о СФ Hbase Oracle Exadata Данные бизнес-процесса 4 ORC Хранениеинформации о записях о СФ Impala Хранениезаписей о СФ Отбор расхождений в выборки Предоставление доступа к первичной информации Parquet
  • 9. Текущее состояние и планы развития В настоящее время реализован базовый функционал: • Централизованный доступ к информации предоставленной НП • Автоматизированная обработка представленной НП информации • Автоматизированное взаимодействие с налогоплательщиком в части отправки им требований и получения от них ответов • Средства оперативной и аналитической обработки полученной информации Основные направления развития: • Расчёт и контроль KPI процесса камерального контроля • Использование в АСК НДС-2 сведений об уплате других налогов • Использование данных других федеральных ведомств. • Реализация поиск схем уклонения от уплаты НДС с использованием методов прогностического моделирования с целью выявления определенных закономерностей и систематических взаимосвязей между переменными, которые затем можно применить к новым совокупностям данных