В результате всемирного использования электронных устройств и повсеместного генерирования и наличия цифровой информации кардинально изменился характер данных, которые генерируются теперь постоянно и в огромных количествах и которые мы называем большими данными.
В настоящее время важнейшие и наиболее сложные современные проблемы интеллектуального анализа данных относятся к разделу «Большие данные». Понятие больших данных введено в научном сообществе специалистов по анализу данных относительно недавно.
Эти данные обладают важными отличительными свойствами, которые отличают их от данных, получаемых из традиционных источников. Данные, получаемые из этих инновационных источников, обладают исключительно широким диапазоном распределения, неорганизованной структурой, огромным объемом и часто поступают в масштабе реального времени.
Более достоверная информация и статистические данные помогут органам государственной власти отслеживать результаты проделанной работы и гарантируют принятие ими решений на достоверной основе.
Большие данные представляют собой источник информации, который не может игнорироваться официальной статистикой.
В статье определяется стратегическая ценность больших данных для официальной статистики, рассматриваются вопросы организации взаимодействия статистической службы с пользователями, интеграции данных из разных источников, интеллектуальной работы с информацией в условиях цифровизации экономики.
В статье раскрывается содержание понятия «большие данные», даются его характеристики, аргументируются возможности использования больших данных для подготовки официальной статистики, а также показываются связанные с этим проблемы.
Ключевые слова: цифровая экономика, данные, большие данные, официальная статистика, административные данные, конфиденциальность информации, нагрузка на респондентов, международные статистические стандарты, интеграция данных.