Озеро данных — это централизованный репозиторий, используемый для приема и хранения больших объемов данных в их исходном виде. Благодаря своей открытой и масштабируемой архитектуре озеро данных может принимать все типы данных из любого источника — структурированного (таблицы баз данных, таблицы Excel), полуструктурированного (XML-файлы, веб-страницы) и неструктурированного (изображения, аудиофайлы, твиты), и все это без ущерба для точности
Озера данных обеспечивают базовую согласованность данных в различных приложениях, позволяя осуществлять аналитику больших данных, машинное обучение, прогнозную аналитику и другие формы интеллектуальных операций
Задачи:
- Организация работы с неструктурированной информацией для извлечения из нее пользы
- Предоставление возможностей работы с любыми типами данных и гибкость при работе с ними
- Возможность иметь максимально широкую и глубокую историю жизнедеятельности компании
- Выстраивание базы знаний под масштабную аналитику