ИИ 101
Что такое Data Fabric?

Часто ассоциируется с искусственным интеллектом (AI) и машинным обучением (ML), Data Fabric является одним из основных инструментов для преобразования сырых данных в бизнес-интеллект.
Но что именно такое Data Fabric?
Data Fabric – это архитектура и программное обеспечение, которое предлагает унифицированную коллекцию активов данных, баз данных и архитектур баз данных внутри предприятия. Она облегчает конечную интеграцию различных конвейеров данных и облачных сред с помощью использования интеллектуальных и автоматизированных систем.
Data Fabric стала более важной по мере продолжения крупных разработок в области гибридных облачных вычислений, Интернета вещей (IoT), AI и вычислений на краю сети. Это привело к огромному увеличению больших данных, что означает, что организации имеют еще больше данных для управления.
Чтобы справиться с этими большими данными, компании должны сосредоточиться на унификации и управлении средами данных, что вызвало несколько проблем, таких как данные в изоляции, риски безопасности и узкие места в принятии решений. Эти проблемы привели к тому, что команды по управлению данными приняли решения Data Fabric, которые помогают унифицировать системы данных, укрепить конфиденциальность и безопасность, улучшить управление и обеспечить более широкий доступ к данным для сотрудников.
Интеграция данных приводит к более обоснованному принятию решений, и хотя предприятия исторически использовали различные платформы данных для конкретных аспектов бизнеса, Data Fabric позволяет просматривать данные более целостно. Все это приводит к лучшему пониманию цикла жизни клиента и помогает установить связи между данными.
Какова цель Data Fabric?
Data Fabric используется для создания унифицированного представления связанных данных, что облегчает доступ к информации независимо от ее местоположения, ассоциации с базой данных или структуры. Data Fabric также упрощает анализ с помощью AI и машинного обучения.
Другой целью Data Fabric является облегчение разработки приложений, поскольку она создает общую модель для доступа к информации, отдельную от традиционных приложений и баз данных в изоляции. Эти модели обеспечивают лучший доступ к информации, но также улучшают эффективность, устанавливая единый слой, где доступ к данным можно управлять во всех ресурсах.
Хотя нет единой архитектуры данных для Data Fabric, часто говорят, что есть шесть фундаментальных компонентов этой структуры данных:
-
Управление данными: Отвечает за управление данными и безопасность данных.
-
Ввод данных: Объединяет облачные данные и определяет связи между структурированными и неструктурированными данными.
-
Обработка данных: Уточняет данные, чтобы только релевантные данные были доступны для извлечения данных.
-
Оркестровка данных: Очень важный слой структуры, ответственный за преобразование, интеграцию и очистку данных, чтобы они могли быть использованы во всей компании.
-
Обнаружение данных: Показывает новые способы интеграции источников данных.
-
Доступ к данным: Обеспечивает потребление данных, гарантирует правильные разрешения для определенных команд для соблюдения нормативных требований и помогает показать релевантные данные с помощью панелей и других инструментов визуализации данных.
Преимущества Data Fabric
Существует много бизнес- и технических преимуществ Data Fabric, таких как:
-
Разрушить изоляцию данных: Современные компании часто страдают от изоляции данных, поскольку современные базы данных связаны с группами приложений и часто растут по мере добавления новых приложений в компанию. Изоляция данных содержит данные разных структур и форматов, но Data Fabric может улучшить доступ к информации компании и использовать собранные данные для улучшения операционной эффективности.
-
Объединить базы данных: Data Fabric также помогает компаниям объединить базы данных, распределенные по большой территории. Они гарантируют, что различия в местоположении не создают барьеров для доступа. Data Fabric упрощает разработку приложений и может быть использована для оптимизации конкретного использования данных приложением без уменьшения доступности данных для других приложений. Они также могут объединить данные, которые уже перемещены в изоляцию.
-
Единый способ доступа к информации: Data Fabric улучшает переносимость приложений и выступает в качестве единого способа доступа к информации как в облаке, так и в центре данных.
-
Генерировать идеи с ускоренной скоростью: Решения Data Fabric могут легко справиться с сложными наборами данных, что ускоряет время получения информации. Их архитектура позволяет использовать предварительно построенные модели аналитики и когнитивные алгоритмы для обработки данных в масштабе и со скоростью.
-
Используется техническими и нетехническими пользователями: Data Fabric не предназначена только для технических пользователей. Архитектура гибкая и может быть использована с широким спектром интерфейсов пользователя. Они могут помочь построить панели, которые могут быть поняты бизнес-исполнителями, или их сложные инструменты могут быть использованы для исследования данных учеными-данными.
Лучшие практики для реализации Data Fabric
Глобальный рынок данных постоянно расширяется, и существует сильный спрос в этой области. Многие компании стремятся реализовать архитектуру данных для оптимизации своих корпоративных данных и следуют некоторым общим лучшим практикам.
Одной из таких практик является принятие модели процесса DataOps. Data Fabric и DataOps не идентичны, но согласно модели DataOps, существует близкая связь между процессами данных, инструментами и пользователями. Позволяя пользователям полагаться на данные, они могут использовать инструменты и применять идеи. Без модели DataOps пользователи могут испытывать трудности в извлечении достаточно информации из Data Fabric.
Другой лучшей практикой является избежание превращения Data Fabric в еще один хранилище данных, что является распространенным явлением. Например,真正ая Data Fabric не может быть достигнута, если у вас есть все архитектурные компоненты, такие как источники данных и аналитика, но нет API и SDK. Data Fabric относится к архитектурному дизайну, а не к единой технологии. Некоторые из определяющих черт архитектуры – это взаимодействие между компонентами и готовность к интеграции.
Также важно, чтобы организация понимала свои требования к соблюдению нормативных требований и регулированиям. Архитектура Data Fabric может улучшить безопасность, управление и соблюдение нормативных требований.
Поскольку данные не разбросаны по системам, существует меньшая угроза разглашения конфиденциальных данных. Однако важно понять требования к соблюдению нормативных требований и регулированиям перед реализацией Data Fabric. Разные типы данных могут подвергаться разным нормативным юрисдикциям. Одним из решений является использование автоматических политик соблюдения, которые гарантируют, что преобразование данных соответствует законам.
Сценарии использования Data Fabric
Существует много разных вариантов использования Data Fabric, но несколько из них очень распространены. Одним из таких распространенных примеров является виртуальная/логическая коллекция географически распределенных активов данных для облегчения доступа и анализа. Data Fabric обычно используется для централизованного управления бизнесом в этом случае. Поскольку распределенные линии операций, которые собирают и используют данные, поддерживаются через традиционные интерфейсы приложений и доступа/запроса к данным, существует многое, что можно получить организациям, которые имеют региональную или национальную сегментацию своей деятельности. Эти организации часто требуют централизованного управления и координации.
Другим основным случаем использования Data Fabric является создание унифицированной модели данных после слияния или приобретения. Когда эти события происходят, база данных и политика управления данными ранее независимой организации часто меняются, что делает более трудным сбор информации через организационные границы. Data Fabric может преодолеть это, создав унифицированное представление данных, которое позволяет объединенной сущности согласовать единую модель данных.












