AI 101
데이터 패브릭이란 무엇입니까?
By
알렉스 맥팔랜드차례
종종 인공 지능(AI) 및 기계 학습(ML)과 연관되는 데이터 패브릭은 원시 데이터를 비즈니스 인텔리전스로 변환하는 주요 도구 중 하나입니다.
그러나 데이터 패브릭이 정확히 무엇입니까?
데이터 패브릭은 엔터프라이즈 내에서 데이터 자산, 데이터베이스 및 데이터베이스 아키텍처의 통합 컬렉션을 제공하는 아키텍처 및 소프트웨어입니다. 지능적이고 자동화된 시스템을 사용하여 다양한 데이터 파이프라인과 클라우드 환경의 종단 간 통합을 용이하게 합니다.
하이브리드 클라우드, 사물 인터넷(IoT), AI 및 에지 컴퓨팅으로 주요 개발이 계속 진행됨에 따라 데이터 패브릭이 더욱 중요해졌습니다. 이로 인해 빅 데이터가 엄청나게 증가했으며, 이는 조직이 관리해야 할 것이 훨씬 더 많다는 것을 의미합니다.
이 빅 데이터를 처리하기 위해 기업은 데이터 사일로, 보안 위험 및 의사 결정의 병목 현상과 같은 몇 가지 문제를 제기한 데이터 환경의 통합 및 거버넌스에 집중해야 합니다. 이러한 문제로 인해 데이터 관리 팀은 데이터 시스템을 통합하고, 개인 정보 보호 및 보안을 강화하고, 거버넌스를 개선하고, 작업자에게 더 많은 데이터 접근성을 제공하는 데 도움이 되는 데이터 패브릭 솔루션을 채택하게 되었습니다.
데이터 통합은 더 많은 데이터 중심의 의사 결정으로 이어지며 기업은 역사적으로 비즈니스의 특정 측면에 대해 서로 다른 데이터 플랫폼을 사용해 왔지만 데이터 패브릭을 통해 데이터를 보다 일관성 있게 볼 수 있습니다. 이 모든 것이 고객 라이프사이클에 대한 더 나은 이해로 이어지고 데이터 간의 연결을 설정하는 데 도움이 됩니다.
데이터 패브릭의 목적은 무엇입니까?
데이터 패브릭은 위치, 데이터베이스 연결 또는 구조에 관계없이 정보에 대한 액세스를 용이하게 하는 연결된 데이터의 통합 보기를 설정하는 데 사용됩니다. 데이터 패브릭은 또한 AI 및 기계 학습을 통해 분석을 단순화합니다.
데이터 패브릭의 또 다른 목적은 기존 애플리케이션 및 데이터베이스 사일로와 별도로 정보에 액세스하기 위한 공통 모델을 생성하므로 애플리케이션 개발을 용이하게 하는 것입니다. 이러한 모델은 더 나은 정보 액세스를 제공하지만 모든 리소스에서 데이터 액세스를 관리할 수 있는 단일 계층을 설정하여 효율성도 향상시킵니다.
데이터 패브릭을 위한 단일 데이터 아키텍처는 없지만 이러한 유형의 데이터 프레임워크에는 XNUMX가지 기본 구성 요소가 있다고 종종 말합니다.
자료 관리: 데이터 거버넌스 및 데이터 보안을 담당합니다.
데이터 수집: 클라우드 데이터를 통합하고 구조화된 데이터와 구조화되지 않은 데이터 간의 연결을 식별합니다.
데이터 처리: 데이터 추출을 위해 관련 데이터만 표시되도록 데이터를 세분화합니다.
데이터 오케스트레이션: 비즈니스 전반에서 데이터를 사용할 수 있도록 데이터 변환, 통합 및 정리를 담당하는 매우 중요한 프레임워크 계층입니다.
데이터 검색: 데이터 소스를 통합하는 새로운 방법을 제시합니다.
데이터 접근: 데이터 소비를 활성화하고, 특정 팀이 규정을 준수할 수 있도록 올바른 권한을 부여하고, 대시보드 및 기타 데이터 시각화 도구를 사용하여 관련 데이터를 표시하도록 돕습니다.
데이터 패브릭의 이점
데이터 패브릭에는 다음과 같은 많은 비즈니스 및 기술 이점이 있습니다.
데이터 사일로 파괴: 최신 데이터베이스가 애플리케이션 그룹과 연결되어 있고 기업에 새로운 데이터베이스가 추가됨에 따라 성장하는 경우가 많기 때문에 현대 기업은 데이터 사일로로 인해 어려움을 겪는 경우가 많습니다. 데이터 사일로는 다양한 구조와 형식의 데이터를 보유하지만 데이터 패브릭은 기업 정보에 대한 액세스를 개선하고 수집된 데이터를 사용하여 운영 효율성을 개선할 수 있습니다.
데이터베이스 통합: 데이터 패브릭은 또한 회사가 넓은 지역에 분산된 데이터베이스를 통합하는 데 도움이 됩니다. 위치 차이로 인해 액세스 장벽이 발생하지 않도록 합니다. 데이터 패브릭은 애플리케이션 개발을 단순화하고 다른 애플리케이션에서 데이터에 대한 액세스를 어렵게 하지 않으면서 특정 애플리케이션 데이터 사용을 최적화하는 데 사용할 수 있습니다. 또한 이미 사일로로 이동한 데이터를 통합할 수도 있습니다.
정보에 액세스하는 단일 방법: 데이터 패브릭은 애플리케이션 이식성을 개선하고 클라우드와 데이터 센터 모두에서 정보에 액세스하는 단일 방법으로 작동합니다.
빠른 속도로 인사이트 생성: 데이터 패브릭 솔루션은 복잡한 데이터 세트를 쉽게 처리할 수 있으므로 통찰력을 얻는 시간을 단축할 수 있습니다. 그들의 아키텍처는 사전 구축된 분석 모델과 인지 알고리즘을 통해 규모와 속도로 데이터를 처리할 수 있습니다.
기술 및 비기술 사용자가 사용: 데이터 패브릭은 기술 사용자만을 대상으로 하지 않습니다. 아키텍처는 유연하며 광범위한 사용자 인터페이스와 함께 사용할 수 있습니다. 비즈니스 경영진이 이해할 수 있는 대시보드를 구축하거나 데이터 과학자가 데이터를 탐색하는 데 정교한 도구를 사용할 수 있습니다.
데이터 패브릭 구현을 위한 모범 사례
글로벌 데이터 시장은 지속적으로 확장되고 있으며 공간에 대한 강력한 수요가 있습니다. 많은 회사에서 엔터프라이즈 데이터를 최적화하기 위해 데이터 아키텍처를 구현하려고 하며 몇 가지 일반적인 모범 사례를 따릅니다.
그러한 관행 중 하나는 DataOps 프로세스 모델을 수용하는 것입니다. 데이터 패브릭과 DataOps는 동일하지 않지만 DataOps 모델에 따르면 데이터 프로세스, 도구 및 사용자 간에 긴밀한 연결이 있습니다. 데이터에 의존하도록 사용자를 조정함으로써 도구를 활용하고 인사이트를 적용할 수 있습니다. DataOps 모델이 없으면 사용자는 데이터 패브릭에서 충분히 추출하는 데 어려움을 겪을 수 있습니다.
또 다른 모범 사례는 데이터 패브릭을 또 다른 데이터 레이크로 전환하는 것을 피하는 것입니다. 이는 흔히 발생합니다. 예를 들어 데이터 원본 및 분석과 같은 모든 아키텍처 구성 요소가 있지만 API 및 SDK는 없는 경우 진정한 데이터 패브릭을 얻을 수 없습니다. 데이터 패브릭은 단일 기술이 아닌 아키텍처 설계를 의미합니다. 아키텍처의 특징 중 일부는 구성 요소 간의 상호 운용성과 통합 준비성입니다.
조직이 규정 준수 및 규정 요구 사항을 이해하는 것도 중요합니다. 데이터 패브릭 아키텍처는 보안, 거버넌스 및 규정 준수를 개선할 수 있습니다.
데이터가 시스템 전체에 분산되지 않기 때문에 민감한 데이터 노출의 위협이 적습니다. 즉, 데이터 패브릭을 구현하기 전에 규정 준수 및 규제 요구 사항을 이해하는 것이 중요합니다. 서로 다른 데이터 유형은 서로 다른 규제 관할권에 속할 수 있습니다. 한 가지 솔루션은 데이터 변환이 법률을 준수하도록 보장하는 자동화된 규정 준수 정책을 사용하는 것입니다.
데이터 패브릭 사용 사례
데이터 패브릭에는 다양한 용도가 있지만 몇 가지는 매우 일반적입니다. 그러한 일반적인 예 중 하나는 액세스 및 분석을 용이하게 하기 위해 지리적으로 다양한 데이터 자산의 가상/논리적 수집입니다. 이 경우 데이터 패브릭은 일반적으로 중앙 집중식 비즈니스 관리에 사용됩니다. 데이터를 수집하고 사용하는 분산 라인 작업은 기존 애플리케이션 및 데이터 액세스/쿼리 인터페이스를 통해 지원되기 때문에 활동이 지역 또는 국가적으로 세분화된 조직은 많은 것을 얻을 수 있습니다. 이러한 조직에는 종종 중앙 관리 및 조정이 필요합니다.
데이터 패브릭의 또 다른 주요 사용 사례는 합병 또는 인수 후 통합 데이터 모델을 구축하는 것입니다. 이러한 일이 발생하면 이전에 독립된 조직의 데이터베이스 및 데이터 관리 정책이 자주 변경되므로 조직 경계를 넘어 정보를 수집하기가 더 어려워집니다. 데이터 패브릭은 결합된 엔터티가 단일 데이터 모델에서 조화를 이룰 수 있도록 데이터의 통합 보기를 생성하여 이를 극복할 수 있습니다.
Alex McFarland는 인공 지능의 최신 개발을 탐구하는 AI 저널리스트이자 작가입니다. 그는 전 세계 수많은 AI 스타트업 및 출판물과 협력해 왔습니다.