AI 101
데이터 패브릭이란 무엇인가?

데이터 패브릭은 종종 인공 지능(AI) 및 머신 러닝(ML)과 연관되어 있으며, 원시 데이터를 비즈니스 인텔리전스로 변환하는 주요 도구 중 하나입니다.
그렇다면 데이터 패브릭이 정확히 무엇일까요?
데이터 패브릭은 기업 내에서 통합된 데이터 자산, 데이터베이스 및 데이터베이스 아키텍처 모음을 제공하는 아키텍처 및 소프트웨어입니다. 이는 지능형 및 자동화 시스템을 사용하여 다양한 데이터 파이프라인과 클라우드 환경의 종단 간 통합을 용이하게 합니다.
하이브리드 클라우드, 사물인터넷(IoT), AI 및 에지 컴퓨팅 분야에서 주요 발전이 계속되면서 데이터 패브릭은 더욱 중요해졌습니다. 이로 인해 빅데이터가 급격히 증가했으며, 이는 조직이 관리해야 할 것이 더 많아졌음을 의미합니다.
이러한 빅데이터를 처리하기 위해 기업은 데이터 환경의 통합과 거버넌스에 집중해야 하며, 이는 데이터 사일로, 보안 위험, 의사 결정의 병목 현상과 같은 여러 과제를 제기했습니다. 이러한 과제들이 데이터 관리 팀이 데이터 패브릭 솔루션을 채택하게 된 이유이며, 이 솔루션은 데이터 시스템을 통합하고, 개인정보 보호 및 보안을 강화하며, 거버넌스를 개선하고, 직원들에게 더 많은 데이터 접근성을 제공하는 데 도움이 됩니다.
데이터 통합은 더 많은 데이터 기반 의사 결정으로 이어지며, 기업들은 역사적으로 비즈니스의 특정 측면에 대해 서로 다른 데이터 플랫폼을 사용해 왔지만, 데이터 패브릭은 데이터를 더욱 통합적으로 볼 수 있게 합니다. 이 모든 것은 고객 생애주기에 대한 더 나은 이해로 이어지며, 데이터 간의 연결을 설정하는 데 도움이 됩니다.
데이터 패브릭의 목적은 무엇인가?
데이터 패브릭은 관련 데이터에 대한 통합된 뷰를 설정하는 데 사용되며, 이는 데이터의 위치, 데이터베이스 연관성 또는 구조에 관계없이 정보에 대한 접근을 용이하게 합니다. 데이터 패브릭은 또한 AI 및 머신 러닝을 통한 분석을 단순화합니다.
데이터 패브릭의 또 다른 목적은 애플리케이션 개발을 용이하게 하는 것입니다. 이는 기존의 애플리케이션 및 데이터베이스 사일로와 분리된 정보 접근을 위한 공통 모델을 생성하기 때문입니다. 이러한 모델은 더 나은 정보 접근성을 제공할 뿐만 아니라, 모든 리소스에 걸쳐 데이터 접근을 관리할 수 있는 단일 계층을 설정함으로써 효율성을 향상시킵니다.
데이터 패브릭을 위한 단일한 데이터 아키텍처는 없지만, 이러한 유형의 데이터 프레임워크에는 일반적으로 여섯 가지 기본 구성 요소가 있다고 말합니다:
-
데이터 관리: 데이터 거버넌스 및 데이터 보안을 담당합니다.
-
데이터 수집: 클라우드 데이터를 함께 모으고 구조화된 데이터와 비구조화된 데이터 간의 연결을 식별합니다.
-
데이터 처리: 데이터를 정제하여 데이터 추출을 위해 관련 데이터만 표면화되도록 합니다.
-
데이터 오케스트레이션: 데이터를 변환, 통합 및 정제하여 비즈니스 전반에서 사용할 수 있도록 하는 매우 중요한 프레임워크 계층입니다.
-
데이터 발견: 데이터 소스를 통합하는 새로운 방법을 표면화합니다.
-
데이터 접근: 데이터의 소비를 가능하게 하고, 규정 준수를 위해 특정 팀에 대한 올바른 권한을 보장하며, 대시보드 및 기타 데이터 시각화 도구를 사용하여 관련 데이터를 표면화하는 데 도움이 됩니다.
데이터 패브릭의 이점
데이터 패브릭에는 다음과 같은 많은 비즈니스 및 기술적 이점이 있습니다:
-
데이터 사일로 해체: 현대 비즈니스는 종종 데이터 사일로로 어려움을 겪습니다. 현대 데이터베이스는 애플리케이션 그룹과 연관되어 있으며 기업에 새로운 애플리케이션이 추가됨에 따라 종종 성장하기 때문입니다. 데이터 사일로는 서로 다른 구조와 형식의 데이터를 보유하지만, 데이터 패브릭은 기업 정보에 대한 접근성을 향상시키고 수집된 데이터를 사용하여 운영 효율성을 개선할 수 있습니다.
-
데이터베이스 통합: 데이터 패브릭은 또한 넓은 지역에 분산된 데이터베이스를 통합하는 데 기업을 도와줍니다. 이는 위치 차이가 접근 장벽으로 이어지지 않도록 합니다. 데이터 패브릭은 애플리케이션 개발을 단순화하고, 다른 애플리케이션의 데이터 접근성을 떨어뜨리지 않으면서 특정 애플리케이션 데이터 사용을 최적화하는 데 사용될 수 있습니다. 또한 이미 사일로로 이동한 데이터를 통합할 수도 있습니다.
-
정보 접근을 위한 단일 방법: 데이터 패브릭은 애플리케이션 이식성을 개선하고 클라우드와 데이터 센터 모두에서 정보에 접근하는 단일 방법으로 작동합니다.
-
가속화된 속도로 인사이트 생성: 데이터 패브릭 솔루션은 복잡한 데이터 세트를 쉽게 처리할 수 있어 인사이트 도출 시간을 가속화합니다. 그 아키텍처는 사전 구축된 분석 모델과 인지 알고리즘이 규모와 속도로 데이터를 처리할 수 있게 합니다.
-
기술적 및 비기술적 사용자 모두 사용: 데이터 패브릭은 기술 사용자만을 대상으로 하지 않습니다. 아키텍처는 유연하며 다양한 사용자 인터페이스와 함께 사용할 수 있습니다. 비즈니스 임원이 이해할 수 있는 대시보드를 구축하는 데 도움이 되거나, 데이터 과학자가 데이터 탐색을 위해 정교한 도구를 사용할 수 있습니다.
데이터 패브릭 구현을 위한 모범 사례
글로벌 데이터 시장은 지속적으로 확장되고 있으며, 이 분야에서 강력한 수요가 있습니다. 많은 기업들은 기업 데이터를 최적화하기 위해 데이터 아키텍처를 구현하려고 하며, 몇 가지 일반적인 모범 사례를 따릅니다.
그러한 사례 중 하나는 DataOps 프로세스 모델을 채택하는 것입니다. 데이터 패브릭과 DataOps는 동일하지 않지만, DataOps 모델에 따르면 데이터 프로세스, 도구 및 사용자 간에 긴밀한 연결성이 있습니다. 사용자가 데이터에 의존하도록 정렬함으로써, 그들은 도구를 활용하고 인사이트를 적용할 수 있습니다. DataOps 모델이 없으면 사용자는 데이터 패브릭에서 충분한 것을 추출하는 데 어려움을 겪을 수 있습니다.
또 다른 모범 사례는 데이터 패브릭을 또 다른 데이터 레이크로 전락시키지 않는 것입니다. 이는 흔히 발생하는 일입니다. 예를 들어, 데이터 소스 및 분석과 같은 모든 아키텍처 구성 요소가 있지만 API와 SDK가 하나도 없다면 진정한 데이터 패브릭을 달성할 수 없습니다. 데이터 패브릭은 단일 기술이 아닌 아키텍처 설계를 의미합니다. 그리고 이 아키텍처의 정의적 특성 중 일부는 구성 요소 간의 상호 운용성과 통합 준비 상태입니다.
조직이 자사의 규정 준수 및 규제 요구 사항을 이해하는 것도 중요합니다. 데이터 패브릭 아키텍처는 보안, 거버넌스 및 규제 준수를 개선할 수 있습니다.
데이터가 시스템 전체에 흩어져 있지 않기 때문에 민감한 데이터 노출 위협이 더 적습니다. 그렇다고는 하지만, 데이터 패브릭을 구현하기 전에 규정 준수 및 규제 요구 사항을 이해하는 것이 중요합니다. 서로 다른 데이터 유형은 서로 다른 규제 관할권에 속할 수 있습니다. 한 가지 해결책은 데이터 변환이 법률을 준수하도록 보장하는 자동화된 규정 준수 정책을 사용하는 것입니다.
데이터 패브릭 사용 사례
데이터 패브릭에는 많은 다양한 용도가 있지만, 몇 가지는 매우 일반적입니다. 그러한 일반적인 예 중 하나는 접근 및 분석을 용이하게 하기 위해 지리적으로 다양한 데이터 자산을 가상/논리적으로 수집하는 것입니다. 이 경우 데이터 패브릭은 일반적으로 중앙 집중식 비즈니스 관리에 사용됩니다. 데이터를 수집하고 사용하는 분산 라인 운영이 기존 애플리케이션 및 데이터 접근/쿼리 인터페이스를 통해 지원되기 때문에, 활동에 지역적 또는 국가적 분할이 있는 조직은 많은 것을 얻을 수 있습니다. 이러한 조직들은 종종 중앙 관리와 조정이 필요합니다.
데이터 패브릭의 또 다른 주요 사용 사례는 합병 또는 인수 후 통합 데이터 모델을 수립하는 것입니다. 이러한 일이 발생하면 이전에 독립적이었던 조직의 데이터베이스 및 데이터 관리 정책이 종종 변경되어 조직 경계를 넘어 정보를 수집하는 것이 더 어려워집니다. 데이터 패브릭은 통합된 데이터 뷰를 생성하여 이를 극복할 수 있으며, 이는 합병된 개체가 단일 데이터 모델에 조화를 이룰 수 있게 합니다.












