AI 101

κ΅¬μ‘°ν™”λœ 데이터와 λΉ„κ΅¬μ‘°ν™”λœ 데이터

mm

비구조화된 데이터는 사전 정의된 방식이나 특정 데이터 모델이 없는 데이터입니다. 반면에, 구조화된 데이터는 데이터 포인트 간에 명확한 관계가 있는 데이터로, 포함하는 사전 정의된 모델이 있습니다. 이것이 구조화된 데이터와 비구조화된 데이터의 차이입니다. 그러나 두 가지 유형의 데이터에 대해 자세히 살펴보겠습니다.

구조화된 데이터란 무엇입니까?

컴퓨터 과학에서 데이터 구조는 데이터를 저장하고 조직하는 특정 방법을 말합니다. 다양한 데이터 구조는 데이터 포인트 간에 다른 관계를 가지고 있습니다. 그러나 데이터는 비구조화될 수도 있습니다. 데이터가 구조화되었다는 것은 무엇을 의미합니까? 이 정의를 더 명확하게 하기 위해 데이터를 구조화하는 다양한 방법을 살펴보겠습니다.

구조화된 데이터는 종종 Excel 파일이나 SQL 데이터베이스와 같은 테이블에 저장됩니다. 이러한 경우, 데이터의 행과 열은 다른 변수 또는 기능을 가지고 있으며, 데이터 행과 열이 교차하는 곳을 확인하여 데이터 포인트 간의 관계를 알 수 있습니다. 구조화된 데이터는 관계형 데이터베이스에 쉽게 맞출 수 있으며, 구조화된 데이터 세트의 다양한 기능의 예로는 이름, 주소, 날짜, 날씨 통계, 신용 카드 번호 등이 있습니다. 구조화된 데이터는 대부분 텍스트 데이터이지만, 이미지와 오디오를 구조화된 데이터로 저장하는 것도 가능합니다.

구조화된 데이터의 일반적인 출처로는 센서에서 수집된 데이터, 웹 로그, 네트워크 데이터, 소매 또는 전자 상거래 데이터 등이 있습니다. 구조화된 데이터는 또한 사람們이 컴퓨터나 기타 장치에서 수집된 데이터를 스프레드시트 또는 데이터베이스에 입력하여 생성할 수 있습니다. 예를 들어, 온라인 양식에서 수집된 데이터는 종종 즉시 데이터 구조에 입력됩니다.

구조화된 데이터는 관계형 데이터베이스와 SQL에서 오랫동안 저장되어 왔습니다. 이러한 저장 방법은 이러한 형식에서 읽기와 쓰기가 쉽기 때문에 인기가 있습니다. 대부분의 플랫폼과 언어는 이러한 데이터 형식을 해석할 수 있습니다.

기계 학습의 맥락에서 구조화된 데이터는 기계 학습 시스템을 훈련하기가 더 쉽습니다. 왜냐하면 데이터 내의 패턴이 더 명확하기 때문입니다. 특정 기능을 선택하여 기계 학습 분류기에 입력하여 다른 데이터 인스턴스를 해당 기능에 따라 레이블할 수 있습니다. 반면에, 비구조화된 데이터에서 기계 학습 시스템을 훈련하는 것은 더 어려울 수 있습니다. 이유는 뒤에서 명확해질 것입니다.

비구조화된 데이터란 무엇입니까?

비구조화된 데이터는 사전 정의된 데이터 모델 또는 구조에 따라 조직되지 않는 데이터입니다. 비구조화된 데이터는 종종 질적 데이터라고도呼ばれ며, 전통적인 방법으로 구조화된 데이터를 분석하거나 처리하는 방법으로 분석 또는 처리할 수 없습니다.

비구조화된 데이터는 데이터 포인트 간에 정의된 관계가 없으므로 관계형 데이터베이스에 조직할 수 없습니다. 반면에, 비구조화된 데이터가 저장되는 방식은 일반적으로 NoSQL 데이터베이스 또는 비관계형 데이터베이스를 사용하는 것입니다. 데이터베이스의 구조가 거의 문제가되지 않는 경우, NoSQL 데이터베이스 대신 데이터 레이크 또는 큰 비구조화된 데이터 풀을 사용하여 데이터를 저장할 수 있습니다.

비구조화된 데이터는 분석하기가 어렵고, 비구조화된 데이터의 의미를 찾는 것은 종종 개별 데이터 조각을 조사하여 잠재적인 기능을 찾고 해당 기능이 데이터 풀의 다른 데이터 조각에 나타나는지 확인하는 것을 포함합니다.

대부분의 데이터는 비구조화된 형식으로 구성되어 있으며, 비구조화된 데이터가 모든 데이터의 약 80%를 차지한다고 추정됩니다. 데이터 마이닝 기술을 사용하여 데이터를 구조화하는 데 도움이 될 수 있습니다.

기계 학습의 경우, 특정 기술을 사용하여 비구조화된 데이터를 구조화된 데이터로 변환할 수 있습니다. 비구조화된 데이터를 구조화된 데이터로 변환하는 데 사용되는 인기 있는 도구는 오토인코더입니다.

λΈ”λ‘œκ±°μ΄μž ν”„λ‘œκ·Έλž˜λ¨Έλ‘œ Machine Learningκ³Ό Deep Learning μ£Όμ œμ— μ „λ¬Έκ°€μž…λ‹ˆλ‹€. λ‹€λ‹ˆμ—˜μ€ λ‹€λ₯Έ μ‚¬λžŒλ“€μ΄ AI의 νž˜μ„ μ‚¬νšŒμ ε–„μœΌλ‘œ μ‚¬μš©ν•˜λŠ” 것을 돕기λ₯Ό ν¬λ§ν•©λ‹ˆλ‹€.