์ฌ์ ๋ฆฌ๋
AI์ ‘์ง์’์ด 50๋ ์ ์ธ ๊ฒฝ์ฐ: ๋ฌด์ํ ์ ์๋ ๊ท์ ์ํ

거짓된 AI 통찰력이 등장하는 문제는 기업들이 생성 도구를 사용하는 경우 긴급한 도전이 되고 있다. AI를 채택하는 것에 대한 광범위한热情에도 불구하고, 비판의 강한 흐름도 있다. 비판적인 논평가들은 종종 AI의 출력에서 나타나는 명백하게 무작위적이고 예측할 수 없는 부정확성을 지적하는데, 이것은 AI의 가치를 저하하고 심지어 의료 및 교통과 같은 분야에서 실제로 인간에게 해를 끼칠 수 있다. 이러한 부정확성은 종종 AI의 ‘hallucinations’로 설명되어 왔다. 즉, AI가 사용자의 지식이나 능력의 격차를 알리지 않고 ‘최선의 추측’答案을 생성하는 경우이다. Hallucinations는 처음에는 khó 발견할 수 있지만, 더욱 심각한 문제가 있는데, 그것은 더욱 khó 발견할 수 있다.
데이터 품질 부채: AI의 아킬레스 건
AI 시스템이 구식, 불완전하거나 부정확한 데이터에서 정보를 가져올 때, 거짓 출력이 발생하지만, 그것은 즉시 phát现되지 않는다. 예를 들어, 의료 조건의 증상을 식별하기 위해 AI를 요청하고, 최신 연구 대신 50년 전의 논문에 기초한 답변을 받을 수 있다. 그 결과는 처음에는 명백하게, 웃기게 잘못된 것으로 나타나지 않을 수 있지만, 초기의 가능성의 외관은 실제로 환자와 의료 제공자에게 실질적인 위험을 초래한다.
이것은 산업 전반에 걸쳐 동일하다. AI 모델에 입력되는 데이터가 구식, 구식 또는 부분적인 정보를 포함하는 경우, 거짓 출력의 위험이 높다. 그리고 더 많은 기업들이 비즈니스에 중요한 프로세스에 AI를 통합함에 따라, 부실한 데이터 관리에서 잘못된 결론을 도출하는 위험이 증가한다.
감독관을 위한 정확성
이것은 단지 일상적인 운영에 대한 문제가 아니다. 이것은 또한 중요한 규정 위험이다. 규제 요구사항은 부정확한 AI에 대한 우려를 해결하기 위해 빠르게 발전하고 있다. 예를 들어, AI에 대한 초기 규제 조치는 몇 가지가 있었는데, 특히 이탈리아가 개인 정보 보호 문제로 인해 ChatGPT를 일시적으로 금지한 경우와 EU 데이터 보호위원회가 ChatGPT에 대한 잠재적인 집행 조치를 조정하기 위해 전용 태스크 포스를 출범한 경우가 있다.
가장 중요한 규제 변경은 세계 최초의 포괄적인 AI 법률인 EU AI 법의 통과이다. 이 법은 AI 시스템의 위험 수준에 따라 의무를 정의하는데, ‘받아들일 수 없는 위험’ 시스템은 금지되고, ‘고위험’ 시스템은 투명성, 데이터 품질, 거버넌스 및 인간 감시에 대한 엄격한 요구사항을 받는다.
EU AI 법의 중요성은 그雄心적인 범위에 있다. 규제 기관은 AI가 구속력 있는, 집행 가능한 규칙에 따라야 하며, 조직은 규정 준수와 투명성을 AI 채택의 필수적인 부분으로 간주해야 한다고 명확히 하고 있다.
이 법은 광범위한 적용 범위를 가지고 있으며, 많은 AI 개발에 영향을 미칠 수 있다. 그 핵심은 AI를 안전하게 하면서 기본적인 권리와 가치를 존중하는 것이다. 이 새로운 원칙적인 생태계에서 AI 부정확성의 잠재적인 원인을 진단할 수 있는데, 그것은 모델에 입력되는 데이터와 데이터셋, 모델의 불투명성과 접근성, 시스템 설계와 사용을 포함한다. AI 솔루션은 이 세 가지 모두의 구성 요소이다. 이들 중 하나에 문제가 있으면 부정적인 결과가 발생할 수 있다. 또한, AI의 설계, 모델 개발, 배포 및 운영에 사용되는 데이터는 주로 비즈니스 기록으로 구성되며, 이것은 다양한 규정 요구사항의 대상이 된다.
즉, AI를 둘러싼 규제 환경은 점점 더 엄격해지고 있으며, 이것은 데이터 입력에 대해서도 데이터 출력에 대해서도 마찬가지이다. 후者の 경우 더 많은 헤드라인을 얻지만, 전者の 경우 그렇지 않다.
규정 준수하고 최신의 관련 데이터를 AI에 공급하기 위한 5단계
이중 도전 과제를 해결하기 위해, 즉 규정 준수 데이터 처리와 높은 품질의 입력을 보장하여 높은 품질의 출력을 가능하게 하는 것, 비즈니스들은 훈련 및 추론 데이터에 대한 제어를 필요로 한다. 불행히도, 이것은 많은 기업들이 아직缺乏하는 것이다.
최소한으로, 조직은 자신의 규정 준수 및 거버넌스 프로그램을 AI 이니셔티브에 적용해야 한다. mereka는 AI 모델에 입력되는 데이터, 모델 및 시스템의 설계, 및 AI를 통해 생성되는 결정 및 콘텐츠에 대한 적절한 기록을 캡처하고 유지해야 한다.
그러나, 조직은 그 이상으로 나아가서 AI 배포에서 사용될 수 있는 모든 데이터에 대한 완전한 제어를 갖는 것이 중요하다. 이것은 높은 품질의 데이터 관리 및 저장 전략을 필요로 하는데, 모든 관련 데이터를 지능적으로 수집, 정리, 저장, 분류 및 권한을 부여하는 것을 의미한다. 이를 달성하기 위해, 조직은 4개의 주요 단계를 고려해야 한다:
1. 데이터 계보 및 출처
이것은 데이터의 출처, 起源, 소유권 및 메타데이터의 변경(許可된 경우)에 대한 기록을 유지하는 것을 포함한다. 또한, 데이터에서 파생된 모든 기본 문서 또는 아티팩트에 대한 풍부한 메타데이터를 유지하는 것을 의미한다.
2. 데이터 인증성
이것은 모든 데이터에 대한 명확한 소유권을 유지하는 것을 필요로 하는데, 객체를 그들의 원래 형식으로 저장하고, 받은 객체에 대한 해싱을 통해 데이터가 변경되지 않은 것을 증명하는 것을 포함한다. 또한, 각 객체에 대한 완전한 감사 기록 및 모든 객체에 대한 모든 조치 및 이벤트에 대한 기록을 유지해야 한다.
3. 데이터 분류
데이터 세트 또는 데이터 유형의 특성을 설정하는 것이 중요하다. 조직은 구조화된 데이터, 반구조화된 데이터 및 구조화된 데이터 세트를 관리할 수 있어야 한다. 각 클래스에 고유한 스키마를 부여하면, 조직은 데이터를 불필요하게 조작하여 유연하지 않은 데이터 구조에 강제로 넣지 않고, 다양한 데이터 세트를 관리할 수 있다.
4. 데이터 정규화
메타데이터의 공통 정의 및 형식을 설정하는 것이 중요하다. 분석 및 AI 솔루션에서 사용하기 위한 것이다. 명확하게 정의된 스키마는 중요한 요소이며, 데이터를 일관된, 정규화된 보기로 변환하거나 매핑할 수 있는 도구가 필요하다.
5. 데이터 권한
기업은 사용자 또는 시스템 프로필에 따라 객체 또는 필드 수준에서 세분화된 권한을 필요로 한다. 즉, 사용자 또는 시스템이 접근할 수 있는 데이터가 적절한 사용자 또는 시스템에게 제공되고, 접근할 수 없는 사용자 또는 시스템에게는 제한되거나 접근이 거부된다.
이러한 중요한 요소가 장소에 있으면, 비즈니스들은 AI 모델에 제공되는 데이터가 높은 품질이고 규정 준수된 것을 보장하기 위해 가장 좋은 위치에 있을 것이다. AI는 산업 전반에 걸쳐 개선 및 효율성을 제공할 것이다. 그러나, 그것이 발생하기 위해서는 견고한 데이터 基礎가 필수적이다.












