부본 금융 범죄 내 AI 기반 시스템의 편견과 공정성 - Unite.AI
Rescale 미팅 예약

사상가

금융 범죄 내 AI 기반 시스템의 편견과 공정성

mm

게재

 on

금융 범죄와의 싸움에서 단순히 사기범이나 기타 나쁜 행위자를 막는 것 이상의 문제가 있습니다.

출시되고 있는 일부 최신 고급 기술에는 규제 영향 없이 성공적으로 사기꾼과 싸우기 위해 채택 단계에서 고려해야 하는 고유한 특정 문제가 있는 경우가 많습니다. 사기 탐지에서 모델 공정성과 데이터 편향은 시스템에 더 많은 가중치가 부여되거나 특정 데이터 그룹 또는 범주의 표현이 부족할 때 발생할 수 있습니다. 이론적으로 예측 모델은 다른 문화권의 성을 사기 계정과 잘못 연관시키거나 특정 유형의 금융 활동에 대한 인구 세그먼트 내의 위험을 잘못 감소시킬 수 있습니다.

편향된 AI 시스템은 평판이 영향을 받을 수 있고 사용 가능한 데이터가 인구 또는 탐색 현상을 대표하지 않을 때 심각한 위협이 될 수 있습니다. 이 데이터에는 예측하려는 현상을 적절하게 포착하는 변수가 포함되어 있지 않습니다. 또는 데이터에 인간이 생성한 콘텐츠가 포함될 수 있습니다. 이 콘텐츠는 특정 집단에 대한 편견을 포함할 수 있으며 문화적, 개인적 경험을 통해 유전되어 결정을 내릴 때 왜곡될 수 있습니다. 처음에는 데이터가 객관적으로 보일 수 있지만 여전히 사람이 수집하고 분석하므로 편향될 수 있습니다.

AI 시스템의 차별과 불공평의 위험을 해결하거나 기계 학습 모델 및 사용을 설계할 때 공정성과 편견 완화 문제를 영구적으로 해결하는 데 있어 만능 해결책은 없지만 이러한 문제는 사회적, 사회적으로 모두 고려해야 합니다. 사업상의 이유.

AI에서 옳은 일을 하기

AI 기반 시스템의 편견을 해결하는 것은 옳은 일일 뿐만 아니라 비즈니스를 위한 현명한 일이며 비즈니스 리더의 이해 관계가 높습니다. 편향된 AI 시스템은 기회, 자원, 정보 또는 서비스 품질을 부당하게 할당하여 금융 기관을 잘못된 길로 이끌 수 있습니다. 그것들은 심지어 시민의 자유를 침해하거나, 개인의 안전에 해를 끼치거나, 비하하거나 공격적인 것으로 인식될 경우 개인의 안녕에 영향을 미칠 가능성이 있습니다.

기업이 AI 편견의 힘과 위험을 이해하는 것이 중요합니다. 기관에서는 종종 알려지지 않았지만 편향된 AI 기반 시스템은 대출 결정에 인종 또는 성별 편향을 노출시키는 해로운 모델이나 데이터를 사용할 수 있습니다. 이름과 성별과 같은 정보는 지원자를 불법적인 방식으로 분류하고 식별하는 대리 수단이 될 수 있습니다. 편향이 의도적이지 않더라도 규정 요구 사항을 준수하지 않음으로써 여전히 조직을 위험에 빠뜨리고 특정 그룹의 사람들이 부당하게 대출이나 신용 한도를 거부당할 수 있습니다.

현재 조직에는 AI 시스템의 편견을 성공적으로 완화할 수 있는 요소가 없습니다. 그러나 의사 결정을 알리기 위해 기업 전반에 AI가 점점 더 많이 배포됨에 따라 조직이 도덕적 이유뿐만 아니라 규제 요구 사항을 준수하고 수익을 창출하기 위해 편견을 줄이기 위해 노력하는 것이 중요합니다.

"공정성 인식" 문화 및 구현

공정성 인식 설계 및 구현에 중점을 둔 솔루션이 가장 유익한 결과를 얻을 것입니다. 공급자는 책임 있는 데이터 수집, 처리 및 관리를 알고리즘 공정성의 필수 구성 요소로 간주하는 분석 문화를 가져야 합니다. 차별적 피해.

다음은 데이터 과학 팀이 염두에 두어야 하는 데이터 공정성의 요소입니다.

  • 대표성:상황에 따라 데이터 샘플에서 불이익을 받거나 법적으로 보호받는 그룹의 과소대표 또는 과대대표는 훈련된 모델의 결과에서 취약한 당사자를 체계적으로 불리하게 만들 수 있습니다. 이러한 종류의 샘플링 편향을 피하기 위해 수집하거나 획득한 데이터와 모델링할 기본 모집단 간의 적합성을 평가하는 데 도메인 전문 지식이 중요합니다. 기술 팀 구성원은 샘플링의 표현 결함을 수정하기 위한 수정 수단을 제공해야 합니다.
  • 목적에 적합하고 충분함: 수집된 데이터가 프로젝트의 의도된 목적에 충분한지 이해하는 것이 중요합니다. 불충분한 데이터 세트는 AI 시스템의 원하는 목적과 일치하는 정당한 결과를 생성하기 위해 평가해야 하는 품질을 공정하게 반영하지 못할 수 있습니다. 따라서 기술 및 정책 역량을 갖춘 프로젝트 팀원은 데이터 양이 충분하고 목적에 적합한지 확인하기 위해 협력해야 합니다.
  • 소스 무결성 및 측정 정확도:효과적인 바이어스 완화는 데이터 추출 및 수집 프로세스의 맨 처음부터 시작됩니다. 측정 소스와 도구 모두 데이터 세트에 차별적 요소를 도입할 수 있습니다. 차별적 무해성을 확보하기 위해서는 데이터 샘플이 최적의 소스 무결성을 가져야 합니다. 여기에는 데이터 수집 프로세스에 적합하고 신뢰할 수 있으며 공정한 측정 소스 및 강력한 수집 방법이 포함되어 있는지 확인하거나 확인하는 것이 포함됩니다.
  • 적시성 및 최신성: 데이터 세트에 오래된 데이터가 포함된 경우 기본 데이터 분포의 변경 사항이 훈련된 모델의 일반화 가능성에 부정적인 영향을 미칠 수 있습니다. 이러한 분포 드리프트가 변화하는 사회적 관계 또는 그룹 역학을 반영한다면 기본 모집단의 실제 특성에 대한 이러한 정확도 손실은 AI 시스템에 편향을 가져올 수 있습니다. 차별적인 결과를 방지하기 위해 데이터 세트의 모든 요소에 대한 적시성 및 최신성을 면밀히 조사해야 합니다.
  • 관련성, 적절성 및 도메인 지식: 가장 적절한 소스와 유형의 데이터를 이해하고 사용하는 것은 견고하고 편견 없는 AI 시스템을 구축하는 데 중요합니다. 기본 인구 분포 및 프로젝트의 예측 목표에 대한 견고한 도메인 지식은 정의된 솔루션의 합리적인 해결에 기여하는 최적의 관련 측정 입력을 선택하는 도구입니다. 도메인 전문가는 데이터 과학 팀과 긴밀히 협력하여 최적의 적절한 범주 및 측정 소스를 결정하는 데 도움을 주어야 합니다.

AI 기반 시스템은 의사 결정 자동화 프로세스를 지원하고 비용 절감을 제공하지만 AI를 솔루션으로 고려하는 금융 기관은 편향된 의사 결정이 이루어지지 않도록 경계해야 합니다. 규정 준수 리더는 AI 기능이 책임 있고 효과적이며 편견이 없음을 확인하기 위해 데이터 과학 팀과 보조를 맞춰야 합니다. 책임 있는 AI를 옹호하는 전략을 갖는 것은 올바른 일이며 향후 AI 규정을 준수할 수 있는 경로를 제공할 수도 있습니다.

Danny Butvinik은 수석 데이터 과학자입니다. 좋은 활성화, 기술 및 전문 리더십을 제공합니다. Danny는 인공 지능 및 데이터 과학 전문가로서 여러 과학 기사와 논문을 저술했습니다. 현재 직책에서 그는 데이터 과학 및 소프트웨어 개발 분야에서 15년 이상의 연구, 개발 및 관리 경험을 통해 대규모 데이터 과학자 그룹을 관리하고 혁신의 성장과 회사의 지적 재산에 기여하고 있습니다.