인공 지능

AI는 새로운 알고리즘으로 원하지 않는 특정 행동을 피할 수 있습니다.

게재

4 년 전

2019 년 11 월 23 일

인공 지능 알고리즘과 시스템이 더욱 정교해지고 더 큰 책임을 떠맡게 됨에 따라 AI 시스템이 위험하고 원치 않는 동작을 방지하도록 하는 것이 점점 더 중요해지고 있습니다. 최근 Massachusetts 대학 Amherst와 Stanford의 연구원 팀 논문을 발표 AI의 동작을 조정하는 데 사용할 수 있는 정확한 수학적 지침을 도출하는 기술을 사용하여 특정 AI 동작을 피할 수 있는 방법을 보여줍니다.

TechXplore에 따르면, 불공정/안전하지 않은 행동은 수학적 함수와 변수로 정의할 수 있다는 가정을 전제로 연구를 진행했습니다. 이것이 사실이라면 연구원이 이러한 특정 행동을 피하도록 시스템을 훈련시키는 것이 가능해야 합니다. 연구팀은 AI 사용자가 AI가 피하기를 원하는 행동을 지정하고 AI 엔지니어가 실제 시나리오에서 사용될 때 원치 않는 행동을 피할 수 있는 시스템을 안정적으로 훈련할 수 있도록 하는 툴킷을 개발하는 것을 목표로 했습니다.

논문의 제1저자이자 미시간 대학교 애머스트(Amherst) 컴퓨터공학 조교수인 필립 토마스(Phillip Thomas)는 연구팀의 목표가 기계 학습 알고리즘 설계자가 AI 활용자가 원치 않는 행동을 더 쉽게 설명하고 이를 고도로 향상시킬 수 있음을 입증하는 것이라고 설명했습니다. AI 시스템이 해당 행동을 피할 가능성이 높습니다.

연구팀은 데이터 과학의 일반적인 문제인 성별 편향에 적용하여 기술을 테스트했습니다. 연구팀은 성별 편향을 줄임으로써 대학생 GPA를 예측하는 데 사용되는 알고리즘을 보다 공정하게 만드는 것을 목표로 했습니다. 연구팀은 실험 데이터 세트를 활용하고 AI 시스템에 한 성별에 대한 GPA를 전반적으로 과소평가/과대평가하는 모델 생성을 피하도록 지시했습니다. 연구원의 지시에 따라 알고리즘은 학생 GPA를 더 잘 예측하고 기존 모델보다 체계적 성별 편향이 훨씬 적은 모델을 만들었습니다. 이전의 GPA 예측 모델은 편향 감소 모델이 유용하기에 너무 제한적이거나 편향 감소가 전혀 사용되지 않았기 때문에 편향이 있었습니다.

연구팀은 다른 알고리즘도 개발했다. 이 알고리즘은 자동화된 인슐린 펌프에서 구현되었으며 알고리즘은 성능과 안전성의 균형을 맞추도록 의도되었습니다. 자동화된 인슐린 펌프는 환자에게 얼마나 많은 양의 인슐린을 투여해야 하는지 결정해야 합니다. 식사 후 펌프는 이상적으로는 혈당 수치를 유지할 수 있을 만큼 충분한 양의 인슐린을 공급합니다. 전달되는 인슐린 용량은 너무 크거나 작지 않아야 합니다.

기계 학습 알고리즘은 이미 인슐린 용량에 대한 개인의 반응에서 패턴을 식별하는 데 능숙하지만 이러한 기존 분석 방법은 의사가 저혈당 충돌과 같이 피해야 하는 결과를 지정하도록 할 수 없습니다. 대조적으로, 연구팀은 과소 투여 또는 과다 투여를 방지하는 두 가지 극단 내에 머무르는 인슐린 투여량을 전달하도록 훈련될 수 있는 방법을 개발할 수 있었습니다. 이 시스템은 아직 실제 환자에게 테스트할 준비가 되지 않았지만 이 접근 방식을 기반으로 하는 보다 정교한 AI는 당뇨병 환자의 삶의 질을 향상시킬 수 있습니다.

연구 논문에서 연구원들은 알고리즘을 "Seledonian" 알고리즘이라고 부릅니다. 이것은 SF 작가 아이작 아시모프가 설명한 로봇 공학의 세 가지 법칙과 관련이 있습니다. 그 의미는 AI 시스템이 "인간을 다치게 하거나, 행동하지 않음으로써 인간이 해를 입도록 허용하지 않을 수 있다"는 것입니다. 연구팀은 그들의 프레임워크를 통해 AI 연구원과 엔지니어가 위험한 행동을 피하는 다양한 알고리즘과 시스템을 만들 수 있기를 희망합니다. 이 논문의 수석 저자이자 스탠포드 컴퓨터 과학 조교수인 Emma Brunskill은 TechXplore에 설명:

"우리는 인간 사용자의 가치를 존중하고 자율 시스템에 대한 신뢰를 정당화하는 AI를 발전시키고 싶습니다."