Connect with us

AI๋Š” ์ƒˆ๋กœ์šด ์•Œ๊ณ ๋ฆฌ์ฆ˜์œผ๋กœ ํŠน์ • ์›์น˜ ์•Š๋Š” ํ–‰๋™์„ ํ”ผํ•  ์ˆ˜ ์žˆ๋‹ค

์ธ๊ณต์ง€๋Šฅ

AI๋Š” ์ƒˆ๋กœ์šด ์•Œ๊ณ ๋ฆฌ์ฆ˜์œผ๋กœ ํŠน์ • ์›์น˜ ์•Š๋Š” ํ–‰๋™์„ ํ”ผํ•  ์ˆ˜ ์žˆ๋‹ค

mm

인공지능 알고리즘과 시스템이 더 복잡해지고 더 큰 책임을 지게 됨에 따라 인공지능 시스템이 위험한 원치 않는 행동을 피하는 것이 점점 더 중요해지고 있다. 최근 매사추세츠 대학교 암허스트와 스탠퍼드 연구팀은 논문을 발표하여 특정 인공지능 행동을 피하는 방법을 보여주었는데, 이는 정교한 수학적 지침을 사용하여 인공지능의 행동을 조정할 수 있는 기술을 사용함으로써 가능하다.

TechXplore에 따르면, 이 연구는 불공정/안전하지 않은 행동이 수학적 함수와 변수로 정의될 수 있다는 가정에 기반을 두고 있다. 만약 이것이 사실이라면 연구자들은 이러한 특정 행동을 피하는 시스템을 훈련시킬 수 있어야 한다. 연구팀은 사용자가 인공지능에서 피하고 싶은 행동을 지정할 수 있는 툴킷을 개발하고자 했으며, 인공지능 엔지니어가 실제 상황에서 사용할 때 원치 않는 행동을 피하는 시스템을 신뢰성 있게 훈련할 수 있도록 했다.

Phillip Thomas, 논문의 첫 번째 저자이자 미시간 대학교 암허스트의 컴퓨터 과학 부교수는, 연구팀이 기계 학습 알고리즘의 설계자가 인공지능 사용자에게 원치 않는 행동을 설명하고 인공지능 시스템이 그 행동을 피할 가능성이 높도록 하는 것을 보일 목표를 가지고 있다고 설명했다.

연구팀은 데이터 과학에서 일반적인 문제인 성별 편향에 대한 테스트를 통해 자신의 기술을 적용했다. 연구팀은 성별 편향을 줄임으로써 대학 학생들의 GPA를 예측하는 알고리즘을 더 공정하게 만들고자 했다. 연구팀은 실험용 데이터셋을 사용하여 인공지능 시스템에게 성별에 따라 GPA를 일괄적으로 과소평가 또는 과대평가하는 모델을 생성하지 않도록 지시했다. 연구자의 지시에 따라 알고리즘은 이전 모델보다 성별 편향이 훨씬 적은 모델을 생성하여 학생들의 GPA를 더 잘 예측했다. 이전 GPA 예측 모델은 편향 감소 모델이 너무 제한적이거나 전혀 사용되지 않아 편향으로 고통을 받았다.

연구팀은 또한 다른 알고리즘을 개발했다. 이 알고리즘은 자동 인슐린 펌프에 구현되었으며, 알고리즘은 성능과 안전성을 균형 있게 하도록 설계되었다. 자동 인슐린 펌프는 환자에게 주사할 인슐린의 양을 결정해야 한다. 식사 후 펌프는 환자의 혈당 수준을 제어하기 위해 정확하게 맞는 인슐린의 양을 전달해야 한다. 전달되는 인슐린의 양은 너무 크거나 너무 작지 않아야 한다.

기계 학습 알고리즘은 이미 개인의 인슐린 반응에 대한 패턴을 식별하는 데 능숙하지만, 이러한 기존 분석 방법은 의사들이 피해야 할 결과(예: 저혈당 충돌)를 지정할 수 없다. 반면에 연구팀은 극단을 피하여 과다 투여 또는 과소 투여를 방지하는 인슐린 투여량을 전달하도록 훈련할 수 있는 방법을 개발할 수 있었다. 시스템은 아직 실제 환자에게 테스트할 준비가 되지 않았지만, 이러한 접근 방식을 기반으로 하는 더 복잡한 인공지능은 당뇨병을 앓는 사람들의 삶의 질을 개선할 수 있을 것이다.

연구 논문에서 연구자들은 알고리즘을 “Seledonian” 알고리즘이라고 부른다. 이것은 과학 소설 작가 아이작 아시모프가 설명한 로봇의 3대 법칙을 참조한다. 즉, 인공지능 시스템은 “인간을 상해하거나, 부작용을 통해 인간이 피해를 입지 않도록” 한다. 연구팀은 자신의 프레임워크가 인공지능 연구자와 엔지니어가 위험한 행동을 피하는 다양한 알고리즘과 시스템을 만들 수 있도록 할 것이라고 희망한다. Emma Brunskill, 논문의 선임 저자이자 스탠퍼드 대학교 컴퓨터 과학 부교수는 TechXplore에 다음과 같이 설명했다.

“우리는 인간 사용자의 가치를 존중하고 자율 시스템에 대한 우리의 신뢰를 정당화하는 인공지능을 발전시키고 싶다.”

๋ธ”๋กœ๊ฑฐ์ด์ž ํ”„๋กœ๊ทธ๋ž˜๋จธ๋กœ Machine Learning๊ณผ Deep Learning ์ฃผ์ œ์— ์ „๋ฌธ๊ฐ€์ž…๋‹ˆ๋‹ค. ๋‹ค๋‹ˆ์—˜์€ ๋‹ค๋ฅธ ์‚ฌ๋žŒ๋“ค์ด AI์˜ ํž˜์„ ์‚ฌํšŒ์ ๅ–„์œผ๋กœ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ์„ ๋•๊ธฐ๋ฅผ ํฌ๋งํ•ฉ๋‹ˆ๋‹ค.