์ธ๊ณต์ง๋ฅ
Google์ ์๋ก์ด Meena ์ฑ๋ด์ ๊ฑฐ์ ๋ชจ๋ ๊ฒ์ ๋ํด ํฉ๋ฆฌ์ ์ด๊ณ ๊ตฌ์ฒด์ ์ธ ๋ํ๋ฅผ ํ ์ ์๋ค

Siri, Alexa, Google Assistant와 같은 가상 어시스턴트가 얼마나 인상적이고 유용한지 여부와 상관없이, 그들의 대화 능력은 일반적으로 특정 명령을 받고 미리 정의된 응답을 전달하는 것에 제한됩니다. Google과 Amazon과 같은 회사들은 AI 챗봇을 더 강력하고 유연하게 만들 수 있는 AI 훈련 및 개발 방법을 추구해 왔습니다. 이는 사용자와 더 자연스럽게 대화할 수 있는 방법입니다. DigitalTrends에 따르면, Google은 최근 논문을 발표하여 새로운 챗봇인 “Meena”의 능력을展示했습니다. 연구자들의 블로그 게시물에 따르면, Meena는 거의 모든 주제에 대해 사용자와 대화할 수 있습니다.
Meena는 오픈 도메인 챗봇으로, 대화의 맥락에 응답하고 입력에 적응하여 더 자연스러운 응답을 제공합니다. 대부분의 다른 챗봇은 클로즈드 도메인으로, 특정 아이디어를 중심으로 응답이 주제별로 제한되고 특정 작업을 수행하는 데 제한됩니다.
Google의 보고서에 따르면, Meena의 유연성은 거대한 훈련 데이터셋의 결과였습니다. Meena는 소셜 미디어 대화에서 추출한 약 40억 개의 단어로 훈련되었으며, 가장 관련性과 대표성이 높은 단어로 필터링되었습니다. Google은 대부분의 음성 어시스턴트에서 발견되는 문제를 해결하려고 했습니다. 즉, 대화의 여러 턴에 걸쳐 언급되는 주제와 명령을 처리하는 능력, 사용자가 봇이 입력에 응답한 후 추가 입력을 제공할 때입니다. 이는 대부분의 챗봇이 사용자에게 澄明을 요청할 수 없고, 해석할 수 없는 쿼리가 있을 때 일반적으로 웹 결과로 기본적으로 돌아간다는 것을 의미합니다.
이 문제를 해결하기 위해, Google의 연구자들은 알고리즘을 대화의 맥락을 추적하도록 활성화했습니다. 즉, 특정 답변을 생성할 수 있습니다. 모델은 이미 대화에서 말한 것을 처리하는 인코더와 맥락에 따라 응답을 생성하는 디코더를 사용했습니다. 모델은 특정 및 비특정 데이터로 훈련되었습니다. 특정 데이터는 이전 문장과密接하게 관련된 단어입니다. Google 포스트에 설명된 바와 같이:
“A가 ‘나는 테니스 좋아한다’라고 말하고, B가 ‘그것은 좋다’라고 응답하면, 발언은 ‘비특정적’으로 표시되어야 합니다. 그 응답은 수십 가지 다른 상황에서 사용될 수 있습니다. 그러나 B가 ‘나도, 로저 페더러가 너무 좋아!’라고 응답하면, 그것은 현재 논의되는 것과密接하게 관련되어 있으므로 ‘특정’으로 표시됩니다.
모델을 훈련하는 데 사용된 데이터는 대화의 7턴으로 구성되었습니다. 훈련 중에 모델은 2.6억 개의 매개 변수를 가지고 있으며, 341GB의 텍스트 데이터에서 패턴을 조사했습니다. 이는 OpenAI가 생성한 GPT-2 모델을 훈련하는 데 사용된 데이터셋보다 약 8.5배 더 큰 데이터셋입니다. OpenAI.
Google은 Meena의 성능을 감각성 및 특이성 평균(SSA) 지표로 보고했습니다. SSA는 대화 엔티티가 대화가 진행됨에 따라 특정하고 관련된 응답으로 응답하는 능력을 양적화하기 위해 Google 연구자들이 설계한 지표입니다.
SSA 점수는 모델을 고정된 수의 프롬프트에 테스트하고, 모델이 제공하는 감각적 응답의 수를 추적하여 계산됩니다. 모델의 점수는 프롬프트에 대한 감각적/특정 응답의 비율에 따라 파생됩니다. 일반적인 응답은 페널티를 받습니다. Google에 따르면, 평균 사람이 SSA에서 약 86%의 점수를 얻는 반면 Meena는 79%의 점수를 얻었습니다. 또 다른 유명한 AI 모델인 Pandora Bots 에이전트는 인간과 같은 소통을 달성한 것으로 인정받아 Loebner Prize를 수상했습니다. Pandora Bots 에이전트는 SSA 테스트에서 약 56%의 점수를 얻었습니다.
Microsoft와 Amazon도 더 유연하고 자연스러운 챗봇을 만들려고 시도하고 있습니다. Microsoft는 2년 동안 챗봇에서 다중 턴 대화를 생성하려고 시도해 왔으며, Cortana를 개선하기 위해 Semantic Machines를 인수했습니다. Amazon은 최근 Alexa Prize 챌린지를 진행했으며, 참가자들은 약 20분 동안 대화할 수 있는 봇을 설계하도록 촉구했습니다.












