인공 지능

연구원들은 화학 물질의 냄새를 예측하기 위해 AI를 훈련시킵니다.

업데이트 on 2022 년 12 월 9 일

구글 브레인(Google Brain) 연구원들이 발표한 최근 논문은 연구원들이 네트워크로 전달되는 화학 물질의 구조를 기반으로 물체의 냄새를 예측하도록 AI를 훈련시키는 방법을 보여줍니다. 유선에서 보도한 바와 같이, 연구원들은 그들의 작업이 우리의 다른 감각에 비해 잘 이해되지 않는 인간의 후각을 둘러싼 미스터리를 푸는 데 도움이 될 수 있기를 희망합니다.

냄새의 차이는 복잡하며 분자에서 단일 원자가 변경되면 냄새가 기분 좋은 냄새에서 불쾌한 냄새로 바뀔 수 있습니다. 화학 구조가 우리의 후각에 의해 유쾌하거나 혐오스러운 것으로 해석되는 패턴을 연구자들이 이해하기는 어렵습니다. 대조적으로, 우리 눈에 색상으로 나타나는 전자기 스펙트럼의 패턴은 과학자들이 특정 파장의 빛이 어떻게 보일지 알려주는 정확한 측정을 할 수 있기 때문에 훨씬 더 쉽게 정량화할 수 있습니다.

기계 학습 알고리즘은 데이터 내에서 패턴을 찾는 데 탁월합니다. 이러한 이유로 AI 연구자들은 기계 학습을 사용하여 인간의 뇌가 냄새를 해석하는 방식에 대한 더 나은 통찰력을 얻으려고 시도했습니다. 냄새를 정량화하기 위해 기계 학습 알고리즘을 활용하려는 시도에는 2015년에 수행된 DREAM 후각 예측 챌린지가 포함됩니다. 여러 연구에서는 챌린지에서 데이터를 가져와 단분자 냄새 물질에 대한 자연어 설명을 생성하려고 시도했습니다.

Arxiv에 발표된 최근 연구는 다음을 분류합니다. 구글 뇌 신경망을 사용하여 냄새를 정량화하려는 연구원의 시도. 연구원들은 그래프 신경망 또는 GNN을 활용했습니다. 그래프 신경망은 노드와 에지로 구성된 데이터 구조인 그래프 데이터를 해석할 수 있습니다. 그래프는 일반적으로 개별 데이터 포인트 간의 네트워크 또는 관계를 나타내는 데 사용됩니다. 소셜 네트워크의 맥락에서 그래프는 네트워크의 각 사람이 노드 또는 정점으로 표시됩니다. 이러한 그래프는 소셜 미디어 회사에서 현재 네트워크의 주변 장치에 있는 사람들을 예측하고 새로운 친구를 제안하는 데 사용됩니다.

냄새를 해석하기 위해 연구원들은 각각 자연 언어 설명자와 일치하는 수천 개의 분자에 대해 네트워크를 훈련했습니다. GNN은 데이터를 해석하고 분자 구조의 패턴을 포착할 수 있었습니다. 연구자들이 사용하는 기술어는 "달콤한", "연기가 자욱한" 또는 "우디한"과 같은 문구였습니다. 연구자들이 수집한 5,000개 이상의 분자 중 약 XNUMX분의 XNUMX는 모델 훈련에 사용되었고 나머지 XNUMX분의 XNUMX은 모델 테스트에 사용되었습니다.

연구원들이 훈련한 모델은 매우 잘 작동하여 첫 번째 반복이 완료되면 화학 구조에 자연 언어 레이블을 지정하려고 시도한 다른 연구원 그룹이 달성한 최고 성능과 이미 일치하는 성능을 보였습니다.

프로젝트에 참여한 연구원 중 한 명인 Alex Wiltschko는 현재 접근 방식에 몇 가지 제한 사항이 있음을 인정합니다. 우선, AI는 두 가지 다른 화학 물질을 자연에서 "흙" 또는 "나무"라고 부르면서 인간이 동일하다고 설명하는 화학 구조 간의 차이를 구별할 수 있습니다. 분류기의 또 다른 문제는 서로 거울상인 분자인 키랄 쌍을 구별하지 않는다는 것입니다. 다른 방향은 냄새가 다르다는 것을 의미하지만, 모델은 현재 그것들을 다른 것으로 보지 않습니다.

연구팀은 향후 작업에서 이러한 한계를 해결하는 것을 목표로 합니다. 연구는 아직 갈 길이 멀지만 특정 냄새에 대한 우리의 인식과 일치하는 분자의 특징을 이해하기 위한 단계입니다. Google Brain 팀은 냄새 인식을 목표로 하는 AI 응용 프로그램을 연구하는 유일한 연구팀이 아닙니다. 향기와 관련된 다른 AI 실험에는 IBM의 실험이 포함됩니다. AI로 생성된 향수 탐지하기 위한 러시아 과학자들의 실험 잠재적으로 유독한 가스 혼합물.