AI 기반 이미지 생성 기술은 DALL-E, GLIDE, Stable Diffusion 등과 같은 대용량 텍스트 대 이미지 확산 모델 이후 지난 몇 년 동안 눈에 띄는 성장을 보였습니다.
최근 개발과 대규모 언어 모델 기능의 발전은 오디오용 LLM 기반 프레임워크의 발전에 중요한 역할을 했습니다.