알리바바, Qwen3-Omni 공개: 진정한 엔드투엔드 멀티모달 기반 모델
2025-09-22
알리바바가 진정한 엔드투엔드 다국어 옴니모달 기반 모델인 Qwen3-Omni를 공개했습니다. 텍스트, 이미지, 오디오, 비디오 등 다양한 입력을 실시간으로 처리하여 텍스트와 자연어 음성으로 스트리밍 응답을 제공합니다. Qwen3-Omni는 여러 벤치마크에서 최첨단 결과를 달성했으며, 여러 언어를 지원하고, 혁신적인 MoE 아키텍처와 유연한 제어 기능을 갖추고 있습니다. 이 모델과 툴킷, 레시피, 데모는 오픈소스로 공개되어 개발자에게 풍부한 리소스를 제공합니다.
AI