Alibaba släpper ny AI-modell

Kinesiska e-handelsjätten Alibaba har presenterat sin nya AI-modell Qwen2.5-Omni, som klarar text, bild, ljud och video i realtid. Modellen bygger på en "Thinker-Talker"-arkitektur som kombinerar förståelse av multimodala indata med naturlig text- och talsyntes.
Med ny teknik som TMRoPE – en tidsjusterad positionsinbäddning – synkroniseras ljud och video på ett sätt som förbättrar interaktiviteten. Qwen2.5-Omni erbjuder omedelbara svar med både text och tal, och skall vara bättre än tidigare modeller.
Qwen2.5-Omni-modellen är nu tillgänglig för allmänheten på plattformar som Hugging Face, ModelScope, DashScope och GitHub.