
Alibaba Group Holding a lancé un nouveau modèle d’intelligence artificielle (IA) multimodal, capable de traiter du texte, des images, de l’audio et de la vidéo sur smartphones et ordinateurs portables, rapporte le South China Morning Post.
Un modèle IA avancé accessible au grand public
Le Qwen2.5-Omni-7B permet de traiter plusieurs types de contenus et de générer des réponses en temps réel, aussi bien en texte qu’en audio. Alibaba a également annoncé que le modèle est open-source, ouvrant ainsi la voie à de nombreuses applications pour les développeurs et entreprises.
Des applications pratiques pour le quotidien
Alibaba met en avant plusieurs cas d’usage, notamment:
- Descriptions audio en temps réel pour les utilisateurs malvoyants.
- Guides de cuisine interactifs, avec l’analyse des ingrédients en direct.
La polyvalence de ce modèle reflète la demande croissante pour des systèmes d’IA allant au-delà de la simple génération de texte.
Alibaba se positionne face à DeepSeek sur le marché chinois de l’IA
Les modèles Qwen sont devenus des références populaires pour les développeurs travaillant sur des applications basées sur l’IA. Alibaba s’affirme ainsi comme l’une des rares alternatives aux modèles DeepSeek V3 et R1, consolidant sa place sur le marché chinois de l’intelligence artificielle.