مايكروسوفت تدخل سباق الذكاء الاصطناعي بقوة: نماذج جديدة تولد النصوص والصوت والفيديو

مايكروسوفت تكنولوجيا مايكروسوفت

في خطوة تعكس تسارع المنافسة العالمية في مجال الذكاء الاصطناعي، أعلنت شركة “مايكروسوفت “عن إطلاق جيل جديد من النماذج المتقدمة متعددة الوسائط، القادرة على إنتاج النصوص والصوت والفيديو، ضمن توجه واضح نحو تعزيز حضورها في هذا القطاع الاستراتيجي.

وبحسب ما أورده موقع TechCrunch، فإن هذه الخطوة تؤكد أن مايكروسوفت لم تعد تكتفي بشراكتها مع OpenAI، المطورة لمنصة ChatGPT، بل تسعى في الوقت ذاته إلى بناء منظومة نماذجها الخاصة لمنافسة أبرز مختبرات الذكاء الاصطناعي عالميًا.

وتضم هذه الحزمة ثلاثة نماذج رئيسية، أولها نموذج MAI-Transcribe-1، الذي يتيح تحويل الكلام إلى نصوص بـ25 لغة مختلفة، مع أداء أسرع بنحو 2.5 مرة مقارنة بخدمة Azure Fast التابعة لمايكروسوفت، وهو ما يعزز استخداماته في مجالات الترجمة الفورية وتحليل المحتوى الصوتي.

أما النموذج الثاني، MAI-Voice-1، فيركز على توليد الصوت بشكل فائق السرعة، حيث يمكنه إنتاج 60 ثانية من الصوت في ثانية واحدة فقط، مع إمكانية تخصيص نبرة وصوت معين، ما يفتح المجال أمام تطبيقات متقدمة في الإعلام الرقمي وصناعة المحتوى.

في المقابل، يأتي نموذج MAI-Image-2 ليعزز قدرات التوليد البصري، إذ يسمح بإنشاء مقاطع فيديو انطلاقًا من أوامر نصية بسيطة، في تطور يعكس التحول نحو أدوات إنتاج محتوى أكثر ذكاءً وسهولة في الاستخدام.

هذه الخطوة تؤكد أن مايكروسوفت تتجه نحو تكريس موقعها كلاعب رئيسي في سباق الذكاء الاصطناعي متعدد الوسائط، في وقت يشهد فيه هذا المجال تنافسًا محتدمًا بين كبرى الشركات التكنولوجية لتطوير أدوات أكثر سرعة وابتكارًا وتأثيرًا في مختلف القطاعات.

التعاليق (0)

اترك تعليقاً