علي بابا تدخل عالم دوبلاج الذكاء الاصطناعي: أصوات افتراضية متعددة اللغات بضغطة زر

أعلنت علي بابا كلاود عن إطلاق أدوات ذكاء اصطناعي متطورة لتوليد الأصوات واستنساخها، مما يمثل نقلة نوعية في هذا المجال؛ هذه النماذج الجديدة من عائلة Qwen3، تم تطويرها خصيصًا لإنتاج أصوات واقعية وعالية الجودة باستخدام الأوامر النصية، بهدف إحداث ثورة في صناعة المحتوى الرقمي وتطبيقات الصوت الاحترافية.
علي بابا تطلق أدوات ذكاء اصطناعي متخصصة في توليد الأصوات
أطلقت شركة علي بابا كلاود نموذجين مبتكرين في مجال الذكاء الاصطناعي، وهما Qwen3-TTS-VD-Flash و Qwen3-TTS-VC-Flash؛ يهدف النموذج الأول إلى توليد أصوات فريدة بناءً على أوصاف تفصيلية؛ بينما يركز النموذج الثاني على استنساخ الأصوات بدقة فائقة، ويعتمد النموذج الأول Qwen3-TTS-VD-Flash على تلقي أوامر نصية مفصلة، ليتمكن المستخدم من تحديد خصائص الصوت المرغوب، مثل المشاعر، نبرة الصوت، وسرعة الإلقاء، مما يوفر تحكمًا كاملاً في المخرجات الصوتية؛ بالإضافة إلى ذلك، يمكن للمستخدم تحديد العمر، نوع الصوت، والأسلوب الصوتي المطلوب، مما يتيح إمكانية إنشاء أصوات مخصصة بشكل كامل.
تتفوق هذه الأدوات، وفقًا لعلي بابا، على واجهة OpenAI الخاصة بنموذج GPT-4o mini-tts الذي تم إطلاقه سابقًا؛ هذا التفوق يعكس التزام علي بابا بتطوير تقنيات متقدمة تلبي احتياجات المستخدمين في سوق توليد الأصوات بالذكاء الاصطناعي.
استنساخ الأصوات بدقة فائقة: Qwen3-TTS-VC-Flash
النموذج الثاني Qwen3-TTS-VC-Flash متخصص في استنساخ الأصوات، حيث يمكنه نسخ صوت شخص من مقطع صوتي قصير لا يتجاوز ثلاث ثوانٍ، وإعادة إنتاجه بعشر لغات مختلفة؛ هذه الميزة تفتح آفاقًا واسعة في مجالات الدبلجة وإنتاج المحتوى متعدد اللغات، وتؤكد علي بابا أن هذا النموذج يحقق معدل أخطاء أقل مقارنة بمنافسين بارزين مثل ElevenLabs و MiniMax؛ هذا يعني أن المستخدمين يمكنهم الاعتماد على Qwen3-TTS-VC-Flash لإنتاج أصوات مستنسخة بدقة وجودة عاليتين، مما يجعله أداة قيمة للمحترفين في صناعة الصوت.
تتميز هذه النماذج بقدرتها على التعامل مع نصوص معقدة وتقليد أصوات الحيوانات واستخراج الأصوات من التسجيلات الصوتية؛ تتوفر الأداتان عبر واجهة برمجة التطبيقات الخاصة بعلي بابا كلاود، مع إتاحة نسخ تجريبية للنموذجين عبر منصة Hugging Face، مما يتيح للمطورين والمستخدمين فرصة استكشاف قدرات هذه الأدوات وتقييمها.
تطبيقات واسعة لأدوات علي بابا لتوليد واستنساخ الأصوات بالذكاء الاصطناعي
إن إطلاق هذه النماذج الجديدة من عائلة Qwen3 يأتي في ظل منافسة متزايدة في سوق توليد الأصوات بالذكاء الاصطناعي؛ هذا السوق يشهد نموًا سريعًا مدفوعًا بالطلب المتزايد من قطاعات مختلفة، مثل الإعلانات، الألعاب، وصناعة الفيديو، وتفتح هذه الأدوات الجديدة المجال أمام استخدامات متعددة، منها:
- إنتاج الإعلانات الصوتية: يمكن استخدام هذه الأدوات لإنشاء إعلانات صوتية جذابة ومخصصة، مما يساعد الشركات على الوصول إلى جمهور أوسع.
- الدبلجة المتعددة اللغات: يمكن دبلجة المحتوى الصوتي إلى لغات مختلفة بسرعة وكفاءة، مما يسهل الوصول إلى الأسواق العالمية.
- صناعة الشخصيات الصوتية في الألعاب: يمكن إنشاء شخصيات صوتية فريدة للألعاب، مما يزيد من واقعية اللعبة وتجربة المستخدم.
بالإضافة إلى ذلك، تدعم هذه الأدوات منصات التعليم الإلكتروني وخدمات مراكز الاتصال؛ فهي تقلل الوقت والتكلفة مقارنة بأساليب التسجيل التقليدية؛ الجدول التالي يوضح بعض المقارنات بين نماذج علي بابا والمنافسين:
| النموذج | اللغات المدعومة | معدل الخطأ |
|---|---|---|
| Qwen3-TTS-VC-Flash | 10 | أقل |
| ElevenLabs | غير محدد | أعلى |
هذه النماذج تمثل إضافة قوية إلى مجموعة أدوات الذكاء الاصطناعي المتاحة، وتعد بمستقبل واعد لتطبيقات الصوت الاحترافية وصناعة المحتوى الرقمي.



