spot_img

قد يعجبك

أحدث الأخبار

أفضل منصة لإنشاء موقع إلكتروني في 2025: مقارنة كاملة تساعدك تختار الصح

اختيار منصة لإنشاء موقعك الإلكتروني في 2025 بقى قرار...

أفضل 10 طرق لتحسين سرعة موقعك وتحقيق نتائج عالية في Google PageSpeed في 2025

سرعة الموقع أصبحت عاملًا أساسيًا في نجاح أي مشروع...

نصائح أمان لموقعك: كيف تحمي موقعك من الاختراق في 2025؟

أمان موقعك الإلكتروني لم يعد خيارًا…في 2025، تتعرض المواقع...

دليل شامل لإنشاء موقع إلكتروني في مصر بتكلفة منخفضة في 2025

أصبح إنشاء موقع إلكتروني ضرورة لأي مشروع أو شركة،...

أفضل أدوات لتحويل ملفات PDF إلى Word (مجانية ومدفوعة) في 2025

تحويل ملفات PDF إلى Word أصبح من أكثر المهام...

كيف يغير الذكاء الاصطناعي مستقبل التسويق الرقم

يشهد عالم التسويق الرقمي تحولًا ضخمًا بفضل التطور المتسارع...

واتساب يُطلق ميزة المقاطع الصوتية في الحالات.

أعلنت منصة WhatsApp عن إطلاق ميزة جديدة تتيح للمستخدمين...

عصابات الفدية تبتكر طريقة جديدة للابتزاز الإلكتروني.

كشف فريق Kaspersky الدولي للدراسات والتحليل عن تغيير خطير...

اكتشف 5 مزايا رئيسية قادمة في تحديث iOS 18.4.

ستطلق شركة Apple إصدارًا تجريبيًا رابعًا من تحديث iOS...

NVIDIA تكشف عن نماذج الذكاء الاصطناعي المتقدمة لإنتاج الصوت

أعلنت NVIDIA عن نموذج تجريبي جديد للذكاء الاصطناعي يسمى Foundational Geneative Audio Transformer Opus 1. يطلق عليه اختصارًا اسم “Fugatto” وهو نموذج مصمم بشكل أساسي للاستخدام الصوتي.

يشتهر هذا النموذج بقدرته على إنشاء الأصوات وتعديل ملفات الموسيقى والصوت والملفات الصوتية بناءً على الأوامر النصية. تم تطوير Fugatto بواسطة فريق من الباحثين في مجال الذكاء الاصطناعي من جميع أنحاء العالم وقام بتوسيع قدراته المتعددة اللهجات واللغات.

وقال رافائيل فالي، أحد الباحثين في المشروع ومدير الأبحاث الصوتية التطبيقية في نفيديا: “أردنا تطوير نموذج يفهم الصوت ويعيد إنتاجه بنفس الطريقة التي يفعلها البشر”.

وأشارت الشركة في بيانها إلى عدد من الاستخدامات العملية للنموذج، مثل تمكين منتجي الصوت من إنشاء نماذج أولية للأفكار الموسيقية بسرعة، مع إمكانية تعديلها بسهولة لتجربة أنماط وأصوات وآلات موسيقية مختلفة.

يمكن استخدام هذا النموذج لتطوير أدوات تعلم اللغة بصوت قابل للتخصيص، ويسمح لمطوري ألعاب الفيديو بإنشاء إصدارات متعددة من الأصول الصوتية المسجلة مسبقًا بناءً على اختيارات اللاعب وإجراءاته.

ووجد الباحثون أيضًا أنه مع تعديلات طفيفة، يمكن للنموذج أداء مهام لم تكن مدرجة في تدريبه الأولي. على سبيل المثال، يمكنك توليد خطاب غاضب بلكنة معينة أو إنشاء صوت زقزقة الطيور وسط عاصفة رعدية. يتمتع Fugatto أيضًا بالقدرة على توليد أصوات تتغير بمرور الوقت، مثل صوت قطار يتحرك عبر منطقة معينة.

لم تعلن NVIDIA ما إذا كانت ستطلق هذا النموذج للجمهور. إن Fugatto ليس النموذج الأول من نوعه. أصدرت Meta سابقًا مجموعة أدوات مفتوحة المصدر للذكاء الاصطناعي تولد الصوت من أوصاف النص، وتقدم Google أيضًا نموذجها الخاص لتحويل النص إلى صوت، MusicLM.

Web Gohttps://www.web-go.net
تقدم شركة ويب جو كل شيء بدءًا من تصميم الويب ، وهوية الشركة ، والتسويق الرقمي ، والتصميم الجرافيكي، وكتابة المحتوى، وبناء العلامات التجارية. www.w3bgo.com
spot_imgspot_img