ثورة جديدة في عالم الصوت

ثورة جديدة في عالم الصوت

أوبن أيه أي تسمح لقلة مختارة بتجربة تقنية “فويس إنجين” لاستنساخ الأصوات. لا تحتاج الأداة الجديدة سوى لعينة صوتية مدتها 15 ثانية. وبعد ذلك تكون قادرة على تحويل أي نص إلى تسجيل صوتي جديد يتناول أي موضوع بأي لغة، وفق ذا فيرج

طورت الشركة تقنية “فويس إنجين” أواخر عام 2022. ودمجتها بشكل جزئي في تشات جي بي تي عام 2023 . وذلك لتوفر خاصية تبادل الحديث مع الذكاء الاصطناعي باستخدام الأصوات المعدة مسبقا. وتعتمد الأداة على مزيج من البيانات المرخصة والبيانات المتاحة بشكل عام لتعلم الأصوات. حسبما ينقل تقرير موقع تك كرانش عن عضو قطاع المنتجات في أوبن أيه أي جيف هاريس

اختارت أوبن أيه أي عددا قليلا من الشركات لتجربة الأداة الجديدة. ومنها شركة إيج أوف ليرنينج لتكنولوجيا التعليم. ومنصة إنشاء الفيديوهات المدعومة بالذكاء الإصطناعي هي جين. وشركة جمع البيانات الطبية ديماجي. وتطبيق التواصل بالذكاء الاصطناعي ليفوكس. إلى جانب منظمة لايف سبان لتقديم الخدمات الصحية. وقد اختارت أوبن أيه أي هذه الشركات تحديدا. وذلك لأنها تريد استكشاف كل الإمكانات المتاحة من “فويس إنجين” عبر مختلف القطاعات

تشديدات أمنية لمواجهة المخاوف الأخلاقية

 تنفذ الشركة سياسات استخدام صارمة تلزم الشركاء بالامتناع عن انتحال شخصية أي فرد أو مؤسسة دون موافقتها. كما تشدد الاتفاقية على وجود “موافقة صريحة” من الشخص الذي يجري استخدام صوته. إضافة إلى إعلام المستمعين بأن هذه الأصوات مولدة باستخدام الذكاء الاصطناعي. وكذلك وضع علامات معينة على المقاطع المولدة لتتبع أصولها ومراقبة كيفية استخدامها

للتخفيف من حدة هذه المخاوف، تقترح أوبن أيه أي تطبيق بعض تدابير الحماية الآمنة مثل إعادة النظر في المصادقة الصوتية للحسابات الحساسة. وتنفيذ سياسات لحماية أصوات الأفراد في تطبيقات الذكاء الاصطناعي. وتثقيف المستخدمين حول التزييف العميق للذكاء الاصطناعي. وتطوير أنظمة لتتبع المحتوى الناتج عن التكنولوجيا الجديدة

كيف تعمل التكنولوجيا الجديدة؟ 

توصل العلماء إلى ابتكار عبارة عن قطعة مربعة من المطاط مساحتها ستة سنتيمترات مربعة تقريبا. يمكنها مساعدة من تضررت أحبالهم الصوتية أو يعانون صعوبة في الكلام بعد جراحات سرطان الحنجرة على استعادة أصواتهم. حسبما ذكرت الدراسة التي نشرتها نيتشر كوميونيكيشنز

يعمل هذا الجهاز اللاصق الذي ابتكره مهندسون حيويون بجامعة كاليفورنيا عن طريق وضعه على الجلد خارج الحلق. ويستخدم نظامه الكهربي الحيوي تقنيات تعلم الآلة لتحويل حركة عضلات الحنجرة التي تحدث حين يحاول المستخدم التحدث دون صوت إلى إشارات. ومن ثم ترجمتها إلى كلام مسموع. وتمكن المشاركون في الدراسة من نطق خمس جمل. منها “مرحبا ريتشل، كيف حالك اليوم؟” و”أنا أحبك” بدقة تصل إلى 95% تقريبا، طبقا للتقرير الذي نشرته الجامعة

 تصلح هذه القطعة الرقيقة للاستخدام أثناء التنقل، فهي خفيفة ولا تحتاج إلى جراحة، ومصممة لإعادة الاستخدام بفضل تطابق وجهيها حيويا. ويتيح الجهاز للمرضى استمرار التواصل بعد عمليات الجراحة وعلاج الصوت، التي تحتاج إلى إراحة الصوت وفترات نقاهة طويلة

لا يزال الجهاز يحتاج إلى تعديلات مهمة رغم شموله مجموعات سكانية مختلفة. نظرا لأن اضطرابات الصوت تصيب 30% من البشر في حياتهم تقريبا. لذلك يعمل الأستاذ المساعد في الهندسة الحيوية بجامعة كاليفورنيا تشون تشين، والمسؤول عن تطوير الجهاز، على تحسين قدراته اللغوية عن طريق تكرار عمليات التعلم الآلي والتخطيط لإجراء تجارب تشمل من يعانون اضطرابات النطق

المصدر

إنتربراز