جوجل تطوراً صوتاً بالذكاء الصنعي مشابه لصوت الإنسان

206

طورت جوجل نظاماً لتحويل النص إلى الكلام أطلقت عليه اسم تاكوترون 2 يتمتع بدقة عالية ويوفر نبرات صوت قريبة جداً من نبرة صوت الإنسان الحقيقي دون مبالغة، ويعتبر تاكوترون 2 الجيل الثاني من هذه التقنية وهي تتألف من شبكتين عصبيتين عميقتين الأولى تقوم بتحويل النص إلى مخطط طيفي (كالذي موجود في الصورة الأعلاه)، أما الثانية – والتي تحمل اسم WaveNet – فتقوم بقراءة هذا المخطط وتحوله إلى صوت حقيقي.

 

وقد تم تدريب هذا النظام في الوقت الحالي على التحدث بالإنكليزية فقط بصوت نسائي، ولا يقوم هذا النظام بالقراءة وحسب بل إنه يقوم بالتشديد على كلمة معينة في حال كانت مكتوبة بالأحرف الكبيرة، كما أنها قادرة على التعامل مع بعض الأخطاء الكتابية وفهم المقصد الحقيقي.

 

وما يثير الاهتمام تماماً في نظام تاكوترون 2 هو أنه لن يبقى مدفوناً في المخبر كما هو الحال في العديد من التقنيات الأخرى، بل إن جوجل تسعى جاهدة من أجل استخدام شبكة WaveNet لتوفير الصوت الأكثر قرباً من صوت الإنسان في تاريخ مساعد جوجل الافتراضي.

 

وعندما تنتهي جوجل من تطوير تاكوترون 2 وإتمامه بشكل كامل ستقوم بإطلاقه على أنظمة التشغيل تماماً كما هو الحال على مساعدها.

 

يمكنم في الأسفل الاستماع إلى صوتين الأول هو الصوت الأساسي والثاني هو الصوت الذي قامت جوجل بتطويره عبر تقنيات الذكاء الصنعي، حيث يبدو واضحاً أنه من الصعب التفريق بين الصوتين