عرض مشاركة واحدة
قديم 05-29-2017, 03:15 PM
المشاركة 26
ايوب صابر
مراقب عام سابقا

اوسمتي

  • موجود
افتراضي
بايدو: "ديب فويس 2" يتحدث كالبشر
بايدو تقول إن "ديب فويس 2" نظام مرن للغاية وقادر على توليف صوت عالي الجودة في الوقت الحقيقي (رويترز)


محرك البحث الصيني بايدو يكتسح بورصة ناسداك الأميركية
بايدو الصينية تطلق موقعا إنجليزيا للمطورين
باحثون يبتكرون خوارزمية تجعل الروبوتات تتعلم كالبشر
محاولات سويسرية لابتكار آلي يتحرك كالبشر
هل يجب أن نخشى الذكاء الصناعي؟
استمع
أعلنت شركة بايدو الصينية -صاحبة أكبر محرك بحث في الصين- عن إطلاق الجيل الثاني من نظام تحويل النص إلى كلام التابع لها "ديب فويس"، وذلك بعد ثلاثة أشهر فقط من إطلاق الجيل الأول، مؤكدة أن "ديب فويس 2" يأتي بتحسينات كبيرة تبشر بمساعدات رقمية تتفاعل مع المستخدمين كما لو كانت أناسا حقيقيين.
وكانت بايدو قد أطلقت في فبراير/شباط الماضي نظام*"ديب فويس 1" لتوليد الأصوات البشرية الاصطناعية باستخدام تقنية التعلم العميق أو الشبكات العصبية العميقة.
وقالت الشركة إنه على خلاف أنظمة تحويل النص إلى كلام البديلة فإن ديب فويس 1 كان يعمل في الوقت الحقيقي، حيث يُجمّع الصوت بأسرع ما يمكن لتشغيله،*مما يتيح استخدامه في التطبيقات التفاعلية مثل الإعلام وواجهات المحادثة مثل المساعدات الرقمية.
وأضافت الشركة أنها، ومن خلال تدريب الشبكات العصبية العميقة القادرة على التعلم من كميات كبيرة من البيانات والميزات البسيطة، أنشأت نظاما مرنا على نحو لا يصدق لتوليف صوت عالي الجودة في الوقت الحقيقي.
ومع أن "ديب فويس 1" كان قادرا على إنتاج كلام لا يمكن تمييزه تقريبا عن صوت الإنسان الفعلي في أول استماع،*فإن قدرات النظام كانت محدودة في التعلم من صوت واحد فقط في المرة الواحدة، ويتطلب ساعات طويلة من الصوت لبناء عينة.
أما "ديب فويس 2" الجديد، فتقول الشركة إنها تمكنت في غضون ثلاثة أشهر فقط من توسيع نطاق النظام من 20 ساعة من الكلام وصوت واحد إلى مئات الساعات مع المئات من الأصوات والقدرة على تقليدها تماما، بالإضافة إلى قدرة النظام على التعلم من مئات الأصوات الفريدة في أقل من نصف ساعة من البيانات لكل متكلم مع تحقيق جودة صوت عالية، حسب قولها.
وأوضحت أن "ديب فويس 2" قادر على التعلُّم لتوليد خطاب من خلال إيجاد الصفات المشتركة بين الأصوات المختلفة، وأنه على عكس جميع أنظمة تحويل النص إلى كلام السابقة فإن "ديب فويس 2" يتعلم هذه الصفات من الصفر دون أي توجيه بشأن ما يجعل الأصوات قابلة للتمييز.
ونشرت بايدو في قسم الأبحاث على موقعها الإلكتروني مجموعة من العينات من نظام "ديب فويس 2″، الذي دُرِّب بالاستماع على ما يقرب من مئة متكلم. وكان لكل متكلم إيقاع كلام ولهجة ونبرة وعادات النطق خاصة به، وقد تمكن النظام من تقليد كل ذلك بالضبط تقريبا.
وتعتقد بايدو أن هذه التقنية ستكون مفيدة لخدمات المساعدة الرقمية التي يتم التحكم فيها بالأوامر الصوتية وتتفاعل من خلال التحدث مع مستخدميها. كما ترى أن لها إمكانات في تطبيقات تحويل النص إلى كلام مثل الكتب الإلكترونية.
المصدر : البوابة العربية للأخبار التقنية