فناوریمد و فشن

گوگل برای بهبود کیفیت صدا در Duo از یادگیری ماشین کمک می‌گیرد

از نظر بسیاری از کارشناسان، گوگل دوئو بهترین سرویس تماس تصویری است که هنوز اغلب کاربران با آن آشنا نشده‌اند. این اپلیکیشن آن‌قدر موفق عمل کرده است که سامسونگ قصد دارد آن را به‌عنوان پیش‌فرض در دستگاه‌های هوشمند خود قرار دهد. بااین‌همه، گوگل قصد ندارد فقط بر این پیروزی تکیه کند و در تلاش است با توسعه‌ی بیشتر ویژگی‌های جدید، رقابت را برای دیگر شرکت‌ها دشوار کند.

آخرین خلاقیت شگفت‌انگیزی که گوگل برای توسعه‌ی این اپلیکیشن در اولویت قرار داده، استفاده از الگوریتم‌های یادگیری ماشین برای حل مشکل ازدست‌رفتن بسته‌های صوتی حین جابجایی در اینترنت (Packet Loss) است. به‌عبارت‌دیگر، این تکنولوژی به گوگل کمک می‌کند کیفیت صدا را در تماس‌های دوئو افزایش دهد؛ به‌‌ویژه در زمانی‌که سرویس اتصال باثباتی به اینترنت وجود نداشته باشد. گوگل با یاری تکنولوژی DeepMind خود قسمت‌های نامفهوم یا به‌عبارتی بسته‌های ازدست‌رفته‌ی صدا را با صدای مصنوعی شبیه به صدای انسان تولید و جایگزین می‌کند. به‌نقل از بلاگ AI گوگل، این قابلیت با نام WaveNetEQ شناخته می‌شود.

Google Duo / گوگل دوئو

وقتی تماس آنلاین برقرار می‌شود، داده‌ها را شرکت پشتیبان به بسته‌های متعددی تقسیم خواهد کرد که در فضای اینترنت منتقل می‌شوند. حین انتقال داده‌ها ممکن است برخی داده‌ها از بین بروند و بخش‌هایی از صدا دچار قطعی شوند. تکنولوژی WaveNetEQ در اپلیکیشن دوئو بسته‌های داده‌ای ازبین‌رفته در مسیر را با کمک اطلاعاتی کلامی دراختیار گوگل بازسازی می‌کند. گوگل گفته است ۹۹ درصد از تماس‌های برقرارشده با دوئو مشکل ازدست‌رفتن بسته‌ی داده را تجربه می‌کنند که در‌این‌بین، ۲۰ درصد از آن‌ها ۳ درصد از داده‌های صوتی و ۱۰ درصد دیگر حدود ۸ درصد از داده‌های خود را از دست می‌دهند.

به‌نقل از گوگل، ازآنجاکه تماس‌های دوئو از رمزنگاری سرتاسری بهره می‌برند، همه‌ی فرایند باید روی دستگاه انجام شود و WaveNetEQ مدل بسیار سریعی دارد که به‌آسانی در گوشی‌های هوشمند اجرا خواهد شد. علاوه‌بر‌این، خروجی بسیار طبیعی و زیبایی ارائه می‌کند که دیگر سیستم‌های حال‌حاضر نمی‌توانند با آن رقابت کنند. بنابه گفته‌ی گوگل، تکنولوژی پنهان‌سازی بسته‌های ازدست‌رفته در این اپلیکیشن به‌هیچ‌عنوان تکراری یا غیرطبیعی شنیده نخواهد شد؛ زیرا این تکنولوژی ازطریق فناوری شبکه‌ی عصبی مصنوعی کار می‌کند که پایگاه داده‌ای به بزرگی ۱۰۰ گوینده در ۴۸ زبان مختلف در خود جای داده است.

قابلیت WaveNetEQ در‌حال‌حاضر تنها در تماس‌های دوئو در گوشی هوشمند Pixel 4 دردسترس است و گوگل وعده داده به‌زودی برای گوشی‌های هوشمند دیگر نیز دردسترس قرار خواهد گرفت.

برچسب ها

نوشته های مشابه

دکمه بازگشت به بالا
بستن