هدفون هوش مصنوعی

مکالمه‌ واضح در محیط‌های شلوغ

هدفون‌های مجهز به هوش مصنوعی حبابی از سکوت ایجاد می‌کنند و دنیای پر سر و صدا را خاموش می‌کنند تا به کاربران کمک کنند مکالمه‌های اطراف‌شان را بهتر بشوند و درک کنند.

به گزارش نبض بازار، بی‌شک چنین تجربه‌ای داشته‌اید که در ملاقات با یک دوست در هنگام صرف شام در رستوران یا ملاقات با یک فرد در یک مهمانی، یا برگزاری یک جلسه در میان هیاهوهای اداری، متوجه می‌شویم که مجبوریم به دلیل وجود صحبت‌های پس‌زمینه و سر و صدای عمومی با صدای بلند حرف بزنیم. گوش و مغز انسان در شناسایی منابع مجزای صدا در یک محیط پر سر و صدا برای تمرکز بر یک مکالمه خاص چندان خوب عمل نمی‌کند. این توانایی با کاهش شنوایی عمومی که با افزایش طول عمر شیوع بیشتری پیدا می‌کند، بیشتر مختل می‌شود و می‌تواند منجر به انزوای اجتماعی شود.

با این حال، گروهی از محققان دانشگاه واشنگتن، مایکروسافت و هوش مصنوعی اسمبلی(Assembly) به تازگی نشان داده‌اند که هوش مصنوعی می‌تواند در جداسازی منابع صوتی برای ایجاد منطقه‌ای از سکوت، از انسان پیشی بگیرد. این حباب صدا به افراد در شعاع دو متری اجازه می‌دهد تا با تداخل بسیار کاهش یافته که از سوی سایر منابع صدا ایجاد می‌شود با یکدیگر صحبت کنند.

این گروه به رهبری شیام گولاکوتا(Shyam Gollakota)، استاد دانشگاه واشنگتن، قصد دارند هوش مصنوعی را با سخت افزار ترکیب کند تا توانایی‌های انسان را افزایش دهند.

گولاکوتا می‌گوید این با کار با منابع محاسباتی عظیمی مانند منابع چت جی‌پی‌تی متفاوت است.

در حال حاضر، هدست‌های کاهش‌دهنده نویز تجاری در بازار موجود هستند و نویز پس‌زمینه را سرکوب می‌کنند، اما به مشکل فواصل با منابع صدا یا سایر مسائل مانند طنین صدا در فضاهای بسته نمی‌پردازند. با این حال، مطالعات قبلی نشان داده‌اند که شبکه‌های عصبی توانایی جداسازی بهتر منابع صوتی را نسبت به پردازنده‌های معمولی سیگنال دارند. با تکیه بر این یافته‌ها، آنها یک سیستم یکپارچه «شنیدنی» با هوش مصنوعی طراحی کردند که داده‌های صوتی را برای شناسایی واضح منابع صدا در داخل حباب تجزیه و تحلیل می‌کند. سپس سیستم، صداهای خارجی را در لحظه سرکوب می‌کند، بنابراین هیچ تاخیر محسوسی بین آنچه کاربران می‌شنوند و چیزی که در حین تماشای صحبت کردن فرد می‌بینند وجود ندارد.

بخش صوتی این سیستم یک هدست کاهش نویز تجاری با حداکثر شش میکروفن است که صداهای نزدیک و دورتر را تشخیص می‌دهد و داده‌هایی را برای تجزیه و تحلیل شبکه عصبی فراهم می‌کند.

شبکه‌های شخصی‌سازی شده فواصل تا منابع صوتی را پیدا و تعیین می‌کنند که کدام یک از آنها در داخل شعاع حباب قابل برنامه‌ریزی یک متر، ۱.۵ متر یا دو متری هستند، قرار دارند. این شبکه‌ها با داده‌های شبیه‌سازی‌شده و واقعی، در ۲۲ اتاق با اندازه‌های مختلف و کیفیت جذب صدا با ترکیب‌های مختلف سوژه‌های انسانی آموزش داده شدند و می‌توانند داده‌ها را در چند میلی‌ثانیه به هدفون برگردانند و به اندازه‌ای سریع هستند که شنوایی و بینایی را همگام می‌کنند.

فناوری حباب صدا در نهایت می‌تواند در سمعک‌ها ادغام شود. هم گوگل و هم سازنده سمعک سوئیسی فوناک(Phonak) عناصر هوش مصنوعی را به ترتیب به هدفون و سمعک خود اضافه کرده‌اند. اکنون بررسی نحوه قرار دادن رویکرد حباب صدا در قالب سمعک پوشیدنی در حال انجام است.

گولاکوتا مطمئن است که این کار قابل انجام است. او می‌گوید: ما در زمانی زندگی می‌کنیم که سخت‌افزار و الگوریتم‌ها برای پشتیبانی از تقویت هوش مصنوعی گردهم می‌آیند. این به معنای جایگزینی مشاغل توسط هوش مصنوعی نیست، بلکه به معنای تاثیر مثبت بر افراد از طریق رابط انسان و رایانه است.

منبع: ایسنا