مکالمه واضح در محیطهای شلوغ
به گزارش نبض بازار، بیشک چنین تجربهای داشتهاید که در ملاقات با یک دوست در هنگام صرف شام در رستوران یا ملاقات با یک فرد در یک مهمانی، یا برگزاری یک جلسه در میان هیاهوهای اداری، متوجه میشویم که مجبوریم به دلیل وجود صحبتهای پسزمینه و سر و صدای عمومی با صدای بلند حرف بزنیم. گوش و مغز انسان در شناسایی منابع مجزای صدا در یک محیط پر سر و صدا برای تمرکز بر یک مکالمه خاص چندان خوب عمل نمیکند. این توانایی با کاهش شنوایی عمومی که با افزایش طول عمر شیوع بیشتری پیدا میکند، بیشتر مختل میشود و میتواند منجر به انزوای اجتماعی شود.
با این حال، گروهی از محققان دانشگاه واشنگتن، مایکروسافت و هوش مصنوعی اسمبلی(Assembly) به تازگی نشان دادهاند که هوش مصنوعی میتواند در جداسازی منابع صوتی برای ایجاد منطقهای از سکوت، از انسان پیشی بگیرد. این حباب صدا به افراد در شعاع دو متری اجازه میدهد تا با تداخل بسیار کاهش یافته که از سوی سایر منابع صدا ایجاد میشود با یکدیگر صحبت کنند.
این گروه به رهبری شیام گولاکوتا(Shyam Gollakota)، استاد دانشگاه واشنگتن، قصد دارند هوش مصنوعی را با سخت افزار ترکیب کند تا تواناییهای انسان را افزایش دهند.
گولاکوتا میگوید این با کار با منابع محاسباتی عظیمی مانند منابع چت جیپیتی متفاوت است.
در حال حاضر، هدستهای کاهشدهنده نویز تجاری در بازار موجود هستند و نویز پسزمینه را سرکوب میکنند، اما به مشکل فواصل با منابع صدا یا سایر مسائل مانند طنین صدا در فضاهای بسته نمیپردازند. با این حال، مطالعات قبلی نشان دادهاند که شبکههای عصبی توانایی جداسازی بهتر منابع صوتی را نسبت به پردازندههای معمولی سیگنال دارند. با تکیه بر این یافتهها، آنها یک سیستم یکپارچه «شنیدنی» با هوش مصنوعی طراحی کردند که دادههای صوتی را برای شناسایی واضح منابع صدا در داخل حباب تجزیه و تحلیل میکند. سپس سیستم، صداهای خارجی را در لحظه سرکوب میکند، بنابراین هیچ تاخیر محسوسی بین آنچه کاربران میشنوند و چیزی که در حین تماشای صحبت کردن فرد میبینند وجود ندارد.
بخش صوتی این سیستم یک هدست کاهش نویز تجاری با حداکثر شش میکروفن است که صداهای نزدیک و دورتر را تشخیص میدهد و دادههایی را برای تجزیه و تحلیل شبکه عصبی فراهم میکند.
شبکههای شخصیسازی شده فواصل تا منابع صوتی را پیدا و تعیین میکنند که کدام یک از آنها در داخل شعاع حباب قابل برنامهریزی یک متر، ۱.۵ متر یا دو متری هستند، قرار دارند. این شبکهها با دادههای شبیهسازیشده و واقعی، در ۲۲ اتاق با اندازههای مختلف و کیفیت جذب صدا با ترکیبهای مختلف سوژههای انسانی آموزش داده شدند و میتوانند دادهها را در چند میلیثانیه به هدفون برگردانند و به اندازهای سریع هستند که شنوایی و بینایی را همگام میکنند.
فناوری حباب صدا در نهایت میتواند در سمعکها ادغام شود. هم گوگل و هم سازنده سمعک سوئیسی فوناک(Phonak) عناصر هوش مصنوعی را به ترتیب به هدفون و سمعک خود اضافه کردهاند. اکنون بررسی نحوه قرار دادن رویکرد حباب صدا در قالب سمعک پوشیدنی در حال انجام است.
گولاکوتا مطمئن است که این کار قابل انجام است. او میگوید: ما در زمانی زندگی میکنیم که سختافزار و الگوریتمها برای پشتیبانی از تقویت هوش مصنوعی گردهم میآیند. این به معنای جایگزینی مشاغل توسط هوش مصنوعی نیست، بلکه به معنای تاثیر مثبت بر افراد از طریق رابط انسان و رایانه است.
منبع: ایسنا