Web Analytics Made Easy - Statcounter

قابلیت ترجمه همزمان گفتار به برنامه Google Translate توسط مسئولان گوگل اعلام شد.

به گزارش گروه رسانه‌های دیگر خبرگزاری آنا، شرکت گوگل در نظر دارد تا در آینده‌ای نه چندان دور قابلیت ترجمه در لحظه را به برنامه مترجم خود در سیستم عامل‌های اندروید اضافه کند. این قابلیت به کاربران اجازه می‌دهد تا صحبت‌ها را به یک زبان ضبط کرده و سپس به زبانی دیگر ترجمه کنند.

بیشتر بخوانید: اخباری که در وبسایت منتشر نمی‌شوند!

در حال حاضر این برنامه تنها در مراحل اولیه قرار دارد، اما شرکت گوگل در جلسه مربوط به هوش مصنوعی در سان فرانسیسکو تا حدودی از این قابلیت رونمایی کرد.

به گفته مسئولان شرکت گوگل، این قابلیت در ابتدا به اتصال اینترنت نیاز دارد، یعنی امکانات مورد نظر تحت عنوان یک قابلیت موجود در داده دانلود شده برنامه، مانند دیگر امکانات Google Translate، وجود نخواهد داشت. علت این عمل به گفته شرکت گوگل ساده نبودن ترجمه همزمان صحبت‌ها است.

مسئولین گوگل در این رابطه گفتند: " ترجمه همزمان چند زبان کار بسیار دشوارتری نسبت به نوشتن و تایپ کردن یک متن در داخل برنامه است. حتی ضبط یک جمله کوتاه صوتی بسیار آسان‌تر از این قابلیت است". گفتنی است؛ این قابلیت از فایل‌های صوتی جداگانه پشتیبانی نمی‌کند، اما گوگل به کاربران این پیشنهاد را می‌دهد که قسمت مورد نظر خود را با دستگاهی دیگر پخش کرده و توسط گوشی خود ضبط کنند؛ از این طریق افراد می‌توانند قسمت مورد نظر را ترجمه کنند. گوگل همچنین تاکید کرد که قابلیت ضبط صدا به صورت یک متن طولانی هنوز در حال ساخت و توسعه است.

چگونگی عملکرد این قابلیت‌

روش پردازش این قابلیت به گونه‌ای است که گفته‌های هر شخص در زمان ضبط به کلی دریافت شده و پس از آن با منطق گرامر هر زبان، مرتب می‌شود و ایرادات دریافت شده توسط برنامه اصلاح می‌شود. قابلیت مذکور همچنین قرار است به لهجه‌های مختلف مجهز شود. مسئولین شرکت گوگل اعلام کردند که کاربران باید متوجه این مسئله باشند که برنامه ارائه شده ترجمه تحت‌اللفظی یک متن را در اختیار می‌گذارد.

اما این شرکت همچنین وعده داده است که با گذر زمان هوش مصنوعی ناظر بر ترجمه این برنامه به روش‌های ترجمه صحیح‌تر آشنا خواهد شد و در نتیجه این امر کمک بیشتری در سرعت درک افراد خواهد کرد. لازم به ذکر است که هیچ زمان دقیقی برای رونمایی از این قابلیت مشخص نیست و گوگل تنها اعلام کرده که این پروژه در حال توسعه و بررسی است.

 

انتهای پیام/

منبع: آنا

کلیدواژه: گوگل

درخواست حذف خبر:

«خبربان» یک خبرخوان هوشمند و خودکار است و این خبر را به‌طور اتوماتیک از وبسایت ana.press دریافت کرده‌است، لذا منبع این خبر، وبسایت «آنا» بوده و سایت «خبربان» مسئولیتی در قبال محتوای آن ندارد. چنانچه درخواست حذف این خبر را دارید، کد ۲۶۷۰۸۸۹۰ را به همراه موضوع به شماره ۱۰۰۰۱۵۷۰ پیامک فرمایید. لطفاً در صورتی‌که در مورد این خبر، نظر یا سئوالی دارید، با منبع خبر (اینجا) ارتباط برقرار نمایید.

با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت «خبربان» مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویر است، مسئولیت نقض حقوق تصریح شده مولفان در قانون فوق از قبیل تکثیر، اجرا و توزیع و یا هر گونه محتوی خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.

خبر بعدی:

تبدیل افکار خاموش ذهن به گفتار| ابزاری که اندیشه را واژه می‌کند!

خبرگزاری علم‌وفناوی آنا- هدا عربشاهی: استفان هاوکینگ، اخترفیزیکدان و ریاضیدان انگلیسی که بیش‌از هرچیز به‌دلیل مطالعاتش درباره سیاهچاله‌ها شناخته می‌شد، از اواخر میان‌سالی به‌طرز روبه‌رشدی برای برقراری ارتباط با دیگران با مشکل مواجه شد. آتروفی عضلانی نخاعی پیشرونده، بیماری حادی که در سن ۲۱ سالگی به او حمله‌ور شد علاوه‌بر فلجی ماهیچه‌های مورد نیاز برای راه‌رفتن و نوشتن، به‌تدریج عضلاتی را که در صحبت‌کردن نقش دارند درگیر کرد به‌طوری‌که او سال‌ها فقط با انقباض ماهیچه‌های گونه و انتقال این حرکات ازطریق حسگرهای فروسرخ به رایانه، توان نوشتن و صحبت‌کردن داشت. اما زمانی‌که او به سن ۷۱ سالگی رسید، قدرت ماهیچه‌های گونه‌اش هم به مرور تحلیل رفت و به‌این‌ترتیب، یکی از پویاترین ذهن‌های علم قادر بود فقط یک کلمه در دقیقه بنویسد. ازاین‌رو، سال ۲۰۱۳ شرکت آمریکایی اینتل، پیشگام در فناوری‌های تراشه و سامانه‌های رابط کاربری، دستگاه جدیدی ساخت که به این دانشمند اجازه می‌داد هر ۶۰ ثانیه ۵ تا ۱۰ کلمه بنویسد و حرف بزند. این سامانه که برپایه فناوری تشخیص چهره بود نه‌فقط حرکات عضلات گونه، که حرکات دهان و ابروها را هم ثبت می‌کرد و به‌این‌ترتیب، هاوکینگ می‌توانست از آن برای انتخاب حروف روی صفحه نمایشگر رایانه، نوشتن واژه‌ها و عبارات و تبدیل آنها به صدای الکترونیکی استفاده کند. اگر امروز این فیزیکدان انگلیسی زنده بود شاید می‌توانست به استفاده از نمونه‌های اولیه‌ دستگاه‌هایی که به مدد هوش‌مصنوعی افکار را می‌خوانند و آنها را به کلمات تبدیل می‌کنند برای برقراری ارتباط با سرعتی بیشتر امیدوار باشد.

هوش‌مصنوعی سکوت ذهن را می‌شکند

از سال ۲۰۱۹ گروهی از دانشمندان دانشگاه کلمبیا در کانادا به سرپرستی پژوهشگر ایرانی، نیما مسگرانی، با کمک هوش‌مصنوعی گام‌های رو به جلویی را برای تحقق رویای امکان تبدیل افکار خاموش ذهن به گفتار برمی‌دارند. به اعتقاد این دانشوران، آنچه که درحال‌حاضر قدم‌های نخستین خودش را می‌پیماید ظرف یک‌دهه آینده به واقعیتی دردسترس تبدیل خواهد شد. تیم نیما مسگرانی مشغول توسعه الگوریتمی است که بااستفاده از هوش‌مصنوعی و استفاده از دستگاه الکتروانسفالوگرام قادر است سیگنال‌های مغز را به کلمات گفتاری تبدیل کند.

همچنین یک‌سال پیش‌از آغاز این پروژه، یعنی سال ۲۰۱۸، گروهی از دانشمندان علوم اعصاب دانشگاه تورنتو، سامانه‌ای را توسعه دادند که امکان بازآفرینی تصویر ذهنی را روی صفحه نمایشگر میسر می‌کرد. این سامانه زمانی مفید است که شخصی بخواهد چهره‌ای را تشخیص دهد که در ذهنش واضح است، اما قادر به توصیف آن برای کارشناسان تشخیص چهره یا کشیدن آن روی کاغذ نیست و با کمک این سامانه و به لطف اسکن افکار، بازنمایی آن چهره امکان‌پذیر می‌شود. آزمایش این پژوهشگران، نمونه‌ای از افرادی را شامل می‌شد که عکسی از صورت انسانی به آنها نشان داده شده بود و هنگام انجام الکتروآنسفالوگرام آنها باید درباره تک‌تک جزییات چهره فردی که تصویرش را دیده بودند فکر می‌کردند و هم‌زمان، دستگاه ثمره آن افکار را روی صفحه نمایشگر می‌کشید و بازنمایی می‌کرد. درنهایت چهره شخص در عکس به‌طور کامل روی نمایشگر ظاهر می‌شد.

اما نیما مسگرانی، سرپرست گروه پژوهشگران دانشگاه کلمبیا در این تحقیقات بر ابزار خاصی به‌نام «ووُکدر» به‌معنی «رمزگذار صوت» تکیه کرد. این دستگاه قادر است هر سیگنال صوتی را به‌صورت کدهایی رمزگذاری کند. الگوریتم‌هایی با قابلیت یادگیری جملات و داستان‌های کوتاه و بازتولید کلمات و گفتارهای خاص در این دستگاه نصب شده‌اند. این همان فناوری است که به سامانه دستیار صوتی الکسا محصول آمازون و سیری محصول اپل اجازه می‌دهد که به سوال‌های کاربران پاسخ صحیح ارائه دهند. این مطالعه داده‌هایی را از پنج بیمار مبتلا به صرع در‌حالی‌که تحت جراحی مغز و اعصاب بودند جمع‌آوری کرد. در مغز این بیماران یک سری الکترود کاشته شده بود که به دانشوران اجازه ‌داد همان‌طورکه بیماران به داستان‌هایی که چهار نفر مختلف تعریف می‌کردند گوش می‌دادند اندازه‌گیری‌های الکتروکورتیکوگرافی جامعی انجام دهند. هر ضبط عصبی حداکثر ۳۰ دقیقه طول کشید.

پس‌از جمع‌آوری داده‌ها، دستگاه رمزگذار صوتی امواج مغزی تولیدشده در قشر شنوایی را خواند و از آنها برای تبدیل آنچه که مغز شنیده بود به گفتار استفاده کرد. سپس صدای تولید‌شده با سامانه هوش‌مصنوعی از هرگونه اصوات مزاحم پاک و درنهایت، داده‌ها برای شنوندگانی بیرون از این آزمایش پخش شد. به‌گفته نیما مسگرانی، شنوندگان تا 75 درصد مواقع توانستند صداها را بفهمند و تکرار کنند که در مقایسه با تلاش‌های قبلی به‌طور متوسط بی‌نظیر است. او همچنین پیش‌بینی می‌کند که این فناوری دست‌کم تا یک دهه آینده در سطح جهانی در دسترس خواهد بود و هرچند امکان انجام اندازه‌گیری‌های الکتروکورتیکوگرافی (در تماس مستقیم با کورتکس مغز) محدود است، اما به‌هررو، این آزمایش می‌تواند پایه و اساس تبدیل افکار انسان به گفتار باشد. گام بعدی، اصلاح الگوریتم‌ها است تا بتوانند کلمات و جملات پیچیده را رمزگشایی کنند، تاحدی‌که این فناوری در آینده، واقعا بتواند به نقطه عطفی تبدیل شود که نه‌فقط در زندگی روزمره، که برای رفاه بیمارانی که به‌دلیل بیماری‌های تخریب نورونی و آسیب‌های مغزی نمی‌توانند صحبت کنند هم مفید باشد.

الگوریتمی برای تبدیل فعالیت مغزی به جملات

پس‌از مطالعات سال ۲۰۱۹ دانشمندان دانشگاه کلمبیا، گروهی از پژوهشگران دانشگاه کالیفرنیا در سال ۲۰۲۰ الگوریتمی را توسعه دادند که قادر است امواج مغزی را پردازش و آنها را به جملات معنا‌دار تبدیل کند. براساس داده‌های این محققان که در نشریه تخصصی نیچر نوروساینس منتشر شده است، میانگین میزان خطای این مدل برابر با ۳ درصد است. جوزف ماکین، متخصص یادگیری ماشین در این پژوهش می‌گوید: «واسط‌های ذهن و ماشین موفقیت محدودی در رمزگذاری فعالیت‌های عصبی نشان می‌دهند و قادر به رمزگشایی قطعات کلمات یا جملات خاص ساده هستند.» کار ماکین و گروهش با مشارکت چهار داوطلب شروع شد که در مغز آنها هم الکترودهایی برای نظارت بر تشنج‌های صرع کاشته شده بود. از داوطلبان خواسته شد تا حدود ۵۰ جمله مختلف را چندبار با صدای بلند بخوانند: جملات ساده‌ای چون «تینا ترنر یک خواننده پاپ است» یا «آن دزدها ۳۰ جواهر را دزدیدند». و هم‌زمان دانشمندان فعالیت مغز آنها را ثبت کردند. سپس الگوریتم هوش‌مصنوعی که برای تبدیل سیگنال‌های مغز به نمایش‌های انتزاعی، در قالب رشته‌های عددی طراحی شده بود، این داده‌های جمع‌آوری‌شده را پردازش کرد. در مرحله بعد، این رشته‌های عددی را کلمه به کلمه رمزگشایی کرد تا جملات تولید شوند. درطول مرحله آزمایش، سامانه ابتدا جملات بی‌معنی تولید می‌کرد، اما زمانی‌که «یاد گرفت» کدام جملات به کدام رشته‌ها متصل‌اند و کدام کلمات بیشتر با هم ظاهر می‌شوند، نتایج بهبود یافت. هرچند دقت تشخیص از فردی به فرد دیگر متفاوت است اما به‌طور متوسط فقط در ۳ درصد جملات خطا شناسایی شد.

انتهای پیام/

دیگر خبرها

  • تبدیل افکار خاموش ذهن به گفتار| ابزاری که اندیشه را واژه می‌کند!
  • تفاوت های آیفون 13 و 13 پرو در چیست ؟
  • اجرای بیش از ۴۰۰ برنامه همزمان با هفته عقیدتی سیاسی در لرستان
  • یکپارچه سازی هوش مصنوعی اوپن ای آی و گوگل در آیفون‌های جدید
  • ارزش گوگل اوج گرفت؛ غول تکنولوژی از ۲ تریلیون دلار گذر کرد
  • کرونوس؛ نخستین زیردریایی رادارگریز جهان با قابلیت چرخش 180 درجه در سرعت کامل(+فیلم و عکس)
  • انتشار جزئیاتی بیشتر از هوش‌مصنوعی آیفون/ پای غول‌های فناوری در میان می‌آید!
  • گوگل ۲۰ کارمند دیگر را هم اخراج کرد!
  • گوگل ۲۰ کارمند دیگر را به علت حمایت از مظلومان غزه اخراج کرد
  • جزئیات کامل اندروید ۱۵ چه زمانی منتشر می‌شود؟