ظهور هوش مصنوعی در رابط کاربری محاوره ای بخش اول

ظهور هوش مصنوعی در رابط کاربری محاوره ای بخش اول

رابط  کاربری محاوره ای یک مفهوم جدید نیست. فن آوری هایی مانند پردازش زبان طبیعی برای یک مکالمه بسیار عالی هستند و ما در نهایت داریم به نقطه ای می رسیم که همه می توانند بدون در نظر گرفتن سطح مهارت از آن استفاده کنند.

 

برای مدت زمان طولانی، ما از نظر بصری در حال تغییر بودیم: دکمه ها، لیست های کشویی، اسلایدر و ... اما در حال حاضر ما به یک آینده که نه تنها از رابط های بصری، بلکه از موارد محاوره ای نیز تشکیل شده است، فکر می کنیم. مایکروسافت به تنهایی گزارش داده که سه هزار ربات جدید هر هفته در چارچوب رباتش ساخته می شوند.

مهمترین پیشرفت در رابط کاربری محاوره ای، پردازش زبان طبیعی (NLP) بوده است. این زمینه نه با رمزگشایی دقیق کلمات یک کاربر، بلکه با درک درستی از هدف واقعی آنهاست. اگر ربات رابط است، NLP مغز است.

 

تشخیص گفتار در برابر NLP

اکثر مردم با آمازون اکو، کورتانا، سیری یا گوگل هوم آشنا هستند، که همه آنها دارای رابط کاربری است که عمدتا مکالمه است. آنها همگی از NLP استفاده می کنند.

گذشته از این دستیارهای هوشمند، اکثر رابط های مکالمه هیچ ارتباطی با صدا ندارند. آنها با متن هدایت می شوند. اینها رباتهایی هستند که در Slack، Messenger فیس بوک هستند. آنها گیف های با کیفیت بالا را در چت ارائه می دهند، پروسه های ذهنی ما را تماشا می کنند و حتی درخواست های کششی ما را مدیریت می کنند.

ساختارهای مکالمه ای که بر اساس متن ساخته شده اند بسیار خوبند زیرا هیچ مولفه تشخیص گفتار وجود ندارد. متن از قبل تجزیه شده است.

در تعامل کلامی ، مشکل اساسی این است که گفتار را به رسمیت نمی شناسد. در iOS  وقتی نمیداند دقیقا چه چیزی گفته شده است یک خط خالی مینویسد. درسوی دیگر گوگل تلاش می کند حدس بزند.

با این وجود، تشخیص گفتار تا حد زیادی حل شده است. حتی به Chrome تا حد بسیار قابل توجهی پیشرفت داشته است.

پس از حل مشکل تشخیص گفتار و شروع به استفاده از آن در همه جا رابطها در تشخیص گفتاربه کاربر نیاز دارند که کلمات را دقیق بیان کنند و فقط می توانند تعداد محدودی از کلمات یا عبارات دقیق را که رابط کاربری آن را می داند معرفی کند. بدون NLP، رابط کاربری مکالمه می تواند کابوس باشد.

 

رابط کاربری محاوره ای بدون NLP

ما احتمالا همه با منوهای خودکار تلفن آشنا هستیم. که به عنوان سیستم پاسخ صوتی تعاملی یا IVR ها به صورت کوتاه شناخته می شوند . آنها برای جایگزینی اپراتور سنتی طراحی شده اند و به طور خودکار تماس گیرنده را به گزینه مناسب انتقال می دهند بدون اینکه با یک انسان صحبت کنند. در ظاهر، به نظر می رسد یک ایده خوب است. در عمل، عمدتا فقط انتظار می رود در حالی که یک صدای ضبط شده لیستی از آیتم های منو را بخواند.

NLP در چند سال گذشته بازار IVR را به طور قابل توجهی تغییر داده است. NLP می تواند قصد کاربر را از هر چیزی که می گوید، انتخاب کند.

ببینید که چگونه AT & T اینکار را انجام می دهد.

AT & T دارای یک رابط کاربری هوشمند است که از NLP استفاده می کند تا قصد من را مشخص کند. همچنین ممکن است که من ندانم چه باید بگویم. من می توانم کلی حرف بزنم و هنوز هم قصد من را تشخیص دهد.

AT & T همچنین از اطلاعاتی که در حال حاضر (شماره تلفن من) دارد استفاده می کند و سپس پیام های متنی را برای ارسال یک لینک به رابط کاربری بصری سنتی، که احتمالا UX بسیار بهتر برای پرداخت است، استفاده می کند. NLP تمام تجربه را در اینجا در اختیار دارد. بدون آن، بقیه تعاملات تقریبا بی استفاده اند.

NLP قدرتمند است، اما مهمتر از همه، برای توسعه دهندگان هم در همه جا قابل دسترسی است.



 

 

به اشتراک بگذارید :
جدیدترین مطالب گروه :