آمازون الکسا یک دستیار صوتی هوشمند است که قابلیتهای گستردهای برای تعامل با کاربران و کنترل دستگاههای هوشمند خانگی دارد. آمازون الکسا یک دستیار صوتی تعاملی است که میتواند وضعیت هوا را بررسی کند، پلیلیست مورد علاقه شما را پخش کند و کارهای بسیاری دیگری را انجام دهد. الکسا در بیشتر محصولات آمازون، از جمله اکو پاپ جدید، اکو دات مشهور و حتی انواع ترموستاتهای هوشمند، ساندبارها، لامپها و موارد دیگر یافت میشود. علاوه بر انجام دستورات پایهای از شما، الکسا میتواند دستورات را به سایر دستگاههای هوشمند متصل شما بدهد و زندگی شما را سادهتر کند.
الکسا
آمازون الکسا، یا به اختصار الکسا، یک فناوری دستیار مجازی است که عمدتاً بر اساس یک سیستم سنتز گفتار لهستانی به نام Ivona ساخته شده است و در سال 2013 توسط آمازون خریداری شد. این فناوری برای اولین بار در بلندگوی هوشمند آمازون اکو و بلندگوهای آمازون اکو دات، اکو استودیو و آمازون تپ که توسط Amazon Lab126 توسعه یافتهاند، استفاده شد. الکسا قابلیت پردازش زبان طبیعی برای وظایفی مانند تعامل صوتی، پخش موسیقی، ایجاد لیست کارها، تنظیم آلارم، استریم پادکست، پخش کتابهای صوتی، ارائه اطلاعات در زمان واقعی مانند وضعیت آبوهوا، ترافیک، ورزش و اخبار را داراست. الکسا همچنین میتواند چندین دستگاه هوشمند را به عنوان یک سیستم خودکار خانگی کنترل کند. قابلیتهای الکسا با نصب "مهارتها" (قابلیتهای اضافی که توسط فروشندگان شخص ثالث توسعه داده شدهاند، و در سایر زمینهها به طور معمول به عنوان اپلیکیشنها شناخته میشوند) مانند برنامههای آبوهوا و ویژگیهای صوتی گسترش مییابد. الکسا این وظایف را با استفاده از تشخیص خودکار گفتار، پردازش زبان طبیعی و سایر اشکال هوش مصنوعی ضعیف انجام میدهد.
برای بیشتر افراد، مهمترین چیزی که باید درباره الکسا بدانید این است که این نام صدایی است که از بلندگوهای مجهز به الکسا پخش میشود. به طور اساسی، الکسا برای آمازون همان چیزی است که سیری برای اپل است. الکسا صدایی است که میتوانید از آن سوال بپرسید و پاسخ بگیرید، مانند "هوا امروز در شیکاگو چگونه است؟".
کاربران میتوانند برنامه الکسا را با ساده گفتن نام "الکسا" فعال کنند، هرچند امکان تغییر کلمه بیدارباش به "آمازون"، "اکو"، "کامپیوتر" یا "زیگی" نیز وجود دارد. آمازون نام "الکسا" را انتخاب کرد زیرا شامل صدای نادر "x" است که احتمال بیدار شدن تصادفی دستگاه را کاهش میدهد. به گفته کارمندان آمازون، این نام همچنین به کتابخانه اسکندریه اشاره دارد که به طور فرضی تمام دانش جهان را در خود جای داده بود.
نحوه عملکرد الکسا
پس از اینکه کاربر کلمه بیدارباش را بگوید، یک دستگاه هوشمند مجهز به الکسا از میکروفون خود برای انتقال سوالات یا دستورات کاربر به سرویس صوتی الکسا (AVS) استفاده میکند. AVS، یک سرویس شناسایی صدا و درک زبان طبیعی مبتنی بر ابر است که کلمات کاربر را به قالب متنی تبدیل میکند، با تحلیل ویژگیهایی مانند فرکانس و زیر و بمی صدا. متن حاصل سپس با یکی از "مهارتهای" الکسا که AVS قادر به انجام آن است مطابقت داده میشود (مثلاً پخش موسیقی در برنامه Spotify).تا سال 2023، الکسا بیش از 130,000 مهارت دارد.
خدمات الکسا
الکسا در بسیاری از خدمات آمازون یکپارچه شده و میتوان از آن در محصولاتی مانند آمازون اکو اصلی، اکو دات، اکو اسپات، اکو شو یا آمازون فایر تیوی استفاده کرد . فهرست دستورات الکسا به نظر میرسد هر روز گسترش مییابد. آمازون این دستورات را "مهارتها" مینامد و شما حتی میتوانید از طریق آمازون بلوپرینت مهارتهای خود را ایجاد کنید. پس از بررسی توسط آمازون، میتوانید مهارتهای خود را در فروشگاه مهارتهای آمازون برای استفاده دیگران منتشر کنید. تعداد وظایفی که الکسا میتواند انجام دهد، بیشتر از آن است که در این مقاله ذکر شود، بنابراین مطمئن شوید که بهترین مهارتهای الکسا در سال 2023 را بررسی کنید.
کاربردهای الکسا در روال خواب و بیداری
علاوه بر این، الکسا در کمک به افراد برای تنظیم روال خواب و بیداری بسیار مفید است. تنها کافی است یک فرمان اختصاص دهید و آن فرمان خاص میتواند یک سری از رویدادها را آغاز کند. به عنوان مثال، اگر بگویید "الکسا، شب بخیر"، میتواند دستگاه را برای خاموش کردن تمام چراغهای خانه، مسلح کردن سیستم امنیتی و روشن کردن دستگاه نویز محیطی همزمان آغاز کند. میتوانید روال خود را بسیار خاص کنید؛ اگر بخواهید، میتوانید الکسا را برنامهریزی کنید که چراغهای مورد علاقه شما را روشن کند، 10 دقیقه صبر کند و سپس قهوهساز را روشن کند. اگر زودتر از شریک زندگی خود بیدار میشوید، میتوانید از حالت زمزمه الکسا استفاده کنید تا با زمزمه با شما ارتباط برقرار کند و به زمزمههای شما گوش دهد.
ویژگی امنیتی Alexa Guard
الکسا گارد یک ویژگی امنیتی مفید است که محیط خانه شما را به دقت نظارت میکند و فعالیتهای داخلی خانه را زمانی که شما آنجا نیستید پیگیری میکند. اگر بلندگوی اکو شما صدای نامعمولی مانند شکستن شیشه یا صدای مشکوک دیگری را دریافت کند، الکسا سریعاً شما را با یک اعلان هشدار میدهد. با الکسا گارد پلاس (نسخه پولی از این ویژگی)، شما همان ویژگیهای نظارت بر خانه، دسترسی به خط اضطراری آمازون و چندین ابزار امنیتی دیگر را خواهید داشت.
آمازون به طور مداوم در حال کار بر روی بهبود و گسترش عملکردها و قابلیتهای الکسا است. به عنوان مثال، شرکت در حال اجرای ویژگیهای تشخیص خستگی است، بنابراین الکسا قادر خواهد بود تن صدای شما را تشخیص دهد و بفهمد که آیا از آن ناراضی هستید یا خیر. اگر میخواهید بیشتر درباره این ویژگیهای جدید الکسا بدانید، کافی است بپرسید: "الکسا، جدید چه خبر؟" و با خوشحالی به اشتراک میگذارد.
تاریخچه
Amazon Lab126، یک شرکت تابعه مسئول برای بخش زیادی از تحقیقات و توسعه آمازون، به طور مخفیانه توسعه یک کامپیوتر کنترل صوتی را در سال 2011 با نام رمز دوپلرآغاز کرد. برای بدست آوردن دادههای لازم برای تکمیل پروژه، این شرکت چندین استارتاپ کوچک را خریداری کرد. یکی از این شرکتها، استارتاپ لهستانی Ivona بود که آمازون آن را در سال 2012 به مبلغ 30 میلیون دلار خریداری کرد (آمازون این خرید را تا یک سال اعلام نکرد). برنامه سنتز گفتار Ivona، به نامSpiker، پایه و اساس الکسا شد.
طراحی اولیه
در ابتدا، جف بزوس، مدیرعامل آمازون، میخواست یک کامپیوتر کنترل صوتی که دارای دهها صدا باشد، هر کدام به مجموعهای از وظایف مختلف مرتبط، طراحی کند، اما این آرزو در نسخه نهایی الکسا محقق نشد. در عوض، تیم بر روی توسعه یک صدا متمرکز شدند که با نوشتن لیستی از ویژگیهای مطلوب مانند قابل اعتماد بودن و گرمی انتخاب شد. تحقیقات نشان داد که چنین ویژگیهایی بیشتر با صداهای زنانه مرتبط هستند، و بنابراین تیم تلاش خود را بر این صداها متمرکز کرد.
صدایی که در نهایت انتخاب شد، به نینا روله، یک بازیگر صدا و خواننده اهل بولدر، کلرادو، منسوب شده است، اما نه آمازون و نه روله هرگز این موضوع را تایید نکردهاند. پس از انتخاب بازیگر صدا، صدای او توسط یک استودیوی صداگذاری مستقر در آتلانتا به نام GM Voices، که قبلاً با اپل برای ایجاد صدای سیری همکاری کرده بود، ضبط شد. این مسیر توسعه نشاندهنده فرآیند دقیق و جامع ایجاد یکی از پیشرفتهترین دستیارهای صوتی جهان است.
دادن صدا به الکسا به بسیاری از جهات برای سازندگان الکسا آسانتر بود؛ چالش اصلی ایجاد توانایی شنیدن برای الکسا (یا در واقع، AVS) بود. آموزش الکسا برای تشخیص سوالات و دستورات، نیاز به آموزش برنامه با تعداد زیادی نمونههای صوتی داشت.
جمعآوری دادههای صوتی
برای به دست آوردن این دادهها، آمازون شرکت جمعآوری دادههای استرالیایی Appen را استخدام کرد که خانهها و آپارتمانهایی را اجاره میکرد و کارکنان موقت خطوط از پیش تعیین شده را میخواندند و به درخواستهای باز مانند "از الکسا بپرس که آهنگ مورد علاقه شما را پخش کند" پاسخ میدادند.این فرآیند به الکسا کمک کرد تا با مجموعهای بزرگ از نمونههای صوتی آموزش ببیند و تواناییهای شناسایی و درک زبان طبیعی خود را بهبود بخشد. این نشاندهنده تعهد آمازون به ایجاد یک دستیار صوتی است که بتواند به دقت و با اطمینان به کاربران پاسخ دهد.
آمازون با احتیاط آمازون اکو را در نوامبر 2014 به بازار عرضه کرد و در ابتدا تنها 80,000 دستگاه را عرضه کرد و آنها را تنها به مشتریانی فروخت که قبلاً برای خرید یک اکو ثبت نام کرده بودند (تقریباً 109,000 نفر این کار را انجام دادند). احتیاط شرکت غیرضروری بود زیرا اکو یک موفقیت فوری بود. تا پایان سال 2016، آمازون بیش از هشت میلیون اکو و اکو دات (نسخه کوچکتر و ارزانتر اکو) فروخته بود؛ تا سال 2019، این شرکت بیش از 100 میلیون دستگاه الکسا فروخته بود. در آن زمان، الکسا شرکت برتر فروش بلندگو در جهان بود.
این موفقیت نشاندهنده تقاضای بالای مصرفکنندگان برای دستیارهای صوتی هوشمند و توانایی آمازون در ایجاد یک اکوسیستم قدرتمند از دستگاههای هوشمند خانگی است.
کاربرد های بیشتر الکسا
الکسا میتواند تعدادی از توابع پیشفرض را به صورت آماده استفاده انجام دهد، مانند تنظیم تایمر، به اشتراک گذاشتن وضعیت آبوهوا، ایجاد لیستها، دسترسی به مقالات ویکیپدیا و بسیاری موارد دیگر. کاربران با گفتن کلمه بیدارباش تعیین شده (که به طور پیشفرض "الکسا" است) دستگاه مجهز به الکسا را برای دریافت دستور بیدار میکنند. الکسا به دستور گوش میدهد و عملکرد یا مهارت مناسب را برای پاسخ به سوال یا دستور انجام میدهد.
فرآیند عملکرد الکسا
زمانی که سوالات مطرح میشوند، الکسا امواج صوتی را به متن تبدیل میکند که به آن اجازه میدهد اطلاعات را از منابع مختلف جمعآوری کند. پشت صحنه، دادههای جمعآوری شده گاهی اوقات به انواع مختلف تامینکنندگان از جمله WolframAlpha، iMDB، AccuWeather، Yelp، Wikipedia و دیگران منتقل میشود تا پاسخهای مناسب و دقیق ایجاد شود. دستگاههای پشتیبانی شده توسط الکسا میتوانند موسیقی را از حسابهای Amazon Music صاحب دستگاه پخش کنند و دارای پشتیبانی داخلی برای حسابهای Pandora و Spotify هستند. الکسا میتواند از طریق تلفن یا تبلت، موسیقی را از سرویسهای استریم مانند Apple Music و Google Play Music پخش کند.
مهارتهای اضافی
علاوه بر اجرای توابع پیشفرض، الکسا میتواند توابع اضافی را از طریق مهارتهای ثالث که کاربران میتوانند فعال کنند، انجام دهد. برخی از محبوبترین مهارتهای الکسا در سال 2018 شامل "سوال روز" و "مسابقه جغرافیایی نشنال جئوگرافیک" برای مسابقات، "TuneIn Live" برای گوش دادن به رویدادهای زنده ورزشی و ایستگاههای خبری، "Big Sky" برای بهروزرسانیهای دقیق آبوهوا، "صداهای خواب و آرامش" برای گوش دادن به صداهای آرامشبخش، "Sesame Street" برای سرگرمی کودکان و "Fitbit" برای کاربران Fitbit که میخواهند آمار سلامتی خود را بررسی کنند.
همکاریها و بهبودها
در سال 2019، اپل، گوگل، آمازون و Zigbee Alliance یک همکاری را برای هماهنگ کردن محصولات خانه هوشمند خود اعلام کردند. آمازون با استفاده از مدل Titan خود، ویژگیهای AI مولد را به الکسا اضافه میکند تا با AIهایی مانند ChatGPT رقابت کند. این بهروزرسانی به عنوان یک سرویس اشتراکی جداگانه ارائه خواهد شد که احتمالاً بین 10 تا 20 دلار در ماه هزینه خواهد داشت. هنوز تاریخ راهاندازی تأیید شدهای وجود ندارد.
چرا الکسا را انتخاب کنیم؟
اپل سیری دارد. گوگل هوم، دستیار گوگل را دارد که وقتی میگویید "OK, Google" فعال میشود. آمازون، الکسا را دارد. اما چرا؟ طبق گفته دیوید لیمپ، مدیر اجرایی آمازون که توسعه این سرویس را نظارت میکرد، نام "الکسا" به چند دلیل انتخاب شده است. ابتدا، نام "الکسا" به کتابخانه اسکندریه اشاره دارد که تلاش میکرد تمام دانش جهان را جمعآوری کند. آمازون نیز در تلاش است که همان کار را انجام دهد. الکسا همیشه در حال یادگیری است، اما از نظر تئوری، باید یک منبع اطلاعاتی بدون نقص باشد.به طور عملیتر، این سرویس به نام الکسا نامگذاری شده است زیرا حاوی صدای نادر "X" است. از آنجا که این سرویس به صورت صوتی فعال میشود، آمازون میخواست نامی را انتخاب کند که با کلمات دیگر که ممکن است به طور تصادفی دستگاه را بیدار کنند، اشتباه نشود.
گفتگوی دیوید لیمپ
لیمپ گفت: "ما از چندین نام عبور کردیم و نام مهم است، به اندازه شخصیتی که در اطراف آن ایجاد میشود، نه تنها این رایانه مبتنی بر صدا در ابر. اما پشت آن علم کامپیوتر نیز وجود دارد. اگر هر کدام از شما اکوها دارید، میدانید که تنها وقتی بیدار میشود که کلمه ‘الکسا’ را میشنود و آواشناسی آن کلمه و نحوه تجزیه آن و این که دارای یک همخوان سخت با ‘X’ در آن است، مهم است که مطمئن شویم تنها وقتی بیدار میشود که از آن خواسته شده باشد. و بنابراین، ترکیبی از این دو چیز به ما اجازه داد که روی الکسا تمرکز کنیم. این توضیح نشاندهنده اهمیت نامگذاری و شخصیتبخشی در طراحی دستیارهای صوتی است.
کاربران میتوانند مهارتهای اضافی را از طریق آمازون بلوپرینت فعال کنند که شامل برنامههای مختلف مانند مسابقات، بهروزرسانیهای آبوهوا و صداهای آرامشبخش است.تا سال 2019، آمازون بیش از 100 میلیون دستگاه مجهز به الکسا فروخت و الکسا به عنوان برترین شرکت فروش بلندگوهای هوشمند شناخته شد. آمازون با استفاده از مدل Titan در حال افزودن ویژگیهای هوش مصنوعی مولد به الکسا است تا با دستیارهای هوشمند دیگر مانند ChatGPT رقابت کند.
ترجمه و گرداوری : ندا خدری