‘스마트’한 집을 소유한 개인은 아마존의 알렉사, 구글 어시스턴트, 애플의 시리 같은 가상 도우미를 활용할 가능성이 높습니다. 문제는 이렇게 널리 보급된 국내 디지털 컨시어지가 인공지능을 활용하고 있는지, 활용한다면 어느 정도까지 활용하고 있는지에 대한 의문이 제기됩니다.

알렉사 같은 가상 비서도 인공지능을 사용하나요?

가상 비서는 인공지능을 통해 언어를 처리할 수 있기 때문에 음성 명령과 쿼리를 보다 효과적으로 이해하고 처리할 수 있으며, 궁극적으로 전반적인 기능을 향상시킬 수 있습니다.

각 가상 비서는 고유한 특성을 나타내지만, 기본 인공지능(AI)과 머신 러닝 기능은 종종 겹치는 경우가 많습니다. 실제로 Siri, Alexa, Google Assistant를 비롯한 많은 인기 가상 비서는 사용자 입력을 처리하고 관련 기능을 수행하기 위해 AI 및 머신 러닝 알고리즘을 사용합니다.

Alexa는 인공 지능과 자연어 처리(NLP)를 사용하여 사용자 요구를 실행합니다. “자연어”라는 용어는 대인 커뮤니케이션에 사용되는 언어 매체를 의미하며, 유동적이고 유기적인 흐름이 특징입니다. 음성 명령을 최적으로 처리하기 위해 Alexa와 같은 디지털 비서는 요청의 특성을 완전히 이해하기 위해 고급 NLP 기능에 의존합니다.

Amazon은 자연어 이해 능력을 자연어 이해(NLU)라고 합니다. Amazon에 따르면 NLU는 단순히 문자 그대로의 텍스트를 분석하는 것이 아니라 사용자의 진술 뒤에 숨겨진 의도된 의미를 유추할 수 있게 해줍니다. 예를 들어, 고객이 “일기 예보”라는 특정 문구가 아닌 다른 문구를 사용하여 현재 실외 상태에 대해 문의하면 NLU를 통해 Alexa가 관련 답변을 제공할 수 있습니다.

Amazon은 자연어 이해(NLU)가 컴퓨터 시스템에 사람의 말을 둘러싼 관련 맥락을 제공하는 동시에 사람들이 동일한 아이디어를 표현하는 다양한 방식을 이해할 수 있도록 하는 데 중점을 둔다고 강조합니다. 기본적으로 NLU는 언어적 의사소통 중에 사용자의 문의를 보다 정확하게 파악할 수 있도록 지원합니다.

Google 어시스턴트는 자연어 처리(NLP)와 여러 복잡한 알고리즘을 사용하여 음성 입력을 처리하고 양방향 커뮤니케이션을 원활하게 합니다.2022년에 첫 선을 보인 ‘보기 및 말하기’라는 기능은 이러한 알고리즘을 활용하여 사용자가 단순히 네스트 허브 근처에 있는지 아니면 네스트 허브와 상호작용할 의도가 있는지를 파악하는 기능 중 하나입니다.

이 글도 확인해 보세요:  소노스 레이와 소노스 빔: 나에게 가장 적합한 사운드바는?

그 이후로 Google 어시스턴트는 몇 차례 업데이트를 거쳤습니다. 2024년 1월, Google 을 통해 미디어 알람 및 Google Play 북 음성 제어와 같이 사용 빈도가 낮은 기능을 제거할 것이라고 발표했습니다.

지금까지 아마존의 알렉사, 구글 어시스턴트, 애플의 시리가 어떻게 인공 지능을 활용하여 각자의 작업을 수행하는지 살펴보았습니다. 이 세 가지 가상 비서는 모두 자연어 처리(NLP) 기술을 사용하여 음성 명령을 인식하고 그에 따라 응답할 수 있습니다. 특히 반복 신경망을 사용하여 “Siri야”와 같은 음성 트리거를 식별하므로 사용자가 쉽게 대화를 시작할 수 있습니다. 또한 세 가지 모두 머신 러닝 알고리즘을 활용하여 시간이 지남에 따라 정확성과 효율성을 지속적으로 개선합니다.

생성형 인공지능은 ChatGPT와 같은 혁신적인 플랫폼에 적용된 사례에서 알 수 있듯이 인공지능 비서에 점점 더 많이 활용되고 있습니다.

구글과 알렉사는 모두 생성형 인공지능 기능을 통합하여 음성 비서 기술을 향상시키는 과정에 있습니다. 특히 구글은 이러한 목표를 달성하기 위해 제미니라는 독자적인 언어 모델을 활용하고 있습니다. 반대로 Amazon은 음성 어시스턴트의 기능을 향상시키기 위해 “Alexa AI”라는 내부 언어 모델을 개발 중입니다.

아마존은 자사의 Alexa AI 기술이 지속적인 활성화 문구 없이 중단 없는 상호 작용, 맞춤형 응답, 단 한 번의 명령으로 상호 연결된 수많은 가젯에 대한 명령 등 여러 가지 이점을 제공한다고 밝혔습니다.

2023년 7월, Apple은 챗봇인 Apple GPT에 사용될 Ajax라는 자체 LLM을 개발 중이라는 발표를 했습니다. 2024년 초, 애플이 생성 AI를 사용하여 Siri를 개선하기 위해 노력하고 있다는 보도가 나오기 시작했습니다. 블룸버그 파워 온 보고서 에서 애플이 Siri에 대해 “대대적인 개편을 계획하고 있다”고 언급했습니다.

애플은 현재 가상 비서인 Siri와 고객 지원 플랫폼인 Apple Care와 관련된 인공 지능(AI) 코드 개발에 참여하고 있는 것으로 알려졌습니다. 또한 이러한 발전과 관련된 추가 세부 사항은 2024년까지 공개될 것으로 예상됩니다.

이 글도 확인해 보세요:  ChatGPT와 구글 바드: 어느 쪽이 더 낫나요?

시리, 알렉사, 구글 어시스턴트를 AI로 간주해야 하나요?

자연어 처리(NLP) 및 머신러닝(ML)과 같은 인공지능 기술을 활용하는 가상 비서는 그 자체로 인공지능의 한 형태로 간주할 수 있습니다. 아마존의 알렉사, 구글 어시스턴트, 애플의 시리 등 음성 인식 기능이 있는 기기는 NLP와 ML 기술을 자주 적용하기 때문에 종종 AI 도구로 묘사됩니다.

이러한 가상 비서는 인공지능을 활용하는 것 이상의 다양한 기능을 보유하고 있지만, 기능상 인공지능에 대한 의존도가 높기 때문에 인공지능 기반 엔터티로 분류하는 것이 적절할 수 있습니다.

가상 비서의 인공지능 미래

수많은 가상 비서 서비스 제공업체들이 공통적으로 보이는 특징은 현재 각자의 플랫폼에 생성형 인공지능을 통합하려는 노력입니다.

생성형 인공 지능은 딥 러닝 및 신경망과 같은 고급 기술을 활용하여 텍스트 또는 그래픽 데이터의 형태를 취할 수 있는 사용자 제공 입력을 기반으로 서면 또는 시각적 콘텐츠를 생성하는 광범위한 인공 지능 영역 내의 특정 영역을 나타냅니다. 가상 비서 애플리케이션에 생성 AI 기능을 통합하는 것은 LLM이라고 하는 대규모 언어 모델을 구현함으로써 용이해집니다.

가까운 미래에 고급 생성형 인공지능은 다음과 같은 다양한 뛰어난 능력과 기능을 갖춘 가상 비서를 제공할 수 있을 것입니다:

사용자의 특정 위치와 선호도를 고려하여 개별화된 여정을 개선하는 것은 탁월한 고객 경험을 제공하는 데 매우 중요합니다.

일상적인 문제를 효과적으로 해결하기 위한 안내와 제안을 제공합니다.

챗봇과 사람 간의 상호작용 품질을 개선하기 위한 한 가지 잠재적 접근 방식은 더 넓은 범위의 주제와 아이디어를 탐구하는 더 깊고 심오한 대화를 촉진하는 것입니다. 여기에는 고급 자연어 처리 기술을 통합하거나 머신러닝 알고리즘을 활용하여 사용자 입력을 보다 미묘한 방식으로 더 잘 이해하고 응답하는 것이 포함될 수 있습니다. 또한 공감, 적극적 경청, 적응력 등 인간과 유사한 자질을 통합하면 관련 당사자 모두의 전반적인 경험을 향상시킬 수 있습니다.

인공 지능이 점점 더 발전함에 따라 음성 비서가 다양한 영역에서 도움을 제공할 수 있는 고도로 유능한 개체로 진화할 가능성이 있습니다.AI의 발전은 기존 기술을 새로운 기능의 시대로 이끌 잠재력을 가지고 있으며, 음성 비서는 이러한 변화가 일어날 수 있는 대표적인 분야 중 하나입니다.

By 김민수

안드로이드, 서버 개발을 시작으로 여러 분야를 넘나들고 있는 풀스택(Full-stack) 개발자입니다. 오픈소스 기술과 혁신에 큰 관심을 가지고 있고, 보다 많은 사람이 기술을 통해 꿈꾸던 일을 실현하도록 돕기를 희망하고 있습니다.