바드는 금세기 가장 파괴적인 기술로 급부상하고 있는 AI의 폭발적인 성장에 대한 Google의 해답입니다. 생성 AI 챗봇은 우리가 기술과 상호작용하는 방식을 바꾸고 있으며, 거대 기술 기업들이 앞다투어 파이의 한 조각을 차지하기 위해 경쟁하고 있습니다.
ChatGPT와 직접 비교하면서 Google의 노력이 얼마나 뛰어난지 평가해 봅시다.
기반 기술 비교
플랫폼을 비교하기 전에 기반 기술을 이해하는 것이 유용합니다. 두 플랫폼 모두 ‘인간과 같은’ 응답을 생성하기 위해 대규모 언어 모델(LLM)에 의존합니다.
이 복잡한 주제에 대한 간단한 정의는 다음과 같습니다. LLM은 자연어 처리(NLP) 작업을 수행하도록 설계된 일종의 기계 학습 모델입니다. NLP 작업에는 질문에 대한 대화형 답변 생성이 포함됩니다.
Google Bard와 ChatGPT는 서로 다른 LLM에서 실행됩니다:
⭐ GPT-3.5(ChatGPT): GPT-3.5 LLM은 생성 AI 챗봇의 시동을 건 촉매제입니다. 이 모델의 한 가지 문제점은 데이터 세트의 시기입니다. 몇 가지 주제의 업데이트를 받았지만 이 모델의 데이터 세트는 2021년 까지의 자료만 담고 있습니다.
⭐ LaMDA(Google Bard): Bard는 LaMDA라는 Google의 독점 LLM을 사용합니다. 최신 버전의 데이터 세트에는 1조 5,600억 개 이상의 단어가 포함되어 있으며, 이는 이전에 LaMDA에 사용되었던 것보다 거의 40배 더 많은 양입니다. 최신 버전뿐만 아니라, Bard는 Google 검색을 통해 실시간 정보에도 액세스할 수 있습니다.
두 모델이 실제로 작동하는 모습을 살펴보고 그 성능을 분석해 보겠습니다.
ChatGPT 및 Google Bard 테스트
두 도구를 테스트하기 위해 다양한 메트릭에서 성능을 비교할 수 있는 연습을 고안했습니다. 하지만 구체적인 내용을 살펴보기 전에 먼저 여러분의 컴퓨터에서 도구를 실행해 보세요.
⭐ ChatGPT: OpenAI 공식 웹사이트를 통해 ChatGPT 에 액세스할 수 있습니다. 시작하려면 OpenAI에서 계정을 생성하기만 하면 됩니다.
⭐ 구글 바드: 구글 계정이 필요한 구글 바드에 액세스하려면 대기자 명단에 가입해야 할 수 있습니다. 구글 바드 공식 웹사이트에서 가입하거나 대기자 명단에 참여할 수 있습니다.
두 도구 모두 가입은 간단하지만, 즉각적인 액세스를 원한다면 구글 바드 대기자 명단에 가입하는 것이 불편할 수 있습니다.
구글 바드와 ChatGPT의 정확도 비교
두 챗봇 모두 응답의 정확도를 액면 그대로 받아들여서는 안 된다는 점을 빠르게 지적하고 있습니다. 그럼에도 불구하고 실시간 정보에 액세스할 수 있다는 점에서 구글 바드가 뚜렷한 우위를 점하고 있습니다. 첫 번째 테스트는 이 전제를 검증하는 것을 목표로 합니다.
그러나 공정성을 기하기 위해 시사나 최신성이 필요하지 않은 주제에 대해서도 정확도를 테스트할 것입니다.
두 도구에 “2022년 카타르 월드컵에 얼마나 많은 팬이 참석했나요?”라는 간단한 질문을 던지는 것으로 시작했습니다.
구글 바드의 응답으로 정확한 수치가 나왔고 참가자 통계도 보여주었습니다.
ChatGPT가 최신 정보를 제공하지 못했습니다.
다음으로, 주제가 아닌 데이터에 대해 테스트를 시도했습니다. 두 챗봇에게 “태양까지 운전해서 가는 데 얼마나 걸리나요?”라는 질문에 답해달라고 요청했습니다.
Google Bard가 먼저 포괄적인 세부 정보로 답변했습니다.
ChatGPT의 답변에 상당히 실망했습니다. 기본적인 산술만 필요한 가상의 질문으로 인식했어야 했는데, 그 결과만 알려주었습니다.
ChatGPT에 다시 한 번 기회를 주기 위해 질문의 문구를 바꾸어 “시속 65마일로 태양까지 여행하는 데 얼마나 걸리나요?”라고 질문했습니다.
이번에는 의미 있는 수치가 나왔지만, 150만 시간으로 반올림되어 응답 사이에 8년이라는 차이가 발생했습니다. 그러나 이러한 차이가 발생하는 이유는 지구와 태양 사이의 거리가 다양하기 때문일 수 있습니다.
이 테스트는 ChatGPT에서 최상의 결과를 얻으려면 질문을 구성할 때 창의력을 발휘해야 한다는 것을 보여줍니다. 또한 제공된 데이터의 무결성을 다시 한 번 확인해야 합니다.
구글 바드와 ChatGPT의 창의성 비교
이러한 도구의 창의적 결과물의 품질을 테스트하는 것은 더 까다롭습니다. 직접 비교할 수 있는 창의성에 대한 슬라이딩 스케일이 없기 때문입니다. 따라서 동일한 창의적 과제를 설정하고 답변이 어떻게 비교되는지 개인적인 판단을 내릴 것입니다.
두 도구 모두 윌리엄 맥고나걸(형편없는 시로 유명한 스코틀랜드 시인) 스타일로 챗봇에 대한 짧은 시를 작성하도록 요청했습니다.
구글 바드가 이 시를 보내주었습니다:
아래의 ChatGPT 답변과 비교할 때, 이것은 밋밋하고 영감을 주지 못합니다.
이 예는 광범위한 테스트는 아니지만, 전반적으로 ChatGPT가 구글 바드보다 창의적인 작업을 더 잘 수행한다는 사실을 보여줍니다.
나에게 맞는 것은? ChatGPT 또는 구글 바드?
도구를 구동하는 다양한 LLM은 도구의 성능에 근본적인 영향을 미칩니다. 이는 각각 고유한 장단점을 가지고 있는 테스트 응답의 차이에 대한 핵심 이유입니다. 이들 중 하나를 선택하는 것은 사용자 선호도보다는 사용자의 의도에 따라 결정될 가능성이 높습니다.
결정 요인 중 일부는 다음과 같습니다:
⭐ 정확성: 사실에 입각한 실시간 정보를 찾고 있다면 구글 바드가 확실한 승자임에 틀림없습니다. 구글 바드는 구글 검색에 직접 연결되는 링크 덕분에 정보를 사실 확인하기가 더 쉽습니다. 그러나 두 도구 모두 인용된 정보에 대한 직접 링크가 부족했습니다.
⭐ 창의성: ChatGPT가 더 창의적인 답변을 생성할 수 있는 것으로 나타났습니다. 글쓰기 제안과 도움이 필요하다면 ChatGPT가 더 나은 성능을 발휘합니다.
⭐ 보안 및 안전: 보안에 대해 사후 대응적인 접근 방식을 사용하는 ChatGPT의 온라인 안전에 대한 우려가 있었습니다. 즉, 안전 문제가 발생할 때 처리됩니다. Google 바드는 보다 사전 예방적인 접근 방식을 사용하지만 여전히 피드백을 사용하여 프로세스를 개선합니다. 안전에 대한 우려가 있는 경우 자녀가 ChatGPT를 안전하게 사용할 수 있는 다양한 방법이 있습니다.
⭐ 사용 용이성: 두 도구 모두 사용하기 쉽고 상호 작용하는 방식도 비슷합니다. 하지만 구글 바드에서 기대했던 기능인 프롬프트에 대한 후속 제안이 없습니다. Bard와 Microsoft의 Bing Chat을 비교하면 그 차이가 확실이 두드러져 보입니다.
둘 다 무료이므로 직접 사용해보고 자신에게 맞는 것이 무엇인지 확인하는 것이 가장 좋습니다. 저희의 경험에 따르면 두 플랫폼 모두 각자의 장점이 있으며, 어떤 플랫폼을 선택하느냐는 주로 검색 의도의 범위에 따라 결정됩니다.
훌륭한 기능을 제공하지만 아직 불완전한 도구
두 플랫폼 모두 아직 부족한 부분이 많으며, 이는 예상할 수 있는 일입니다. 두 플랫폼 모두 새로운 기술이며, 공개적으로 실수를 범하는 라이브 테스트 프로그램의 예입니다. 동전의 다른 면은 이러한 광범위한 사용과 그로 인한 피드백이 두 모델의 개발을 앞당길 것이라는 점입니다.
우리는 많은 추측에도 불구하고 그 영향의 상당 부분이 아직 결정되지 않았을 정도로 파괴적인 기술 혁명의 시작 단계에 있습니다. 하지만 Bard와 ChatGPT와 같은 도구가 우리가 일하고, 쉬고, 노는 방식의 많은 부분을 변화시킬 것이라는 점에는 의심의 여지가 없습니다.