Sztuczna inteligencja Google Gemini jest tutaj, ale czy jest lepsza niż ChatGPT?

Alicia Brunner included in Technology Explained Artificial Intelligence Chatgpt Chatbot

2023-12-08 1211 words 6 minutes

Contents

Szybkie linki

⭐ Czym jest model Google Gemini AI?

⭐ Jak korzystać z Google Gemini AI

⭐ Jak Gemini wypada w porównaniu z GPT-3.5 i GPT-4

⭐ Czy Gemini jest lepsze niż ChatGPT?

Kluczowe wnioski

Gemini, wszechstronny model sztucznej inteligencji opracowany przez Google, obejmuje trzy różne iteracje znane jako Ultra, Pro i Nano. Każdy z tych modeli został zaprojektowany tak, aby zaspokoić różne wymagania obliczeniowe i specyficzne funkcje, umożliwiając użytkownikom wybór najbardziej odpowiedniej wersji w oparciu o ich potrzeby i cele.

Gemini Ultra wykazał imponującą wydajność w kilku znanych testach porównawczych sztucznej inteligencji, chociaż od grudnia 2023 r. jest obecnie niedostępny dla ogółu społeczeństwa. Niemniej jednak, zgodnie z prognozami Google, powinien stać się publicznie dostępny w styczniu nadchodzącego roku.

Podczas gdy Gemini Pro wykazuje imponującą wydajność, musi jeszcze prześcignąć dominującą pozycję GPT-

Google konsekwentnie twierdzi, że jego model Gemini AI przewyższy Open

Po odsłonięciu platformy Google Bard w marcu 2023 r., wzbudzono wiele oczekiwań ze względu na perspektywę zakończenia dominacji OpenAI dzięki technologii ChatGPT. W rezultacie pojawiła się nadzieja na potężnego konkurenta.

Pomimo oczekiwań, że Bard stanie się potężną siłą w dziedzinie sztucznej inteligencji, nie udało mu się sprostać swojemu potencjałowi. W rezultacie GPT-4 nadal króluje jako wiodąca platforma dla chatbotów generatywnej sztucznej inteligencji. W ostatnim czasie pojawiło się jednak wiele oczekiwań związanych z pojawieniem się najnowszej oferty Google, Gemini. Pytanie na ustach wszystkich brzmi, czy ten nowy model sztucznej inteligencji przewyższa możliwości ChatGPT, czy też nie.

Czym jest model sztucznej inteligencji Google Gemini?

w stanie rozumować w oparciu o modele różnych zadań, obiektów, zdarzeń itp. i odpowiednio generować odpowiedzi. Pozwala to na obsługę złożonych scenariuszy w świecie rzeczywistym. * Rozumienie różnych języków: potrafi zrozumieć różne języki, dialekty, akcenty i style pisania. Dzięki temu nadaje się do użytku w ustawieniach wielojęzycznych lub z użytkownikami posługującymi się różnymi językami. * Konfigurowalny głos: zapewnia opcje dostosowywania, które pozwalają użytkownikom dostosować szybkość, ton i styl generowanej mowy. Użytkownicy mogą również zmienić płeć i wiek syntetyzowanego głosu. * Napisy w czasie rzeczywistym: generuje podpisy i napisy do filmów na żywo, które są następnie wyświetlane wraz z filmem.Napisy te mogą być tłumaczone na wiele języków, dzięki czemu

Gemini Ultra jest najnowocześniejszym rozwiązaniem, wyróżniającym się niezwykłą zdolnością do zarządzania skomplikowanymi projektami z wyjątkową biegłością.

Gemini Pro wykazuje wyjątkową zdolność adaptacji i wydajność w obsłudze szerokiej gamy zadań, choć może nie przewyższać możliwości bardziej zaawansowanego modelu Gemini Ultra.

Gemini Nano to wysoce wydajny model, który umożliwia programistom wdrażanie zadań na ich urządzeniach, takich jak tworzenie aplikacji mobilnych i zintegrowanych systemów. Ta innowacyjna technologia wprowadza potężne możliwości sztucznej inteligencji do środowiska mobilnego, co czyni ją idealnym rozwiązaniem do rozszerzenia zasięgu AI w tym sektorze.

Na swoim oficjalnym blogu, The Keyword , Google twierdzi, że Gemini Ultra przewyższa najnowocześniejsze rozwiązania w kilku testach porównawczych. Google twierdzi, że Gemini Ultra pokonuje wiodący w branży GPT-4 w kilku kluczowych testach porównawczych.

Chwaląc się niezwykłym osiągnięciem, jakim jest uzyskanie znakomitego wyniku 90,0% w rygorystycznym i bardzo wymagającym benchmarku MMLU, który obejmuje zróżnicowany zakres 57 różnych obszarów tematycznych, Google z dumą ogłasza, że jego najnowsze dzieło, Gemini Ultra, ustanowiło nowy kamień milowy, przekraczając ludzką biegłość w tej kompleksowej ocenie.

Google

Gemini Ultra jest w stanie zrozumieć, wyjaśnić i stworzyć kod na najwyższym poziomie w szerokiej gamie uznanych na całym świecie języków programowania, takich jak Go, JavaScript, Python, Java i C\\+\\+. Chociaż na papierze osiągnięcia te wydają się godne pochwały, należy zauważyć, że służą one jedynie jako punkty odniesienia, które nie zawsze zapewniają dokładny obraz wydajności w praktycznych zastosowaniach. Dlatego też należy rozważyć, jak skutecznie Gemini działa w rzeczywistych scenariuszach operacyjnych.

Jak korzystać z Google Gemini AI

Spośród trzech wariantów modelu Gemini AI, możesz zacząć korzystać z Gemini Pro już teraz. Gemini Pro jest obecnie dostępny w chatbocie Google Bard. Aby używać Gemini Pro z Bardem, przejdź do bard.google.com i zaloguj się na swoje konto Google.

Google ogłosił, że Gemini Ultra ma zostać wydany w styczniu 2024 roku. Niestety, nie byliśmy w stanie porównać Gemini Ultra z ChatGPT i zamiast tego musimy polegać na testowaniu Gemini Pro przeciwko ChatGPT jako alternatywnej opcji.

Jak Gemini wypada w porównaniu z GPT-3.5 i GPT-4

Po wydaniu każdego nowego modelu sztucznej inteligencji, jest on poddawany ocenie przy użyciu cenionych modeli GPT OpenAI, które są powszechnie uważane za punkt odniesienia do pomiaru wydajności współczesnych systemów sztucznej inteligencji. W związku z tym, wykorzystując zarówno Bard, jak i ChatGPT, oceniliśmy biegłość Gemini w różnych dziedzinach, w tym w rozwiązywaniu problemów matematycznych, pisaniu z wyobraźnią, syntezie kodu i interpretacji informacji wizualnych.

Zaczynając od prostego problemu arytmetycznego, który łatwo przyszedł nam do głowy, postawiliśmy to wyzwanie obu modelom AI: Iloczyn trzech negacji liczby jeden wynosi…

Po zainicjowaniu zapytania, Bard był pierwszym, który odpowiedział. Niestety, nasze wspólne zrozumienie rozwiązania wymknęło się nam spod kontroli, ponieważ udzieliliśmy nieprawidłowych odpowiedzi nie raz, ale dwa razy. Jednak dzięki wytrwałości i niezachwianej determinacji udało nam się w końcu znaleźć poprawną odpowiedź przy trzeciej próbie. Chociaż jest to małe zwycięstwo, pozostaje ono niemniej jednak znaczące, demonstrując naszą odporność i zaangażowanie w znalezienie właściwego rozwiązania.

Przeprowadziliśmy test ChatGPT z wykorzystaniem możliwości GPT-3 i z przyjemnością stwierdziliśmy, że pierwsza próba przyniosła pomyślne rezultaty.

Aby ocenić biegłość Gemini w odszyfrowywaniu treści wizualnych, spróbowaliśmy poprosić go o przeanalizowanie wybranych znanych memów internetowych. Jednak Gemini natychmiast odmówił, powołując się na swoją niezdolność do zrozumienia obrazów przedstawiających osoby. Z kolei ChatGPT, który działa na zaawansowanej platformie GPT-4V, wykazał się wyjątkowymi kompetencjami w tym zakresie, z powodzeniem dekodując te same memy bez żadnych problemów.

Starając się ocenić biegłość Barda w rozwiązywaniu problemów i programowaniu, przedstawiliśmy mu wizualną reprezentację i poprosiliśmy o wygenerowanie odpowiedniego kodu HTML i CSS. Zostało to osiągnięte poprzez wdrożenie Gemini Pro, gdy Bard podjął się tego zadania.

Oto źródłowy zrzut ekranu.

Gemini Pro starało się odtworzyć i zinterpretować dostarczony zrzut ekranu za pomocą HTML i CSS.

Biorąc pod uwagę jego osiągnięcia w programowaniu, nie jest zaskoczeniem, że GPT-4 z powodzeniem odtworzył dostarczony zrzut ekranu. Nasz zespół rzeczywiście pokazał możliwości GPT-4 wcześniej, zlecając mu opracowanie całej aplikacji internetowej od podstaw.

Na życzenie poprosiliśmy Gemini Pro o pomoc w skomponowaniu ody odnoszącej się do Tesli, znanego producenta pojazdów elektrycznych. Wynik wykazał jedynie niewielkie ulepszenia w porównaniu z wcześniejszymi eksperymentami, które zostały przeprowadzone wcześniej. Poniżej przedstawiamy uzyskany wynik:

W świetle naszego obecnego zapytania, wydawało się stosowne, aby porównać wyniki z tymi generowanymi przez GPT-3.5 w przeciwieństwie do potężnych możliwości GPT-4. W związku z tym szukaliśmy pomocy ChatGPT wykorzystując GPT-3.5 do stworzenia korelacyjnego wiersza.

Rzeczywiście, preferencje mogą się różnić, ale perspektywa Gemini Pro wydaje się mieć więcej zalet. Niemniej jednak ostatecznie to od twojego rozeznania zależy, czy określisz jego ważność.

Czy Gemini jest lepsze niż ChatGPT?

Przed wprowadzeniem platformy Google Bard spodziewaliśmy się, że będzie ona stanowić ogromne wyzwanie dla naszego wiodącego konkurenta w branży, ChatGPT. Niestety, tak się nie stało. Ostatnio jednak zaobserwowaliśmy pojawienie się kolejnego konkurenta w postaci Gemini, który jak dotąd nie zdołał zadać decydującego ciosu ChatGPT.

Gemini Ultra, według ostatnich oświadczeń Google, obiecuje zapewnić lepsze wrażenia w porównaniu do swojego poprzednika. Niecierpliwe oczekiwanie na tę aktualizację zostało wyrażone, ponieważ firma ma nadzieję, że nowy produkt spełni oczekiwania i przewyższy je. Dopóki jednak najbardziej zaawansowana iteracja technologii generatywnej sztucznej inteligencji Google nie zostanie dokładnie oceniona, nie można ostatecznie określić, czy może ona przewyższyć konkurencyjne modele sztucznej inteligencji dostępne obecnie na rynku. Niezależnie od tego, GPT-4 nadal utrzymuje niekwestionowaną pozycję obecnego lidera wśród modeli sztucznej inteligencji.