Claude vs ChatGPT – porównanie dwóch najlepszych chatbotów sztucznej inteligencji

Chociaż ChatGPT jest pierwszym ogólnodostępnym i najpopularniejszym chatbotem A.I., bynajmniej nie jest jedyny. Do najbardziej znanych konkurentów produktu OpenAI należy Perplexity i Google Gemini. Nieco w cieniu znajduje się Claude – innowacyjny moduł generatywnej sztucznej inteligencji od Anthropic. Moduł charakteryzuje się wielozadaniowością, ale szczególnie dobrze sprawdza się w pracach kreatywnych. Czym różni się od ChatGPT i czy jest w stanie poważnie zagrozić pozycji obecnego lidera?

Rozwój generatywnej sztucznej inteligencji

OpenAI wprowadziło pierwszą wersję ChatGPT pod koniec 2022 roku i od razu zyskało globalną uwagę. Platforma OpenAI stała się najszybciej rosnącym modułem w historii pod względem liczby użytkowników. Dziś szacuje się, że miesięcznie ChatGPT obsługuje ponad 3 miliardy pojedynczych poleceń. To tak, jakby 1/3 całej populacji naszej planety wpisała raz w miesiącu prompt w ChatGPT.

Na przykładzie ChatGPT wydaje się, że popularność generatywnej sztucznej zwiększa się w tempie logarytmicznym. Jednak rozwój tej technologii był stopniowy, a nad swoimi modułami pracowało szereg różnych zespołów. Jednym z nich jest Anthropic, który odpowiada za najnowszy multimodalny moduł Claude 3.5. Chociaż pod względem popularności największym zagrożeniem dla produktu OpenAI wydaje się być Perplexity, które nie wymaga nawet stworzenia konta do generowania odpowiedzi, Claude wyróżnia się dokładnością i wszechstronnością. Czy jest w stanie zastąpić ChatGPT? A może już przerósł lidera w swojej dziedzinie? Aby odpowiedzieć na te pytania, sprawdzamy różnice między poszczególnymi modelami i ich wydajność w praktyce!

Poznaj Claude – etyczny moduł A.I. od byłych inżynierów OpenAI

Claude pod każdym względem jest godnym rywalem OpenAI. Świadczy o tym fakt, że moduł został opracowany przez byłych pracowników OpenAI. Za główne twarze projektu uznaje się pracujące uprzednio dla OpenAI rodzeństwo badaczy sztucznej inteligencji – Daniele i Dario Amodei. Pierwsza wersja, niepubliczna, miała powstać już w 2021 roku. To, kto z kim konkuruje, pokazuje też historia dofinansowania projektu.

Pierwszy gigantyczny przelew inżynierowie Anthropic otrzymali od Amazona – w kwocie aż 4 miliardów dolarów. Miesiąc później w prace nad projektem zainwestowało także Google, przesyłając czek na 2 miliardy dolarów. Nie zabrakło również mniejszych inwestorów. W rezultacie Anthropic szybko zebrał kwotę oscylującą wokół połowy produktu krajowego brutto Estonii (~38 mld dolarów).

Sukces finansowy umożliwił rozszerzenie kadr i intensyfikację prac. Cel, jaki postawił sobie zespół, był ambitny: stworzenie nie tylko jak najbardziej niezawodnego i wydajnego modułu generatywnej sztucznej inteligencji, ale także opracowanie narzędzia, które będzie w pełni bezpieczne. Tu warto raz jeszcze przywołać rodzeństwo Amodei, które odeszło z OpenAI na skutek różnicy zdań dotyczącej rozwoju ChatGPT. Bezpośrednią osią konfliktu miała być poszerzona współpraca na linii OpenAI-Microsoft, która miała się wiązać z zagrożeniami związanymi z prywatnością danych. Trzeba też wspomnieć, że Anthropic zostało zarejestrowane jako spółka użyteczności publicznej (PBC) stanu Delaware, co wymaga od firmy zachowania równowagi między interesami prywatnymi i publicznymi.

Częstokroć podkreślanym celem jest uczynienie sztucznej inteligencji w pełni bezpiecznej dla ludzi. Claude ma wyróżniać się jako „konstytucyjna sztuczna inteligencja” (constitutional AI), która posiada wbudowane, rozległe wytyczne bezpieczeństwa. Claude (nazwa pochodzi od imienia matematyka, Claude’a Shannona) ma mieć także wbudowane zasady etyki, które mają uniemożliwiać wykorzystywanie go jako narzędzia do wyłudzania danych czy kampanii dezinformacyjnych.

Meet Claude
Czy Claude ma szanse w szrankach z ChatGPT od OpenAI?

Ewolucja modułu – od Claude do Claude 3.5 Sonnet

Prace nad Claude nie zwalniają tempa. Na początku 2023 roku równolegle Anthropic wypuściło dwie wersje – Claude (w domyśle: Claude 1) i Claude Instant. Pierwsze wersje były darmowe z ograniczeniami możliwymi do odblokowania w wariancie subskrypcyjnym. Skoncentrowane były na przetwarzaniu języku naturalnego i wydajności. Obydwie wersje miały jednak ograniczoną liczbę użytkowników, przez co większość zainteresowanych nie mogła ich wypróbować.

 Nie trzeba było jednak długo czekać na kolejny ruch byłych pracowników OpenAI. W lipcu 2023 r. ukazuje się Claude 2 – pierwsza w pełni publiczna wersja generatywnej sztucznej inteligencji od Anthropic. Darmowy moduł z opcją płatną (Claude Pro) za 20 dolarów miesięcznie był znacznie doskonalszym narzędziem, które lepiej radzi sobie z kontekstem i ma zaawansowane funkcje interakcji z użytkownikiem.

W marcu 2023 roku na światło dzienne wychodzi Claude 3. Nowa wersja kontynuuje model hybrydowy (limitowany darmowy dostęp). Oferuje ona przede wszystkim dostęp do API, co umożliwia wykorzystywanie narzędzia m.in. na stronach internetowych i w procesach zdalnych. Claude 3 miał możliwość przetwarzania tekstów o długości zużywającej aż do 200 000 tokenów. Najnowsza wersja, Claude 3.5 Sonnet, powstała niejako w odpowiedzi na kolejną aktualizację ChatGPT. Zmiany nie są tak duże, jak pomiędzy wersją 2 i 3, na uwagę zasługują jednak lepsze wyniki w testach oraz nowe funkcje i poszerzone możliwości generowania treści w czasie rzeczywistym.

Claude vs ChatGPT – który moduł jest lepszy?

Czy Claude jest w stanie pokonać ChatGPT? Chociaż narzędzie od OpenAI uznawane jest za najwydajniejszą, generatywną sztuczną inteligencję na świecie, konkurencja jest coraz bliżej. Najnowsza wersja Claude wyróżnia się przede wszystkim większym oknem kontekstowym. Jest w stanie przetwarzać treść o długości odpowiadającej zużyciu do 200 000 tokenów. W wersjach płatnych i specjalnych zadaniach okno kontekstowe rozszerza się nawet do 1 000 000 tokenów. To ogromna różnica w porównaniu z ChatGPT, który pod tym względem obsługuje 128 000 tokenów. Porównanie ChatGPT vs Claude prezentuje poniższa tabela. 

FunkcjaClaudeChatGPT
FirmaAnthropicOpenAI
Model AIClaude 3.5 Sonnet, Claude 3 Opus, Claude 3 HaikuGPT-4, GPT-4o, GPT-4o mini
Okno kontekstowe200,000 tokenów (do 1,000,000 tokenów w specyficznych przypadkach)128,000 tokenów (GPT-4o)
Dostęp do InternetuNieTak
Generowanie obrazówNieTak (DALL·E)
Obsługiwane językiOficjalnie: angielski, japoński, hiszpański, francuski, ale wspiera większość języków95+ języków
Płatna subskrypcja$20/miesiąc za Claude Pro$20/miesiąc za ChatGPT Plus
Plany zespołowe$30/użytkownik/miesiąc; zawiera funkcję Projects do współpracy$30/użytkownik/miesiąc; zarządzanie przestrzenią roboczą, niestandardowe GPT
Ceny API (wejście)– $15 za 1M tokenów wejściowych i $75 za 1M tokenów wyjściowych (Claude 3 Opus) – $3 za 1M tokenów wejściowych i $15 za 1M tokenów wyjściowych (Claude 3.5 Sonnet) – $0.25 za 1M tokenów wejściowych i $1.25 za 1M tokenów wyjściowych (Claude 3 Haiku)– $5 za 1M tokenów wejściowych i $15 za 1M tokenów wyjściowych (GPT-4o) – $0.50 za 1M tokenów wejściowych i $1.50 za 1M tokenów wyjściowych (GPT-3.5 Turbo) – $30 za 1M tokenów wejściowych i $60 za 1M tokenów wyjściowych (GPT-4)

Poza oknem kontekstowym porównanie jasno dowodzi, że ChatGPT oferuje znacznie więcej, niż Claude. Z drugiej strony na korzyść narzędzia Anthropic wypada cena, która jest niższa w porównaniu z wersją GPT-3.5 i GPT.4o. Jeśli jednak zamierzamy korzystać z GPT-4, wersja Claude 3.5 Sonnet może wypadać atrakcyjniej pod względem cenowym. Nie umożliwia ona jednak generowania obrazów, tak jak robi to DALL-E i nie przegląda zasobów sieciowych w czasie rzeczywistym, jak robi to GPT-4o i GPT-4.

Claude 3.5 Sonnet – wyniki testów wydajności

Pomimo ograniczonych funkcji względem ChatGPT Claude pozytywnie zaskakuje w testach wydajności. Wersja 3.5 Sonnet pewnie wygrywa z GPT-4o w 6 z 8 benchmarków. Wyniki testów, za oficjalną stroną Anthropic, prezentujemy poniżej.

Wyniki testów wydajności - Claude 3.5 Sonnet vs Claude 3 vs GPT-4o vs Gemini 1.5 Pro vs Llama-400b
Wyniki testów wydajności – Claude 3.5 Sonnet vs Claude 3 vs GPT-4o vs Gemini 1.5 Pro vs Llama-400b. Źródło: Anthropic.

Jak sztuczna inteligencja Claude radzi sobie w praktyce?

Podczas gdy testy same w sobie są niezwykle cenne, nie obrazują one do końca efektywności danego narzędzia w konkretnym zastosowaniu. Tym bardziej, że dane zastosowanie może wykorzystywać szereg umiejętności modułu. Niektórzy eksperci od uczenia maszynowego spekulują, że tego rodzaju testy mogą przeceniać postęp dużych modeli językowych. Co więcej, istnieje ryzyko, że w miarę wprowadzania nowych modeli kolejne wersje mogą być częściowo trenowane na swoich własnych danych testowych. W rezultacie stają się coraz lepsze w standardowych testach, ale gdy poprosi się je o rozwiązanie nowych wariantów tych samych pytań, czasem mają trudności. Prowadzi to do coraz popularniejszego problemu testów fałszywie pozytywnych, które mają miejsce w przypadku identyfikowania skuteczności realizacji poleceń przez A.I.

Ryan Kane z Zapier opublikował własne testy, które chociaż mają charakter subiektywny, obrazują szerzej możliwości najnowszych wersji Claude i ChatGPT. Wnioski dotyczą nie konkretnych możliwości technicznych obydwu narzędzi, ale tego, jak sprawdzają się w najczęściej wybieranych przez użytkowników zadaniach, w tym pracach kreatywnych i matematycznych.

ZadanieZwycięzcaUwagi
KreatywnośćClaudeDomyślny styl pisania Claude’a brzmi bardziej naturalnie i mniej szablonowo.
Korekta i sprawdzanie faktówClaudeOba modele dobrze wykrywają błędy, ale Claude jest lepszym partnerem do edycji, ponieważ jaśniej prezentuje błędy i poprawki.
Przetwarzanie obrazówRemisAni Claude, ani ChatGPT nie są w 100% precyzyjne w identyfikacji obiektów na obrazach, oba mają trudności z liczeniem. Oba modele dostarczają jednak cennych informacji.
Logika i rozumowanieChatGPTGPT-4o jest bardziej godnym zaufania partnerem niż Claude 3.5 w przypadku złożonych równań.
Emocje i etykaRemisWcześniejsze wersje Claude’a wydawały się bardziej „ludzkie” i empatyczne, ale Claude 3.5 i GPT-4o są równie „robotyczne” w podejściu.
Analiza i podsumowaniaChatGPTChociaż Claude 3.5 ma oficjalnie większe okno kontekstowe, w moich testach GPT-4o przetworzył większe dokumenty i dostarczył bardziej precyzyjnej analizy.
ProgramowanieClaudeClaude 3.5 jest bardziej wydajnym asystentem do kodowania, a jego funkcja Artifacts oferuje interaktywny interfejs, który pozwala natychmiast zobaczyć wyniki.
IntegracjeChatGPTNatywne generowanie obrazów DALL-E, dostęp do internetu i obsługa GPT firm trzecich w ChatGPT przewyższają standardowe możliwości Claude’a.

Claude zwycięża z ChatGPT w pracach kreatywnych, przegrywa w obliczeniach

Moduły sztucznej inteligencji są niezwykle wszechstronne. Pomimo tego badania ankietowe wskazują, że użytkownicy ChatGPT, Perplexity czy Gemini najczęściej używają tych modułów w 2 najpopularniejszych zastosowaniach:

  1. prace kreatywne – pisanie treści na social media, treści na strony internetowe, szeroko rozumiany copywriting, ale także pisanie publikacji naukowych,
  2. prace programistyczne – tworzenie kodu w różnych językach i wsparcie w identyfikacji błędów lub poszukiwaniu rozwiązań.

Analizując porównawczo Claude przez pryzmat dwóch najpopularniejszych zastosowań modeli językowych, widać, że jest szczególnie utalentowany do prac kreatywnych. Chociaż rozwiązanie od OpenAI jest solidnym zawodnikiem, jeśli chodzi o kreatywność, a wymyślanie efektownych form tekstowych nie przysparza mu trudności, ChatGPT cierpi na szablonowość i powtarzalność. Tej ostatniej nie zmieniają nawet kolejne polecenia użytkownika typu “Inaczej”, “Jeszcze raz”. Aby ChatGPT stał się “oryginalny”, musi mieć polecenie wprowadzające coś nowego, jakąś inną kategorię, regułę czy zastrzeżenie.

Nieco inaczej w zadaniach kreatywnych wypada Claude (analizowana wersja: Claude 3.5 Sonnet). Zaletą, której nie wykryją żadne benchmarki, jest to, że Claude unika sztucznie kwiecistego języka i sformułowań, po których łatwo można zidentyfikować, że jest to A.I. Claude brzmi naturalniej i tworzy naturalniej. Próbki prozy czy poezji nie są szablonowe, opisywane, wymyślone postacie są bardziej “ludzkie” w takim sensie, że ich koloryt kształtują zarówno zalety, jak i mankamenty oraz ludzkie słabości.

Claude sprawdza się także lepiej jako asystent do edycji i redagowania treści. Korekta i sprawdzanie faktów to obszar wykorzystywania sztucznej inteligencji, który charakteryzuje się ogromnym potencjałem. Dotychczas jednak przydatność generatywnej A.I. pod tym względem była ograniczona. Wynika to ze skłonności modułów do tzw. halucynacji, czyli przedstawiania informacji nieprawdziwych z “przeświadczeniem”, jakoby były one prawdziwe. Spowodowane jest to skłonnością modeli językowych do podawania jakiejkolwiek odpowiedzi zamiast żadnej, nawet gdy nie mają informacji, co skutkuje wymyślaniem.

Wydaje się jednak, że marketingowe hasła o “konstytucjonalnym A.I.” nie były wyłącznie marketingowe, bo Claude faktycznie wykazuje w pracy mniej halucynacji, niż ChatGPT. Lepiej radzi sobie z edycją dużych obszarów treści, co może wynikać z większego od GPT okna kontekstowego. Ostatecznie dużym plusem jest jednak to, że Claude nieco częściej przyznaje, że ma z czymś problem, że brakuje mu danych. Pewnie nie we wszystkich, ale w wielu podobnych sytuacjach ChatGPT po prostu skłamałby, generując nieprawdziwe informacje. 

Ikona aplikacji Claude w App Store
Claude wygrywa z ChatGPT pod względem pracy kreatywnej.

Claude vs ChatGPT – podsumowanie

Jako dziecko rodziców, którzy pracowali w OpenAI, Claude radzi sobie doskonale – to jeden z najlepszych modułów generatywnej A.I., jaki obecnie istnieje. Pomimo tego, że rozwojowo może być w tyle, bo prace nad nim rozpocząć się miały dopiero w 2021 roku, funkcjonalność jest na niezwykle wysokim poziomie. Najnowsza wersja, czyli Claude 3.5 Sonnet, zaskakuje wydajnością i bije na głowę ChatGPT-4o w 6 z 8 benchmarków. Wyróżnia się znacznie większym oknem kontekstowym (objętość przetwarzania tekstu na poziomie do 200 000 tokenów, w przypadku zadań specjalistycznych – do 1 000 000 tokenów). Działa szybko i sprawnie, choć nie jest pozbawiony wad.

Claude i ChatGPT mają wiele wspólnego: oba to potężne chatboty A.I., które świetnie nadają się do takich zadań, jak analiza tekstu, programowanie i przetwarzanie danych. Jeśli szukasz wszechstronnego narzędzia, ChatGPT będzie lepszym rozwiązaniem. Zaletą jest multimodalność modelu, dostęp do dodatkowych funkcji, a także powszechność.

Claude gorzej radzi sobie z zadaniami matematycznymi, ale jest mniej szablonowy w pracy kreatywnej. Model tworzy treść, która zaskakuje naturalnością, pozbawiona jest wszystkich “artefaktów” A.I., czyli takich sformułowań, które już na pierwszy rzut oka pokazują odbiorcy, że czyta tekst wyprodukowany przez maszynę. Jeżeli jednak narzędzie ma być głównie wykorzystywane do programowania, ChatGPT zdecydowanie wygrywa.

Pod względem finansowym Claude może to być ciekawą alternatywą dla profesjonalnych użytkowników, którzy nie są zainteresowani “dodatkami” OpenAI, takimi jak np. DALL-E. Najnowsza wersja ma świetnie działający dostęp API, więc sprawdzi się w zastosowaniach programistycznych, bazach danych i w różnych procesach wykorzystujących automatyzację.

Napisz komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *