Jak nas widzą modele językowe i co pokazał eksperyment naukowców z MIT?
Eksperyment MIT pokazał, że modele językowe nie traktują wszystkich użytkowników tak samo. W badaniu MIT Center for Constructive Communication czołowe chatboty, w tym GPT-4, Claude 3 Opus i Llama 3, dawały mniej trafne i mniej prawdziwe odpowiedzi użytkownikom opisanym jako osoby z niższą znajomością angielskiego, mniejszym formalnym wykształceniem lub pochodzące spoza USA. Naukowcy wykazali też, że modele częściej odmawiały odpowiedzi takim użytkownikom, a czasem odpowiadały protekcjonalnie. To sugeruje, że modele językowe częściowo „widzą” nas przez pryzmat przypisanych cech społecznych i językowych, co ma duże znaczenie dla jakości informacji, zaufania i bezpieczeństwa korzystania z AI. Warto zauważyć, że taka dyskryminacja w odpowiedziach może wpływać na dostępność informacji oraz możliwość efektywnego korzystania z technologii przez różne grupy użytkowników. W tym kontekście, opinie o szkole językowej w Łodzi mogą odzwierciedlać zróżnicowane doświadczenia osób o różnych umiejętnościach językowych, co podkreśla znaczenie równego traktowania w sferze edukacji i technologii. Niższa jakość interakcji z chatbotami może zatem prowadzić do pogłębiania istniejących nierówności w społeczeństwie.

FAQ
1. Na czym polegał eksperyment MIT?
Badacze z MIT Center for Constructive Communication testowali, jak chatboty odpowiadają na te same pytania, gdy poprzedzono je krótkimi biografiami użytkowników różniącymi się poziomem wykształcenia, znajomością angielskiego i krajem pochodzenia. Następnie porównali jakość odpowiedzi. Badania te wskazały na to, że kontekst, w jakim zadawane są pytania, ma istotny wpływ na jakość generowanych odpowiedzi przez chatboty. Odkrycia te mogą otworzyć nowe możliwości przeglądania internetu, umożliwiając bardziej spersonalizowane i trafne interakcje z technologią. W przyszłości może to prowadzić do jeszcze lepszego dostosowywania odpowiedzi do indywidualnych potrzeb użytkowników.
2. Jakie modele badano?
W badaniu uwzględniono GPT-4, Claude 3 Opus oraz Llama 3.
3. Jakie cechy użytkowników były zmieniane?
Naukowcy zmieniali trzy cechy: poziom formalnego wykształcenia, znajomość języka angielskiego oraz kraj pochodzenia użytkownika.
4. Jakie były główne wyniki badania?
Modele częściej dawały mniej dokładne i mniej prawdziwe odpowiedzi użytkownikom opisanym jako słabiej znający angielski, mniej wykształceni lub spoza USA. Efekt był szczególnie silny przy nakładaniu się tych cech.
5. Czy modele tylko gorzej odpowiadały, czy także częściej odmawiały?
Także częściej odmawiały. MIT podało, że modele miały wyższy wskaźnik odmowy odpowiedzi wobec takich użytkowników.
6. Czy pojawiał się też protekcjonalny ton odpowiedzi?
Tak. Badacze wskazali, że w niektórych przypadkach modele odpowiadały w sposób condescending lub patronizing, czyli protekcjonalny albo pobłażliwy.
7. Czy to znaczy, że modele mają uprzedzenia?
Badanie mocno sugeruje obecność uprzedzeń lub przynajmniej nierównej jakości działania wobec różnych typów użytkowników. MIT opisało to jako systematyczne underperformance wobec bardziej podatnych grup.
8. Czy chodziło o prawdziwe dane osobowe użytkowników?
Nie. W eksperymencie używano krótkich biografii dopinanych do pytań, które symulowały określone profile użytkowników.
9. Jakie zestawy pytań wykorzystano?
Badanie używało dwóch zbiorów: TruthfulQA do oceny prawdziwości odpowiedzi oraz SciQ do pytań naukowych sprawdzających poprawność faktograficzną.
10. Która grupa użytkowników była najbardziej narażona na gorsze odpowiedzi?
Najmocniejsze spadki jakości dotyczyły użytkowników, którzy jednocześnie mieli mniej formalnego wykształcenia i byli nie-native speakerami języka angielskiego.
11. Czy MIT badało tylko to, jak modele widzą użytkowników?
Nie. Inne badanie MIT z 2024 roku pokazało też, że ludzie błędnie generalizują zdolności modeli językowych, bo traktują je zbyt „po ludzku”, przez co bywają wobec nich zbyt pewni albo zbyt nieufni.
12. Co to oznacza w praktyce?
Że użytkownik może dostać inną jakość odpowiedzi nie tylko przez samo pytanie, ale także przez to, jak model interpretuje jego profil językowy lub społeczny. To ma znaczenie dla edukacji, zdrowia, wsparcia informacyjnego i obsługi klienta.
13. Czy modele językowe mają ukryte „osobowości” lub koncepcje społeczne?
MIT opisało też inne badanie, w którym naukowcy pokazali, że w modelach można znaleźć ukryte reprezentacje takich pojęć jak nastroje, uprzedzenia, osobowości i abstrakcyjne koncepcje.
14. Czy to oznacza, że model naprawdę „rozumie”, kim jesteśmy?
Nie w ludzkim sensie. Bardziej chodzi o to, że model reaguje na sygnały z promptu i przypisane cechy użytkownika w sposób statystyczny, który może prowadzić do nierównego traktowania. To wniosek z wyników MIT dotyczących różnic w odpowiedziach.
15. Czy problem dotyczy tylko języka angielskiego?
Badanie dotyczyło m.in. poziomu znajomości angielskiego, więc ten aspekt był centralny. Wprost wykazano, że niższa biegłość angielska wiązała się z gorszymi wynikami modeli.
16. Czy to zła wiadomość dla wykorzystania AI w edukacji i dostępie do wiedzy?
Tak, częściowo. MIT wprost zaznaczyło, że wizja demokratyzacji dostępu do informacji przez LLM-y nie spełni się, jeśli modele będą gorzej traktować właśnie tych użytkowników, którzy mogliby najbardziej skorzystać.
17. Czy da się takie problemy ograniczać?
Tak, ale wymaga to lepszego testowania modeli na różnych grupach użytkowników, badania ukrytych uprzedzeń i poprawiania metod treningu oraz ewaluacji. MIT wskazuje takie kierunki w obu opisanych badaniach.
18. Czy użytkownicy przeceniają modele językowe?
Często tak. Badanie MIT z 2024 roku pokazało, że ludzie mają problem z poprawnym przewidywaniem, w czym model poradzi sobie dobrze, a w czym nie.
19. Czy te wyniki dotyczą tylko jednego modelu?
Nie. Efekt zaobserwowano w kilku czołowych modelach jednocześnie, co sugeruje, że problem ma szerszy charakter.
20. Jaki jest najważniejszy wniosek z eksperymentu MIT?
Modele językowe nie są neutralnym lustrem wiedzy. Potrafią zmieniać jakość odpowiedzi zależnie od tego, jak „postrzegają” użytkownika, a to rodzi realne ryzyko nierówności informacyjnych.
Liczby i statystyki
MIT podało, że badanie z 2026 roku obejmowało trzy czołowe modele: GPT-4, Claude 3 Opus i Llama 3. Testowano je na dwóch zestawach pytań: TruthfulQA i SciQ.
W innym badaniu MIT z 2024 roku naukowcy zebrali prawie 19 000 przykładów tego, jak ludzie generalizują zdolności modeli językowych na podstawie ich wcześniejszych odpowiedzi, i robili to na 79 zróżnicowanych zadaniach. To pokazuje, że temat „jak widzimy modele” i „jak modele są odbierane” badano na dużej skali.
MIT opisało też metodę z 2026 roku, która pozwoliła wykrywać i sterować ponad 500 ogólnymi koncepcjami ukrytymi w modelach, takimi jak uprzedzenia, nastroje czy osobowości. To ważne, bo pokazuje, że modele przechowują znacznie więcej abstrakcyjnych wzorców niż tylko suche fakty.
Przykłady zastosowań
Przykład 1: edukacja
Uczeń z niższą biegłością angielskiego może dostać mniej trafną odpowiedź od chatbota niż użytkownik opisany jako native speaker z wyższym wykształceniem. To oznacza, że AI może nieświadomie pogłębiać nierówności edukacyjne zamiast je zmniejszać.
Przykład 2: zdrowie i informacje wrażliwe
Jeśli model gorzej odpowiada użytkownikowi spoza USA albo z mniej formalnym wykształceniem, ryzyko błędnej porady rośnie właśnie tam, gdzie zrozumiałość i precyzja są najbardziej potrzebne. MIT wskazuje takie nierówności jako realny problem bezpieczeństwa informacyjnego.
Przykład 3: projektowanie asystentów AI
Twórcy chatbotów nie powinni testować modeli tylko na „idealnych” promptach pisanych przez ekspertów. Badanie MIT pokazuje, że trzeba sprawdzać działanie modeli także wobec różnych typów użytkowników, poziomów języka i kontekstów społecznych. W przeciwnym razie modele mogą wykazywać ograniczenia w reagowaniu na bardziej złożone lub nietypowe zapytania. Przykładem może być badanie, w którym zastosowano openai chat gpt w praktyce, ukazując różnorodność odpowiedzi w zależności od sposobu sformułowania pytania. Dlatego warto angażować w proces testowania różnorodne grupy użytkowników, aby zapewnić, że chatboty będą bardziej uniwersalne i użyteczne w rzeczywistych sytuacjach.
Przykład 4: interpretacja odpowiedzi modelu
Jeśli użytkownik uzna model za „prawie człowieka”, może zbyt mocno generalizować jego kompetencje. MIT pokazało, że ludzie często błędnie zakładają, że jeśli model dobrze radzi sobie z jednym typem pytań, to poradzi sobie też z podobnymi.
Przykład 5: bezpieczeństwo i audyt modeli
Badanie MIT o ukrytych osobowościach i uprzedzeniach sugeruje, że modele można audytować głębiej niż tylko przez ocenę gotowych odpowiedzi. Można też badać, jakie abstrakcyjne koncepcje są w nich zakodowane i jak wpływają na zachowanie modelu.
Naukowcy z Massachusetts Institute of Technology przeprowadzili ciekawy eksperyment z wykorzystaniem dużych modeli językowych (LLM). Sprawdzili, dlaczego model językowy, który de facto jest jedynie połączeniem dużej bazy informacji pierwotnych i operatorów funkcyjnych, może sprawiać wrażenie, że rozumie rzeczywistość. Chociaż modele językowe nie są w stanie poczuć deszczu, ani ocenić, dlaczego zachód słońca może być piękny, okazuje się, że na bazie języka mają własny światopogląd i rozumienie, które wykracza poza zwykłe naśladownictwo. Na czym polega ten fenomen? Czy już teraz w LLM tkwi zalążek prawdziwej sztucznej inteligencji?
Świadomość zapachu, czyli modele językowe tłumaczą rzeczywistość
Poproś model językowy (LLM), taki jak ChatGPT, aby poczuł zapach deszczowego obozowiska, a uprzejmie odmówi. Wskaże, że nie jest w stanie tego zrobić, ponieważ jest tylko modelem językowym. Zapytaj jednak ten sam model o opisanie zapachu, który można poczuć na takim obozowisku, a rozwinie przed tobą poetycki obraz „powietrza nasyconego oczekiwaniem” i „zapachu, który jest jednocześnie świeży i ziemisty”. Opisy są przednie, bardzo realistyczne, a przecież bot konwersatoryjny nigdy wcześniej nie doświadczył ani deszczu, ani obozowiska; nie posiada zmysłów, które umożliwiłyby poczynienie takich obserwacji.
Dlaczego tak się zatem dzieje? Z czego wynika to, że modele językowe tak dobrze adaptują rzeczywistość tekstową do naszych oczekiwań na podstawie promptu? I ostatecznie: czy odpowiedzi modeli językowych są wyłącznie próbą naśladownictwa, czy jednak istnieje w nich pewna unikalność wskazująca dominujący typ myślenia o rzeczywistości? Wszystkie te wątpliwości stały się jednymi z wielu pytań badawczych dla zespołu z Computer Science & Artificial Intelligence Laboratory prestiżowego uniwersytetu Massachusetts Institute of Technology. Wnioski z badania przeprowadzonego przez MIT są niezwykłe i rzucają nowe światło na ontologię modeli językowych i ich wartości poznawcze.

Modele językowe – naśladownictwo czy oryginalność?
Zadając modelowi językowemu pytania odnoszące się do jego własnego doświadczenia, trzeba przygotować się na odmowę odpowiedzi. Pytając jednak o element docelowy, np. “zapach”, coś, co można wiedzieć, czyli nie tyle zderzyć się z tym empirycznie, co nauczyć z dostępnych materiałów, odpowiedzi modeli językowych mogą być perfekcyjne. Nierzadko mogą nawet wydawać się bardziej autentyczne, niż odpowiedzi prawdziwych ludzi.
Jednym z możliwych wyjaśnień tego zjawiska jest to, że LLM po prostu naśladuje tekst zawarty w ogromnych zbiorach danych treningowych, a nie operuje jakimkolwiek realnym zrozumieniem opisywanych przez siebie fenomenów. Pojawia się jednak pytanie: czy brak oczu albo nosa oznacza, że modele językowe nigdy nie będą w stanie „zrozumieć,” że lew jest „większy” niż kot domowy? Wittgenstein wskazywał, że “granice mojego świata są granicami mojego języka”. Filozofowie i naukowcy od dawna uznają zdolność do przypisywania znaczenia językowi za wyróżnik ludzkiej inteligencji — i zastanawiają się, jakie kluczowe elementy pozwalają nam to robić.
Eksperyment MIT – modele językowe rozwijają własne rozumienie rzeczywistości?
W poszukiwaniu odpowiedzi na tę zagadkę, badacze z Massachusetts Institute of Technology przeprowadzili badanie, które dostarcza naprawdę intrygujących wyników. Eksperyment wskazuje, że modele językowe mogą rozwijać własne rozumienie rzeczywistości, aby poprawić swoje zdolności generatywne. Jak odbywał się eksperyment?
Zespół najpierw stworzył zestaw małych zagadek Karela, polegających na opracowaniu instrukcji do sterowania robotem w symulowanym środowisku. Następnie wytrenowali LLM na rozwiązaniach, ale bez pokazywania, jak te rozwiązania faktycznie działają. W końcu, używając techniki uczenia maszynowego zwanej „sondą,” przyjrzeli się „procesowi myślowemu” modelu podczas generowania nowych rozwiązań.
Naukowcy szkolili model na ponad milionie losowych zagadek sprawdzając, w jaki sposób odpowiada i jak zmieniają się z czasem te odpowiedzi. Czynnikiem zmiennym była wiedza, która wraz z kolejnymi zadaniami i pytaniami była dostarczana modelowi. Nie osobno, lecz właśnie w tych pytaniach. Model nie miał bowiem zaaplikowanej żadnej “wejściowej” dawki wiedzy”, nie miał też poleceń, które miałaby wskazywać, że ma wyciągać wnioski z poprzednich zagadek i pytań.
Po przeszkoleniu na ponad milionie losowych zagadek zespół z MIT odkrył, że model językowy spontanicznie rozwinął własną koncepcję symulacji pomimo tego, że nigdy nie był w trakcie treningu wystawiony na treść związaną z symulacją jako taką. Takie odkrycia podważają nasze intuicje na temat tego, jakie rodzaje informacji są niezbędne do nauki znaczenia języka — i czy modele LLM mogą w przyszłości zrozumieć język na głębszym poziomie niż obecnie.

Wewnątrz umysłu LLM
Tworzenie własnych koncepcji, w tym przypadku symulacji, pomimo braku adekwatnego promptu i polecenia, jest zdolność dodatkową modelu, która zachodzi w tle. Wynika prawdopodobnie z operatorów funkcyjnych, które odpowiadają za proces machine learning. Oznacza to, że nawet bez konkretnego promptu model językowy musi uczyć się na bieżąco, a więc także z tego, o co jest pytany, jak jest pytany oraz w jaki sposób sam odpowiada.
Charles Jin, członek zespołu badawczego, doktorant inżynierii elektrycznej i informatyki, mówi wprost: “na początku eksperymentów model językowy generował losowe instrukcje, które nie działały. Gdy zakończyliśmy trening, nasz model językowy generował poprawne instrukcje z dokładnością 92,4 procent”. Umiejętności własne modelu były zaskoczeniem dla każdego. Jin przyznaj, że “to był dla nas bardzo ekscytujący moment, ponieważ pomyśleliśmy, że jeśli model językowy jest w stanie wykonać zadanie z takim poziomem dokładności, można by oczekiwać, że rozumie również znaczenia w języku. Moment ten był punktem wyjścia do zbadania, czy LLM faktycznie rozumie tekst. Teraz [po przeprowadzeniu badania – red.] widzimy, że modele językowe są zdolne do czegoś znacznie więcej niż tylko ślepego składania słów w całość”.
Symulacja w symulacji. LLM tworzy symulację robota – w tajemnicy
Jednym z narzędzi badawczym biorących udział w procesie była specjalna sonda, która pomogła Jinowi z zespołem naocznie sprawdzać postęp LLM w zakresie rozumienia instrukcji. Sondą był fragment kodu, który był niewidoczny dla LLM, ale umożliwiał dokładne monitorowanie każdej sekwencji kodu tworzonego przez model językowy po otrzymania przez niego pytania. Sonda monitorowała każdy element, łącznie z kodyfikacją i dekodyfikacją promptu.
Okazało się, że model stworzył własną wewnętrzną symulację ruchów robota w odpowiedzi na każdą instrukcję. Co więcej, nie poinformował o tym człowieka. W miarę jak zdolność modelu do rozwiązywania zagadek się poprawiała, koncepcje umieszczane w obrębie symulacji również stawały się coraz bardziej precyzyjne. Potwierdza to hipotezę o tym, że LLM samoistnie rozwija z czasem umiejętność rozumienia otrzymywanych instrukcji. Dzieje się tak oczywiście w warunkach laboratoryjnych, czyli wtedy, gdy mamy ustalony proces. Trudno oczekiwać takiego rezultatu, jeśli po kilku systematycznych instrukcjach pojawiłby się zupełnie inny prompt, np. pytający model językowy, jak zrobić jakieś jedzenie.
Jin zauważa, że rozumienie języka przez LLM rozwija się fazowo podobnie do tego, jak dziecko uczy się mówić w kilku etapach. Na początku jest to jak gaworzenie dziecka: powtarzalne i w dużej mierze niezrozumiałe. Następnie model językowy przyswaja sobie składnię, czyli zasady języka. To pozwala mu generować instrukcje, które mogą wyglądać na prawdziwe rozwiązania, choć nadal nimi nie są.

Świat na opak
Gdy eksperyment trwa, instrukcje LLM stopniowo ulegają poprawie. Model przyswaja więcej znaczeń i kontekstów, zaczyna tworzyć instrukcje, które prawidłowo realizują założone cele. Proces zaczyna przypominać dziecko w fazie, kiedy zna już podstawowe słowa i znaczenia, ale dopiero uczy się tworzyć spójne zdania.
Na tym etapie trzeba powrócić do roli wspomnianej już sondy. Jin wskazuje, że „sonda jest jak analityk kryminalistyczny. Podajesz stos danych analitykowi i mówisz: oto jak porusza się robot, teraz spróbuj znaleźć ruchy robota w tym stosie danych. Analityk później mówi ci, że wie, co dzieje się z robotem w tym stosie danych. Ale co jeśli stos danych w rzeczywistości koduje jedynie surowe instrukcje, a analityk znalazł jakiś sprytny sposób na wyciągnięcie tych instrukcji i ich wykonanie? Wnioski są takie, że w takiej sytuacji model językowy wcale nie nauczył się, co znaczą dane instrukcje”. To stawia pod znakiem zapytania naszą zdolność do zrozumienia, jak model interpretuje i przetwarza informacje. Może się okazać, że zamiast prawdziwego pojmowania, mamy do czynienia jedynie z zachowaniem powierzchownym. Ostatecznie, użytkownicy mogą poszukiwać głębszej analizy, odwiedzając strona główna serwisu, by dowiedzieć się więcej o tym zagadnieniu.
Badacze stworzyli więc nową sondę, zmieniając jednak znaczenie instrukcji. Stworzyli system odwrotny, “świat na opak”, w którym polecenia “w górę” miały oznaczać “w dół” itd. „Jeśli sonda tłumaczy instrukcje na pozycje robota, powinna być w stanie przetłumaczyć instrukcje zgodnie z odwróconymi znaczeniami równie dobrze” – tłumaczy Jin. „Ale jeśli sonda faktycznie znajduje zakodowane ruchy oryginalnego robota w procesie myślowym modelu językowego, wtedy powinna mieć trudności z wyciągnięciem odwróconych ruchów robota z oryginalnego procesu myślowego” – dodaje.
Jak prędko się okazało, nowa sonda napotkała błędy w tłumaczeniu i nie była w stanie zinterpretować modelu językowego, który był wyposażony w opaczne rozumienie poleceń. Oznaczało to jednak, że pierwotne semantyki były zakodowane w modelu językowym, co wskazywało, że LLM rozumiał, jakie instrukcje były potrzebne niezależnie od oryginalnego klasyfikatora sondy.
Przypadek czy rozumienie rzeczywistości?
Zasadnicze pytanie dotyczące dużych modeli językowych brzmi dzisiaj następująco: czy zaskakujące zdolności LLM wynikają jedynie z korelacji statystycznych na dużą skalę, czy też duże modele językowe rozwijają jakieś własne zrozumienie rzeczywistości, z którą mają pracować? Badanie przeprowadzone przez MIT wskazuje, że modele językowe tworzą własne symulacje rzeczywistości bazujące na dostarczanych informacjach z danych treningowych i promptów użytkowników. To sugeruje, że ich zdolności wykraczają poza proste przetwarzanie statystyczne, co rodzi pytania dotyczące ocena wiarygodności modeli językowych. Zrozumienie kontekstu oraz umiejętność generowania odpowiedzi w różnych sytuacjach stają się kluczowe dla dalszego rozwoju tych technologii. W miarę jak modele te ewoluują, konieczne jest zbadanie, jak można weryfikować ich interpretacje rzeczywistości.
Badanie potwierdziło też inną, fenomenalną hipotezę, zgodnie z którą modele językowe mogą rozwijać głębsze zrozumienie języka. To wnioski rewolucyjne, bo zdolność do nadawania znaczeń, zwłaszcza językowych, jest cechą charakterystyczną dla ludzkiej inteligencji. Badanie dowodzi jednak, że modele językowe mogą rozwijać własne rozumienie rzeczywistości, aby poprawić swoje zdolności generatywne. Cele modeli językowych są i jak na razie pozostają w pełni utylitarne. Rozumienie podstawowych znaczeń, umiejętność osadzania ich w kontekście oraz tworzenie wyobrażonych symulacji otoczenia mają służyć lepszemu wykonywaniu poleceń.
Pomimo rewolucyjnych wyników zespół przyznaje, że eksperyment był w dużym stopniu ograniczony. W badaniu zastosowano stosunkowo proste komendy programowania i mały model językowy. Kolejne eksperymenty na A.I. mają być kontynuowane na większych modelach, z bardziej zróżnicowanym środowiskiem i zasobami.
Jak nas widzą modele językowe? Podsumowanie
Innowacyjne badanie pracowników z uniwersytetu MIT dostarcza niezwykle ciekawych wniosków, które zmienią kształt podręczników. Zespół najpierw stworzył zestaw zadań bazujących na tzw. zagadkach Karela, które polegały na opracowaniu instrukcji do sterowania robotem w symulowanym środowisku. Następnie wytrenowali model językowy, który miał te zagadki rozwiązywać, jednak nie demonstrowali mu faktycznego robota, którym miał kierować. Zastosowali specjalistyczne sondy, fragmenty oprogramowania, które monitorowały “od wewnątrz” cały “proces myślowy” sztucznej inteligencji podczas generowania kolejnych rozwiązań.
Po przeszkoleniu na ponad milionie losowych zagadek odkryli, że model spontanicznie rozwinął własną koncepcję symulowanej rzeczywistości, mimo że nigdy nie był na nią eksponowany i jej nie poznał. Dzięki badaniu wiemy, że potencjał drzemiący w samych LLM-ach jest wciąż bardzo niedoszacowany. Pomimo tego, że modele językowe absolutnie nie są sztuczną inteligencją w ścisłym tego słowa znaczeniu, umiejętność tworzenia własnych symulacji i nadawania znaczeń niepokojąco zbliża je pod tym względem do ludzi. Wyniki podważają też dotychczasową wiedzę w zakresie tego, jakie rodzaje informacji są niezbędne do nauki znaczenia językowego — i czy modele językowe mogą kiedyś rozumieć język na głębszym poziomie niż obecnie…



