Słowniczek AI - 12 pojęć które pomogą Ci nie zgubić się w technologicznej rewolucji
Siódma pozycja cię zaskoczy! Hehe, taki żarcik. Zebrałem dwanaście pojęć które często przewijają się w wątkach o sztucznej inteligencji i zapytałem ChatGPT o wyjaśnienie tych pojęć prostym językiem. Nie byłem do końca zadowolony, więc dodałem wersję zaawansowaną. Nieco doszlifowałem i jest - pierwszy tekst u mnie który w 80% został napisany przez AI.
"O ty leniuszku!" - powiesz - "Nie chce się już samemu pisać tekstów?". To bardzo ciekawe doświadczenie, polecam każdemu - stworzenie z pomocą AI czegoś pod czym się podpiszesz. Zdecydowanie łatwiej jest stworzyć treść, osiągnąć ładne, stylistycznie ciekawe zdania. Jednak bardzo dużo czasu poświęciłem na redakcje. Pracowałem na akapitach, przekładałem ich kolejność, wycinałem redundancje (frazy, pojęcia pojawiające się wielokrotnie w różnych definicjach).
Koniec końców myślę, że spędziłem dwa razy więcej czasu nad tym tekstem, niż nad poprzednimi. Moim celem zawsze są okolice 1000 znaków bo wierzę w sens tej myśli przypisywanej Markowi Twainowi:
Gdybym miał więcej czasu napisałbym krótszy list
Znalazłem ten czas więc do rzeczy:
#1 Czym jest Generative AI
Generative AI to poddziedzina sztucznej inteligencji, która koncentruje się na tworzeniu treści takich jak tekst, obrazy czy muzyka, opartej na wzorcach nauczonych z istniejących danych. Stosuje się tu różne metody uczenia maszynowego, w tym głębokie uczenie, aby nauczyć modele generować oryginalne, często realistyczne treści.
#2 Czym jest LLM?
Large Language Models (LLM) to zaawansowane modele uczenia maszynowego, które mają na celu przetwarzanie, generowanie i zrozumienie języka naturalnego. Są one wytrenowane na ogromnych zbiorach danych tekstowych, co pozwala im na zdobycie rozległej wiedzy na różne tematy i osiągnięcie wysokiej jakości wyników w różnych zadaniach związanych z przetwarzaniem języka naturalnego.
Dzięki uczeniu się z kontekstu oraz analizie sekwencji słów, LLM są w stanie przewidywać następne słowa w zdaniu, odpowiadać na pytania, tłumaczyć tekst czy generować opisy na podstawie podanych informacji. Modele te wykorzystują architektury takie jak Transformer, co pozwala na efektywne przetwarzanie sekwencji danych wejściowych.
Są też inne modele wymyślone przez inne firmy które działają podobnie - na przykład BERT od Google.
#3 Czym jest GPT?
GPT to zaawansowany model uczenia maszynowego opracowany przez OpenAI, służący do generowania tekstu i przetwarzania języka naturalnego. Bazuje na architekturze Transformer i jest wytrenowany na ogromnym zbiorze danych tekstowych. GPT wykorzystywane jest w przetwarzaniu języka naturalnego, takim jak generowanie tekstu czy tłumaczenie. Inne popularne modele to BERT i T5 od Google, mające różne cechy i zastosowania w tej dziedzinie.
#4 Czym jest GPT-4?
GPT-4 to konkretna wersja zaawansowanego modelu języka stworzona przez OpenAI i opublikowana 14 marca 2023. GPT-4 jest wytrenowany na ogromnym zbiorze danych tekstowych, co pozwala na bardziej zaawansowane i precyzyjne odpowiedzi. Jest multi modalny, o tym później. Może też przyjąć znacznie dłuższe instrukcje - dzięki czemu może wykonywać bardziej złożone polecenia.
#5 Czym jest ChatGPT?
ChatGPT to aplikacja chatbota stworzona przez OpenAI. W uproszczeniu możesz myśleć o nim jako o interfejsie graficznym na modele LLM GPT 3.5 oraz GPT-4. Jego głównym celem jest prowadzenie naturalnie wyglądających rozmów z użytkownikami w formie interfejsu konwersacyjnego. ChatGPT rozumie kontekst rozmowy i potrafi odpowiadać uwzględniając informacje udzielone we wcześniejszej części rozmowy.
#6 Czym jest prompt?
Prompt to wejściowy fragment tekstu, który jest podawany do modelu, aby wywołać odpowiedź lub kontynuację. W czasach wyszukiwarek mieliśmy "zapytania" a teraz mamy "prompty". Dziś de facto chodzi o to samo - by otrzymać odpowiedź, ale prompt moim zdaniem jest bardziej pojemny - może zawierać polecenie, więc przewiduje, że będziemy promptować.
#7 Czym jest token?
W kontekście GPT, token to podstawowa jednostka informacji używana podczas przetwarzania języka naturalnego. Tokeny to mniejsze fragmenty tekstu, takie jak sylaby czy słowa. Są przekształcane w wektory liczbowe, co pozwala modelowi na przetwarzanie informacji numerycznie. GPT analizuje sekwencje tokenów, aby zrozumieć kontekst i przewidywać kolejne tokeny, co jest kluczowe dla efektywnego przetwarzania informacji tekstowych.
Gdy korzystasz z GPT przez API, rozliczasz się za liczbę tokenów wysłanych do OpenAI. Im dłuższy prompt, tym więcej płacisz.
#8 Co oznacza multi modal?
Oznacza zdolność modelu do przetwarzania i generowania informacji z różnych źródeł, takich jak tekst, obrazy, dźwięki czy filmy. W praktyce oznacza to, że multi modalny model GPT może na przykład generować opis obrazka na podstawie analizy jego treści, czy też przewidywać dźwięk na podstawie tekstu.
#9 Czym jest Alignment
Proces "Alignment" ma na celu zapewnienie zgodności celów i zachowań systemów AI z wartościami i oczekiwaniami ludzi, tworząc AI bezpieczne, etyczne i użyteczne. Obejmuje definiowanie celów systemu, uczenie na podstawie danych odzwierciedlających wartości ludzkie i monitorowanie działania systemu. Wyzwanie polega na projektowaniu AI, które wykonują zadania skutecznie, unikając niepożądanych skutków, jak dyskryminacja czy naruszenie prywatności.
#10 Czym jest transformer?
Transformer to architektura sieci neuronowych opracowana w 2017 roku, służąca do efektywnego przetwarzania sekwencji danych, takich jak język naturalny. Wykorzystuje mechanizmy self-attention i position encoding, co pozwala zrozumieć związki między słowami w zdaniach. Różni się od wcześniejszych podejść, takich jak RNN czy CNN, przetwarzając sekwencje równocześnie. Transformer stał się podstawą zaawansowanych modeli, takich jak GPT czy BERT, osiągając wysokie wyniki w przetwarzaniu języka naturalnego.
#11 Czym jest AI Agent?
To bardzo dynamicznie rozwijająca się kategoria programów napisanych przez ludzi która wykorzystuje GPT-4 do samodzielnego wykonywania złożonych zadań. Posiada dostęp do internetu oraz długo i krótkoterminową pamięć oraz, po otrzymaniu polecenia - działa samodzielnie. Nie trzeba "promptować" kolejnych kroków. Model sam ustala plan działania i kończy zadanie podsumowując co zrobił i jakie powinny być następne kroki. To ważne, bo te programy
- Są open-source, tworzone przez społeczność - więc każdy może skorzystać, każdy może kontrybuować. Sky is the limit, for better or worse! Tego nie zatrzymamy.
- przez to, że działają bez nadzoru są, według niektórych, namiastką AGI
Tutaj możesz zobaczyć demo na żywo - trzeba podać klucz API do OpenAI.
Dwa najpopularniejsze repozytoria to BabyAGI oraz AutoGPT.
#12 Co oznacza AGI?
AGI (Sztuczna Inteligencja Ogólna) to zaawansowany poziom AI, dążący do osiągnięcia umiejętności porównywalnych z ludzkim rozumieniem i uczeniem się w różnych dziedzinach. W przeciwieństwie do wąskiej AI, AGI ma zdolność do przekształcania wiedzy i umiejętności w różnych kontekstach. Celem AGI jest osiągnięcie ogólnej zdolności rozumowania i adaptacji, równającej się z ludzką inteligencją. Obecnie AGI jest długoterminowym celem dla naukowców.
Niektórzy uważają, że osiągnięcie tego etapu rozwoju może stanowić zagrożenie dla ludzkości.
Ja osobiście nie mam takich obaw teraz - może to temat na następny tekst?