Header
Početna > Radovi > Škola lijepog ponašanja: kako AI uči postati koristan asistent? (4/6)

Škola lijepog ponašanja: kako AI uči postati koristan asistent? (4/6)

Škola lijepog ponašanja: kako AI uči postati koristan asistent? (4/6)

Nakon prve faze razvoja, koju zovemo „pred-treniranje” (čitanje cijelog interneta), AI model postaje tek napredni simulator teksta. Da bi postao koristan asistent koji nam pomaže u svakodnevnom radu mora proći ključnu transformaciju, tzv. fino podešavanje pod nadzorom (engl. Supervised Fine-Tuning – SFT).

Andrej Karpathy nudi precizan model za razumijevanje ove faze: kada koristite AI, ne komunicirate s „magičnom inteligencijom” nego s neuronskom simulacijom prosječnoga ljudskog radnika.

Kako nastaje „osobnost” AI asistenta?

U fazi finoga podešavanja model se više ne obučava na internetskim arhivama. Umjesto toga koristi se znatno manji, ali iznimno kvalitetan skup podataka koji se sastoji od primjera idealnih razgovora koje su napisali ljudi.

Ključnu ulogu ovdje imaju ljudski ocjenjivači odnosno timovi stručnjaka (programera, pisaca, znanstvenika) koje tvrtke poput OpenAI-a angažiraju da napišu savršene odgovore na različite upite. Oni slijede detaljne upute, često napisane na stotinama stranica, koje definiraju kako asistent treba zvučati:

  • Budi koristan i jasan: Odgovor mora izravno rješavati korisnikov problem.
  • Budi istinit i objektivan: AI treba izbjegavati nagađanja i ostati neutralan.
  • Budi bezopasan i empatičan: Sustav ne smije generirati štetan sadržaj.

Proces imitacije: Kako sustav uči?

Važno je razumjeti da AI u ovoj fazi ne počinje „razmišljati” svojom glavom. On zapravo statistički imitira stil i sadržaj tisuća ljudskih odgovora koje su stručnjaci pripremili.

Karpathy to objašnjava izravno: odgovor koji dobijete od ChatGPT-a ne dolazi od svjesnog bića, nego od sustava koji statistički oponaša ljudske ocjenjivače. Vi zapravo komunicirate s „prosjekom” znanja i stila tisuća ljudi koji su model obučili da govori specifičnim glasom koji je odredila korporacija.

Što to znači u praksi?

Kada od umjetne inteligencije tražite savjet ili informaciju, korisno je imati na umu sljedeće činjenice:

  • To nije apsolutna istina: Dobivate odgovor kakav bi napisao prosječni stručni radnik nakon kratkog istraživanja i praćenja korporativnih uputa.
  • Odraz učitelja: Model reflektira stavove i pristranosti ljudi koji su ga obučavali. On nema vlastiti sustav vrijednosti, nego zrcali smjernice svojih autora.
  • Simulirani identitet: Kada AI napiše „Ja sam model koji je razvio OpenAI” on to ne „osjeća”. Ta je rečenica dio podataka na kojima je treniran ili mu je izravno zadana kao pravilo ponašanja.

Zaključak: Umjetna inteligencija je moćan alat jer u sebi nosi sažeto znanje i vještine tisuća stručnih ljudi. Ipak, alat ostaje simulacija i ogledalo ljudskog truda, a ne samostalni mislilac.

Pročitajte prethodne članke iz serijala:

  1. Kako nastaje baza znanja kojom se služi ChatGPT?
  2. Zašto “najpametniji” modeli griješe na najjednostavnijim zadacima?
  3. Može li AI znati sve, a ne znati razgovarati?

Izvor: Analiza tehničkog predavanja Andreja Karpathyja: Deep Dive into LLMs like ChatGPT.

U sljedećem nastavku: Zašto AI izmišlja podatke tako samouvjereno? Istražujemo fenomen „halucinacija” i učimo kako prepoznati kada sustav “blefira”.