Ova knjiga demistifikuje veštačku inteligenciju (AI) i pruža čvrste osnove za razumevanje najmoćnije tehnologije našeg vremena. Osnove su ključne za shvatanje svega što sledi, kako bismo prestali biti posmatrači magije i postali korisnici najmoćnije tehnologije našeg vremena. AI je odličan alat za pisanje, kodiranje, prevođenje i kreativnost.
Istražite globalnu AI scenu: od Silicijumske doline do kineskih AI tigrova i evropske AI etike.
Uđite u svet praktične primene: revoluciju jezika (LLM), zvuka (generisanje i kloniranje glasa, kreiranje muzike), slike i videa (generisanje slika i videa iz teksta ili slika).
Savladajte inženjering upita za optimalnu komunikaciju sa AI i upoznajte AI agente – autonomne digitalne saradnike budućnosti.
Upoznajte se sa pravnim i etičkim dilemama koje donosi AI.
Pročitajte na šta nas upozorava otac veštačke inteligencije, Džefri Hinton.
Otkrijte svet veštačke inteligencije i budite aktivan učesnik AI budućnosti.
Uvod i osnove veštačke inteligencije, 1
Strahovi i mitovi, 1
Strahovi od veštačke inteligencije, 1
Mitovi o AI, 4
Zašto je prethodno izneto važno?, 5
Šta je veštačka inteligencija, 5
Mašinsko učenje, 6
Duboko učenje, 6
Vrste veštačke inteligencije, 7
Istorijski pregled: od Tjuringa do današnjih dana, 9
Počeci (1950): Rađanje ideje, 9
Periodi optimizma i AI zime, 11
Revolucija dubokog učenja (2010): Savršena oluja, 12
Renesansa (2012): Duboko učenje, 13
Era velikih jezičkih modela (2017): LLM, 14
Ključne prekretnice: AlexNet, GPT, ChatGPT, 14
Pogled unazad i unapred, 15
Rezime, 16
Anatomija veštačke inteligencije, 17
Neuronske mreže: Digitalna imitacija mozga, 17
Anatomija veštačkog neurona, 18
Ulazni sloj → Skriveni sloj → Izlazni sloj, 18
Konvolucione neuronske mreže (CNN): Majstori vida, 20
Zašto su CNN posebni?, 20
Praktična primena CNN, 21
Rekurentne neuronske mreže (RNN): Majstori sekvenci, 21
Problem sa pamćenjem, 21
Kako RNN pamti, 22
LSTM i GRU: Rešavanje problema dugotrajne memorije, 22
Praktična primena RNN, 22
Generativne adversarijalne mreže: Umetnici i falsifikatori, 23
Princip falsifikatora i detektiva, 23
Proces treniranja: Večna borba, 23
Tipovi GAN i njihove primene, 24
Etički izazovi GAN, 24
Algoritmi za učenje: Kako AI uči, 24
Prosleđivanje unazad: Učenje na greškama, 25
Pronalaženje najboljeg rešenja, 25
Tipovi učenja, 25
Moderne arhitekture: Transformer revolucija, 26
Ključna inovacija: Mehanizam pažnje (Attention), 26
Prednosti Transformer arhitekture, 27
Hibridne arhitekture, 27
Multimodalni modeli, 27
SAD: Titan AI sveta, 29
Google/Alphabet: Pionir koji se budi, 30
Gemini era: Odgovor na ChatGPT, 31
Strategija duboke integracije, 32
Tehnološke prednosti, 32
OpenAI: Revolucionar koji je promenio sve, 33
Od neprofitabilne vizije do komercijalnog uspeha, 33
Partnerstvo sa Microsoftom: Strateška simbioza, 34
Budućnost GPT-a: AI agenti (asistenti), 36
Meta: Demokratizacija kroz otvoren kod, 36
Llama revolucija: Moć otvorenog koda, 36
Zašto Meta daje besplatno svoje AI modele, 37
Uticaj na industriju, 38
Integracija u Meta ekosistem, 38
Microsoft: Transformacija kroz AI partnerstva, 38
Azure AI: Infrastruktura za AI eru, 39
Copilot revolucija: AI u svakom proizvodu, 39
Korporativni fokus: AI za biznis, 39
Amazon: AI kao infrastruktura, 40
AWS AI: Demokratizacija kroz oblak, 40
Alexa: Pionir glasovnih asistenata, 41
Strategija: AI za sve, 41
Anthropic: Šampion pisane reči, kodiranja i sigurnosti, 41
Claude: AI asistent fokusiran na sigurnost, 42
Claude familija modela, 42
Constitutional AI: Nova paradigma sigurnosti, 42
Cohere: Enterprise AI specijalizacija, 43
xAI: Vizija Ilona Maska, 43
Grok karakteristike, 44
NVIDIA, 44
Analiza strategija: Različiti putevi ka AI dominaciji, 45
Budućnost američke AI dominacije, 46
Strukturalne prednosti, 46
Potencijalni izazovi, 46
Kina: Moćni AI tigrovi, 47
Brzina, masivni podaci, otvoren kod i podrška države, 47
Glavne kineske AI kompanije, 48
Velike kineske tehnološke kompanije, 48
Rastući kineski AI tigrovi, 49
Specijalizovane kineske AI kompanije, 50
Baidu: Kineski Google, 50
Ernie Bot: Kineski odgovor na ChatGPT, 51
Apollo: Pionir autonomne vožnje, 51
Baiduova strategija: AI-first, 51
Alibaba: Gigant elektronske trgovine postaje AI sila, 52
Qwen: Alibabino ambiciozno prisustvo u globalnoj LLM trci, 52
Otvoren kod i ekosistem, 53
Qwen je više nego samo model, 53
Alibaba Cloud: AI kao usluga, 53
AI u e-commerce ekosistemu, 54
Tencent: Gaming AI i super-aplikacija WeChat, 54
WeChat ekosistem: AI u srcu super-aplikacije, 54
Gaming AI: Gde Tencent dominira, 55
Hunyuan: Tencentov LLM, 55
ByteDance: TikTok algoritam koji je promenio svet, 55
TikTok algoritam: AI koji čita dušu, 55
Globalna ekspanzija i geopolitički izazovi, 56
DeepSeek: Revolucionar otvorenog koda, 56
DeepSeek modeli, 57
SenseTime: Pionir kompjuterskog vida, 57
Kontroverze i izazovi, 58
Državna AI strategija: Svetski lider i AI za sve, 58
Ključni elementi kineske strategije, 58
Kineski vs zapadni model: Fundamentalne razlike, 59
Geopolitička drama: AI kao bojno polje, 59
Budućnost kineske AI: izazovi i prilike, 60
Ključni izazovi, 60
Strateške prilike, 60
AI u ostatku sveta, 61
Specijalizacija i regulativa, 61
Evropa: Etička AI i regulatorno pionirstvo, 62
EU AI Act: Prvi sveobuhvatan AI zakon na svetu, 63
GDPR efekat: Kako Evropa oblikuje globalne standarde, 63
Mistral AI: Evropski šampion i odgovor na OpenAI, 64
BLOOM: Evropska saradnja u AI, 64
Ostali evropski AI igrači, 64
Evropska AI strategija: Prednosti i izazovi, 65
Kanada: Akademska izvrsnost i AI istraživanja, 65
Tri stuba kanadske AI: Montreal, Toronto, Edmonton, 65
Vector Institute: Kanadski AI hab, 66
Kanadski AI pioniri, 66
Kanadske AI kompanije, 66
Velika Britanija: DeepMind nasleđe i AI Safety, 67
DeepMind: Britanski AI dragulj, 67
UK AI Safety Institute: Globalno liderstvo u AI bezbednosti, 67
Britanski AI ekosistem, 68
Brexit i AI: Izazovi i prilike, 68
Japan: Robotika i industrija 4.0, 68
Japan: Od industrijskih robota do humanoidnih partnera, 69
Society 5.0: Japanska vizija AI budućnosti, 69
Izazovi japanske AI strategije, 70
Južna Koreja: K-AI revolucija, 70
Korejski AI giganti, 70
Južnokorejski AI igrači, 70
HyperCLOVA: Korejski LLM i odgovor na GPT, 70
Korejska AI strategija: Digital New Deal, 71
Rusija: AI pod sankcijama, 71
Ruski AI igrači, 71
Uticaj sankcija na ruski AI, 71
Izrael: Startap nacija i AI inovacije, 72
Izraelski AI uspesi, 72
Ostale AI sile: Indija, Australija, Singapur, 73
Indija: IT gigant ulazi u AI, 73
Australija: AI istraživanja i etika, 73
Singapur: Smart Nation vizija, 74
Geopolitika i AI: Rat čipova i tehnološka nezavisnost, 75
Budućnost globalnog AI pejzaža, 78
Trendovi koji oblikuju AI budućnost, 78
Scenariji za 2030. godinu, 79
Revolucija jezika: Veliki jezički AI modeli, 81
Revolucija u obradi jezika, 82
Problem starih pristupa, 82
Ključna Inovacija: Mehanizam pažnje, 83
Paralelna obrada: Brzina i efikasnost, 83
Više uglova gledanja (multi-head attention), 83
Poziciono kodiranje: Pamćenje redosleda, 84
Zašto je ovo revolucionarno?, 84
Praktične posledice, 84
GPT Familija: Evolucija kroz generacije, 84
Konkurencija: Claude, Gemini, Grok, Kimi, DeepSeek, Qwen…, 85
Claude (Anthropic): AI koji uči iz grešaka, 86
Gemini (Google): Multimodalni gigant, 86
Grok (xAI): Pobunjenički AI sa pristupom realnom vremenu, 86
Kimi (Moonshot AI): Specijalista za svestranost i dugi kontekst, 86
DeepSeek (DeepSeek AI): Revolucionar otvorenog koda, 87
Qwen (Alibaba): Multimodalni ekosistem, 87
AI otvorenog koda: Druga velika revolucija, 87
Značajni modeli otvorenog koda, 88
RLHF: Kako se AI obučava da bude koristan, 89
Problem sa osnovnim treniranjem, 89
Tri faze RLHF procesa, 90
Izazovi RLHF-a, 90
Spontana svojstva: Kada AI prevazilazi očekivanja, 90
Ključna spontana svojstva LLM-ova, 91
Zakon skaliranja: Kada se emergentna svojstva pojavljuju, 92
Inženjering upita: Umetnost komunikacije sa AI, 92
Elementi efikasnog upita, 92
Napredne tehnike upita, 93
Multimodalni LLM-ovi: Proširenje na slike i video, 94
GPT-4V: Vizija susreće jezik, 94
Sposobnosti multimodalnih modela, 94
Ograničenja LLM-ova: Šta još ne mogu, 95
Halucinacije: Kada AI izmišlja činjenice, 95
Otklon i predrasude, 95
Ograničenja u rezonovanju, 95
Budućnost LLM-ova: Agenti, alati i rezonovanje, 96
AI Agenti: Od razgovora do akcije, 96
Upotreba alata: Proširivanje sposobnosti, 96
Put ka AGI, 96
Praktični saveti za korišćenje LLM-ova, 97
Zaključak, 97
Revolucija zvuka: Kako AI sluša, govori i stvara, 99
Dvosmerna komunikacija: Srž glasovne interakcije sa AI, 100
Od govora do teksta: Mašine koje slušaju i razumeju, 100
Od teksta do govora: Mašine koje govore i izražavaju emocije, 102
Izvan dijaloga: AI kao kreativni partner i etički izazov, 103
Generisanje muzike: Nova simfonija kreativnosti, 104
Kloniranje glasa: Digitalni dvojnici i pandorina kutija, 105
Primena u praksi: Kako audio AI već menja naš svet, 108
Najbolji AI alati za pretvaranje teksta u govor (i za srpski jezik), 110
Drugi značajni AI alati za pretvaranje teksta u govor, 111
Najbolji AI alati za pretvaranje govora u tekst (i za srpski tekst), 112
Zaključak: Balansiranje inovacija i odgovornosti u doba audio AI, 113
Revolucija slika: Kako AI stvara slike i video, 115
Uvod, 115
AI za slike: Od ideje do vizuelizacije, 116
Pretvaranje teksta u sliku, 117
Vodeći modeli i platforme za pretvaranje teksta u sliku, 118
Primene prevođenja teksta u slike, 119
Modifikacija i stilizacija slike, 120
Primene AI uređivanja fotografija, 120
AI za video sadržaj: Pokretne slike iz upita i više od toga, 121
Vodeći modeli i platforme za pretvaranje teksta u video i slika u video, 122
AI nudi i moćne mogućnosti za manipulaciju i animiranje postojećih vizuelnih materijala, 124
Prepoznavanje i analiza slike/videa: AI kao oko, 124
Klasično prepoznavanje slike, 124
Napredne tehnike i koncepti, 126
Etička razmatranja i izazovi, 127
Dipfejk tehnologija, 127
Autorska prava i vlasništvo, 128
Pristrasnost i reprezentacija, 128
Budućnost rada i kreativnosti, 129
Perspektive i budućnost AI u multimediji, 129
AI agenti: Autonomna budućnost rada i tehnologije, 133
Šta su AI agenti?, 134
Definicija i ključne karakteristike, 134
Vrste AI agenata i primena, 135
Agenti za generisanje koda, 135
Agenti za automatizaciju poslovnih zadataka, 135
Istraživački agenti, 136
Kreativni i lični agenti, 136
Organizacija i sažimanje informacija, 137
Njegovo veličanstvo NotebookLM, 137
Recall, 138
Singapur kao lider u razvoju AI agenata, 138
Budućnost AI agenata, 139
Integracija i orkestracija, 139
AI radna snaga, 139
Etički izazovi, 140
Praktična upotreba AI alata, 141
Rad sa tekstom: Pristup jezičkim modelima, 141
Registracija i prvi koraci, 141
Osnovne mogućnosti i korišćenje, 141
Podešavanja i ključne razlike, 143
Glasovni AI alati i generisanje muzike, 144
OpenAI Whisper: Moćan AI za transkripciju, 144
Kloniranje glasa, 144
Google AI Studio za generisanje teksta, dialoga i multimedije, 144
Generisanje muzike: Suno, Udio i ElevenLabs, 145
Kreiranje vizuelnog sadržaja: Slike i video, 145
Tekst u sliku, 145
Tekst u video i slika u video (Image-to-Video), 146
Lokalno pokretanje AI modela: Kontrola i privatnost, 146
Pokretanje LLM-ova lokalno, 147
Lokalno prepoznavanje govora, 147
Lokalno generisanje vizuelnog sadržaja, 147
Hardverski zahtevi, 148
Iznajmljeni serveri, 148
Dobar izbor LLM modela, 148
RAG, 149
AI razvojni alati: Povećanje produktivnosti i kreativnosti, 149
AI-asistirano programiranje, 149
Produktivnost i kreiranje sadržaja, 150
Dizajn i kreativnost, 150
API integracije: Kreiranje sopstvenih AI aplikacija, 151
Osnovne API integracije za LLM-ove, 151
Hugging Face Transformers: Centralna biblioteka, 151
Frameworks za izgradnju AI aplikacija: LangChain i LlamaIndex, 152
Vektorske baze podataka, 152
API-ji za fino podešavanja, 152
Umeće pisanja upita, 153
Univerzalni principi dobrog upita, 153
Predstavljanje CO-STAR okvira, 155
Upiti za jezičke modele (LLM), 155
Osnovni principi i struktura, 156
Napredne tehnike za rešavanje kompleksnih problema, 157
Meta upiti: Korišćenje AI za pisanje boljih upita, 159
Od reči do svetova: Pisanje upita za generisanje slika, 160
Anatomija vizuelnog upita, 160
Specifičnosti nekih vizuelnih modela (Midjourney, DALL-E, Stable Diffusion), 161
Iterativni proces, 162
Pisanje upita za generisanje muzike, 163
Elementi muzičkog upita, 163
Proces kreiranja i iteracije, 164
Pisanje upita za video, 165
Ključne razlike i komponente, 165
Saveti za kreiranje dinamičnih scena, 166
Zaključak: Budućnost pisanja upita i simbioza čoveka i AI, 167
Evolucija, ne izumiranje, 167
Kreativno partnerstvo: Ka simbiozi čoveka i AI, 168
Pravni izazovi i autorska prava u eri veštačke inteligencije, 169
Autorska prava u AI eri: Ko je vlasnik kreativnosti mašine?, 169
Tradicionalni koncept autorstva, 170
AI dovodi u pitanje sve pretpostavke, 170
Različiti pristupi u svetu, 170
Slučaj Thaler vs. USPTO: Može li AI biti izumitelj?, 171
Kršenje autorskih prava: Kada AI krade tuđe delo, 171
Kako AI uči iz postojećih dela, 171
Ključni sudski sporovi, 172
Doktrina fer upotrebe i AI, 172
Pravna odgovornost: Ko je kriv kada AI napravi grešku?, 173
Tradicionalni modeli odgovornosti, 173
AI uvodi nove složenosti u odgovornost, 174
Mogući modeli AI odgovornosti, 174
Slučaj samovozećih automobila, 174
Privatnost podataka i AI: GDPR u AI eri, 175
GDPR principi vs AI realnost, 175
Regulatorni pristupi: EU AI Act vs američka fleksibilnost, 175
EU AI Act: Sveobuhvatan pristup, 175
Američki pristup: Sektorska regulacija, 176
Kineski pristup: Državna kontrola, 176
Etički aspekti: Gde se pravo i moral susreću, 176
Ključne etičke dileme, 177
Algoritamska pristrasnost i diskriminacija, 177
Budućnost AI regulacije: Šta nas čeka?, 177
Trendovi u AI regulaciji, 178
Ključni izazovi za buduće regulatore, 178
Predlog: AI pravna ličnost, 178
Praktični saveti: Kako se zaštititi u AI eri, 178
Za kompanije koje koriste AI, 179
Za kreatore sadržaja, 179
Za potrošače, 179
Zaključak o AI pravnim izazovima, 179
Moralni i etički izazovi u eri veštačke inteligencije, 181
Autonomija i ljudska kontrola, 181
Pristrastnost i diskriminacija, 181
Privatnost i dostojanstvo, 182
Transparentnost i objašnjivost, 182
Uticaj na zapošljavanje i društvenu strukturu, 182
Manipulacija i uticaj na ponašanje, 183
Vojna primena i smrtonosno autonomno oružje, 183
Pala priroda čoveka, 183
Dugoročni egzistencijalni izazovi, 184
Ka odgovornom razvoju veštačke inteligencije, 184
Poslednji ispit čovečanstva, 187
Koliko su napredovali AI modeli?, 187
Zašto je HLE važan?, 188
Primer pitanja, 188
Matematika, 188
Fizika, 189
Biologija/medicina, 189
Filozofija i humanističke nauke, 189
Hemija, 190
Drevni hebrejski, 190
Lingvistika, 190
Zaključak, 190
AI i mit o apokalipsi spajalicama, 191
Pretpostavka 1: Neograničen pristup resursima, 191
Pretpostavka 2: Odsustvo konkurencije, 192
Pretpostavka 3: Ljudi su bespomoćni, 193
Pretpostavka 4: AI je tvrdoglavo nerazuman, 193
Zaključak, 193
Otac veštačke inteligencije o AI, 195
Kako AI predviđa sledeću reč u tekstu?, 196
Neuronske mreže probile u prvi plan početkom 21. veka, 196
Četbotovi razmišljaju?, 197
Reagovanje vlada na rizike veštačke inteligencije, 197
AI agenti, njihovi ciljevi i težnje da steknu kontrolu, 198
Zaključak, 199
Indeks, 201