Globalna potražnja za H200 čipovima menja AI ekonomiju. Saznajte kako industrija u Srbiji može pametno planirati AI infrastrukturu i ROI.

AI hardver: zašto H200 potražnja menja industriju
Kineske tehnološke kompanije su za 2026. naručile preko 2 miliona Nvidia H200 AI čipova, dok Nvidia prema navodima iz vesti trenutno ima oko 700.000 jedinica na lageru. Ta razlika nije “još jedna tech priča” — to je signal da je globalna trka za računarskom snagom postala novi oblik industrijske konkurentnosti.
Za proizvodne firme u Srbiji, poruka je jasna: AI više nije prvenstveno pitanje ideja i algoritama, nego infrastrukture. Ko može da obezbedi računarske resurse (GPU, servere, mrežu, podatke), taj može da razvije modele koji smanjuju škart, ubrzavaju planiranje, podižu kvalitet i štede energiju. Ko ne može — rizikuje da ostane “digitalno siromašan” baš u trenutku kada EU partneri sve češće traže tragove automatizacije, sledljivosti i prediktivnog održavanja u lancu snabdevanja.
U okviru naše serije „Kako veštačka inteligencija transformiše proizvodnju i industriju u Srbiji“, ovaj tekst prevodi globalnu vest o H200 čipovima u praktičnu temu: šta nestašica (i cena) AI hardvera znači za domaću industriju, i kako da planirate AI put bez pogrešnih ulaganja.
Šta nam H200 „kriza potražnje“ zapravo govori
Odgovor prvo: ogromna potražnja za H200 čipovima pokazuje da se AI budžeti sele iz “eksperimenata” u kapitalne investicije, a lanac snabdevanja postaje strateški rizik.
U izvornoj vesti se navodi da Nvidia kontaktira TSMC da poveća proizvodnju, uz moguć početak većeg obima u drugom kvartalu 2026. To znači dve stvari:
- Lead time (vreme čekanja) za napredan hardver postaje planerska stavka, ne incident.
- Ko ima bolji pristup hardveru, može brže da trenira/izvršava modele i brže “isporuči” rezultate biznisu.
U praksi, razlika između kompanija neće biti samo u tome ko je “uveo AI”, već:
- ko ima stabilan pristup GPU resursima (on-prem ili cloud)
- ko ima podatke spremne za učenje (kvalitet, označavanje, governance)
- ko ima tim koji ume da poveže modele sa proizvodnim procesom
Drugim rečima: AI u industriji je logistika + inženjering + disciplina, ne samo software.
Zašto je H200 bitan iako postoji Blackwell (i sledeće generacije)
Odgovor prvo: čak i “prethodna generacija” GPU-a ostaje tražena jer industriji treba velika količina stabilne, proverene računarske snage odmah.
H200 je deo Hopper generacije i u vesti se pominje kao čip koji se proizvodi na TSMC 4nm procesu. Iako Nvidia gura nove linije (Blackwell, a kasnije Rubin), tržište često kupuje ono što može da dobije u količini i u roku.
Za Srbiju je ovo korisna lekcija: ne morate juriti najnovije po svaku cenu. U proizvodnji, pobeda je često u standardizaciji i pouzdanosti, ne u “najnovijem modelu”.
Kako globalna potražnja udara na industriju u Srbiji
Odgovor prvo: raste cena AI projekata, produžava se nabavka opreme i jača zavisnost od cloud provajdera — što direktno utiče na ROI u proizvodnji.
U vesti se pominje okvirna cena oko 27.000 USD po čipu za kineske kupce (uz varijacije po količini i ugovoru). Čak i bez ulaska u detalje konfiguracija, ovo jasno kaže da je “GPU budžet” za ozbiljnije AI inicijative često veći nego što menadžment očekuje.
Za domaće proizvodne firme tipične posledice su:
- Pilot traje duže jer se čeka infrastruktura ili resursi u cloudu postaju skupi kada pilot pređe u stalnu upotrebu.
- Timovi štede na podacima (što je greška): bez uređene baze podataka i jasne metrike, GPU samo “spali” budžet.
- IT i proizvodnja se razilaze: IT gleda bezbednost i trošak, proizvodnja gleda brzinu i isporuku. Bez dogovora — projekat stoji.
Geopolitika i regulatorika: novi faktor rizika
Odgovor prvo: izvoz, dozvole i takse mogu preko noći promeniti dostupnost hardvera, pa je planiranje AI infrastrukture postalo upravljanje rizikom.
U članku se provlači regulatorna neizvesnost (odobrenja, takse, dozvole). Iako Srbija nije direktno u centru tog konflikta, indirektno trpi kroz:
- manju dostupnost opreme u regionu
- veće cene kod distributera
- veći pritisak da se ide na cloud (gdje trošak postaje operativni i “beskonačan”)
Ako radite sa EU kupcima, dodatni sloj je i usklađenost: gde se podaci obrađuju, kakva je politika privatnosti, šta se šalje van firme.
Gde AI daje najbrži povrat u proizvodnim sistemima
Odgovor prvo: najbrži ROI u industriji obično dolazi iz tri zone — kvalitet, zastoji i planiranje — i ne traži uvek treniranje ogromnih modela.
Kad ljudi čuju “GPU nestašica”, često pomisle: “Okej, AI nam nije dostupan.” To je pogrešan zaključak. U praksi, mnogi industrijski slučajevi korišćenja mogu da rade sa:
- manjim modelima
- transfer učenjem
- optimizovanim inferenciranjem
- kombinacijom edge (kamera/PLC) i centralne analitike
1) Kontrola kvaliteta (computer vision)
Odgovor prvo: vizuelna inspekcija je često prvi AI projekat jer daje merljive rezultate: manje škarta, manje reklamacija, brže puštanje serije.
Primeri iz proizvodnje (tipično primenljivo i u Srbiji):
- detekcija ogrebotina, nepravilnosti, loših varova, neujednačene boje
- provera kompletnosti (da li nedostaje komponenta)
- kontrola etiketa/štampe i serijskih brojeva
Šta je ključ uspeha? Dobro definisana tolerancija greške i dogovor sa kvalitetom: da li optimizujete “false reject” ili “false accept” i koliko košta jedna greška.
2) Prediktivno održavanje (zastoji koštaju više nego što piše u izveštajima)
Odgovor prvo: prediktivni modeli smanjuju neplanirane zastoje, ali samo ako imate disciplinu u podacima (vibracije, temperatura, struja, servisni zapisi).
Ovo je dobar teren za “manje” modele i statistiku, ne morate odmah LLM. Često su dovoljni:
- anomalija detekcija na senzorima
- modeli koji predviđaju kvar unutar 7–14 dana
- pametno zakazivanje servisa (kada je linija ionako u mirovanju)
3) Planiranje proizvodnje i lanac snabdevanja
Odgovor prvo: AI ovde donosi mirniji rad: manje hitnih narudžbi, manje prekovremenih, manje zaliha koje stoje.
Tipične AI primene:
- prognoza potražnje po kupcu ili SKU
- optimizacija zaliha (sigurnosne zalihe po riziku dobavljača)
- raspoređivanje (scheduling) uz ograničenja mašina, ljudi i alata
Za mnoge firme, ovo je “tihi” dobitak: niko ne slika model, ali CFO vidi brojke.
Kako da planirate AI infrastrukturu kad su GPU resursi skupi
Odgovor prvo: najbolji pristup je hibrid: pametan izbor use-case-a + optimizacija modela + jasna odluka šta ide u cloud, a šta ostaje u firmi.
Evo okvira koji se pokazao praktičnim u industrijskim timovima:
Korak 1: Odvojite trening od izvršavanja (inference)
Trening je GPU-intenzivan i povremen. Inference je stalna i mora biti pouzdana.
- Trening: često ima smisla koristiti cloud ili iznajmljene resurse
- Inference: često ima smisla držati lokalno (edge/server u fabrici) zbog latencije i troška
Korak 2: Birajte projekte koji rade i sa manjim modelima
Ako je jedini način da projekat radi taj da trenirate ogromne modele svaki mesec — projekat je verovatno pogrešno postavljen.
Dobri industrijski projekti obično imaju:
- jasnu metriku uspeha (npr. -20% reklamacija)
- stabilan izvor podataka
- kontrolisan domen (jedna linija, jedan proizvod, jedna kamera)
Korak 3: Optimizujte modele pre kupovine hardvera
Pre nego što potpišete nabavku servera, često možete dobiti veliki deo performansi kroz:
- kvantizaciju (npr.
INT8/FP16gde ima smisla) - batching i pravilno dimenzionisanje
- pipeline koji izbacuje nepotrebne korake
Poenta: inženjering je jeftiniji od hardvera.
Korak 4: Ugovorite “AI kapacitet” kao resurs, ne kao igračku
Ako idete na cloud ili kolokaciju, ugovor treba da pokrije:
- garantovanu dostupnost resursa (da ne čekate GPU nedeljama)
- trošak po satu / po inferenciji
- bezbednosne zahteve (industrijski podaci nisu demo set)
„People also ask“: pitanja koja dobijam od proizvodnih timova
Da li nam treba H200 da bismo uveli AI u proizvodnju?
Odgovor: Ne. Za većinu industrijskih slučajeva (kvalitet, anomalije, optimizacija) možete krenuti sa manjim GPU resursima ili čak bez GPU-a u prvoj fazi. H200 je relevantan kad trenirate velike modele ili imate masivne potrebe za paralelnom obradom.
Da li je bolje kupiti GPU server ili ići na cloud?
Odgovor: Ako imate 24/7 inference u fabrici i stabilan obim, server se često isplati. Ako radite povremeni trening i iteracije, cloud je fleksibilniji. Najčešće rešenje je hibrid.
Koji je prvi korak za AI projekat u fabrici u Srbiji?
Odgovor: Izaberite jednu liniju i jedan problem koji košta novac svake nedelje (škart, zastoj, reklamacije). Zatim proverite da li imate podatke (ili možete brzo da ih prikupite).
Šta da uradite u narednih 30 dana (bez velikih investicija)
Odgovor prvo: spremite teren: podatke, metrike i mali pilot — pa tek onda infrastrukturu.
Praktična lista:
- Mapirajte top 3 gubitka: škart, zastoji, energija, reklamacije.
- Izaberite jedan slučaj sa jasnom metrikom (npr. “smanjiti škart sa 3% na 2%”).
- Proverite podatke: gde su, ko je vlasnik, koliko su čisti.
- Napravite mini-pilot (2–4 nedelje) sa realnim podacima.
- Tek onda odlučite: cloud, lokalni server, ili kombinacija.
Ovakav redosled štedi budžet i skraćuje put do rezultata.
Šira slika: AI čipovi su novi industrijski kapacitet
Odgovor prvo: potražnja za H200 čipovima nije samo priča o Nvidiji i Kini — to je dokaz da je računarska snaga postala resurs poput energije, mašina i alata.
Za Srbiju, koja želi da zadrži i proširi industrijsku bazu, najpametniji potez nije “kupiti najjače”. Najpametniji potez je organizovati AI kao proizvodnu sposobnost: jasno vlasništvo nad podacima, definisane metrike, tim koji spaja proizvodnju i IT, i plan infrastrukture koji je otporan na tržišne šokove.
Ako želite da AI u proizvodnji u Srbiji donese merljive rezultate u 2026, počnite od procesa i podataka — a GPU nabavku tretirajte kao posledicu dobrog plana, ne kao početak priče.
Koja je jedna tačka u vašem proizvodnom procesu gde biste, uz malo bolje podatke i automatizaciju, mogli da dobijete 10% poboljšanja već ove godine?