Kako veštačka inteligencija transformiše proizvodnju i industriju u Srbiji•7. јануар 2026.•By 3L3C

Globalna potražnja za H200 čipovima menja AI ekonomiju. Saznajte kako industrija u Srbiji može pametno planirati AI infrastrukturu i ROI.

Nvidia H200AI hardverGPU infrastrukturaIndustrijska AIDigitalna transformacijaProizvodnjaLanac snabdevanja

Featured image for AI hardver: zašto H200 potražnja menja industriju

AI hardver: zašto H200 potražnja menja industriju

Kineske tehnološke kompanije su za 2026. naručile preko 2 miliona Nvidia H200 AI čipova, dok Nvidia prema navodima iz vesti trenutno ima oko 700.000 jedinica na lageru. Ta razlika nije “još jedna tech priča” — to je signal da je globalna trka za računarskom snagom postala novi oblik industrijske konkurentnosti.

Za proizvodne firme u Srbiji, poruka je jasna: AI više nije prvenstveno pitanje ideja i algoritama, nego infrastrukture. Ko može da obezbedi računarske resurse (GPU, servere, mrežu, podatke), taj može da razvije modele koji smanjuju škart, ubrzavaju planiranje, podižu kvalitet i štede energiju. Ko ne može — rizikuje da ostane “digitalno siromašan” baš u trenutku kada EU partneri sve češće traže tragove automatizacije, sledljivosti i prediktivnog održavanja u lancu snabdevanja.

U okviru naše serije „Kako veštačka inteligencija transformiše proizvodnju i industriju u Srbiji“, ovaj tekst prevodi globalnu vest o H200 čipovima u praktičnu temu: šta nestašica (i cena) AI hardvera znači za domaću industriju, i kako da planirate AI put bez pogrešnih ulaganja.

Šta nam H200 „kriza potražnje“ zapravo govori

Odgovor prvo: ogromna potražnja za H200 čipovima pokazuje da se AI budžeti sele iz “eksperimenata” u kapitalne investicije, a lanac snabdevanja postaje strateški rizik.

U izvornoj vesti se navodi da Nvidia kontaktira TSMC da poveća proizvodnju, uz moguć početak većeg obima u drugom kvartalu 2026. To znači dve stvari:

Lead time (vreme čekanja) za napredan hardver postaje planerska stavka, ne incident.
Ko ima bolji pristup hardveru, može brže da trenira/izvršava modele i brže “isporuči” rezultate biznisu.

U praksi, razlika između kompanija neće biti samo u tome ko je “uveo AI”, već:

ko ima stabilan pristup GPU resursima (on-prem ili cloud)
ko ima podatke spremne za učenje (kvalitet, označavanje, governance)
ko ima tim koji ume da poveže modele sa proizvodnim procesom

Drugim rečima: AI u industriji je logistika + inženjering + disciplina, ne samo software.

Zašto je H200 bitan iako postoji Blackwell (i sledeće generacije)

Odgovor prvo: čak i “prethodna generacija” GPU-a ostaje tražena jer industriji treba velika količina stabilne, proverene računarske snage odmah.

H200 je deo Hopper generacije i u vesti se pominje kao čip koji se proizvodi na TSMC 4nm procesu. Iako Nvidia gura nove linije (Blackwell, a kasnije Rubin), tržište često kupuje ono što može da dobije u količini i u roku.

Za Srbiju je ovo korisna lekcija: ne morate juriti najnovije po svaku cenu. U proizvodnji, pobeda je često u standardizaciji i pouzdanosti, ne u “najnovijem modelu”.

Kako globalna potražnja udara na industriju u Srbiji

Odgovor prvo: raste cena AI projekata, produžava se nabavka opreme i jača zavisnost od cloud provajdera — što direktno utiče na ROI u proizvodnji.

U vesti se pominje okvirna cena oko 27.000 USD po čipu za kineske kupce (uz varijacije po količini i ugovoru). Čak i bez ulaska u detalje konfiguracija, ovo jasno kaže da je “GPU budžet” za ozbiljnije AI inicijative često veći nego što menadžment očekuje.

Za domaće proizvodne firme tipične posledice su:

Pilot traje duže jer se čeka infrastruktura ili resursi u cloudu postaju skupi kada pilot pređe u stalnu upotrebu.
Timovi štede na podacima (što je greška): bez uređene baze podataka i jasne metrike, GPU samo “spali” budžet.
IT i proizvodnja se razilaze: IT gleda bezbednost i trošak, proizvodnja gleda brzinu i isporuku. Bez dogovora — projekat stoji.

Geopolitika i regulatorika: novi faktor rizika

Odgovor prvo: izvoz, dozvole i takse mogu preko noći promeniti dostupnost hardvera, pa je planiranje AI infrastrukture postalo upravljanje rizikom.

U članku se provlači regulatorna neizvesnost (odobrenja, takse, dozvole). Iako Srbija nije direktno u centru tog konflikta, indirektno trpi kroz:

manju dostupnost opreme u regionu
veće cene kod distributera
veći pritisak da se ide na cloud (gdje trošak postaje operativni i “beskonačan”)

Ako radite sa EU kupcima, dodatni sloj je i usklađenost: gde se podaci obrađuju, kakva je politika privatnosti, šta se šalje van firme.

Gde AI daje najbrži povrat u proizvodnim sistemima

Odgovor prvo: najbrži ROI u industriji obično dolazi iz tri zone — kvalitet, zastoji i planiranje — i ne traži uvek treniranje ogromnih modela.

Kad ljudi čuju “GPU nestašica”, često pomisle: “Okej, AI nam nije dostupan.” To je pogrešan zaključak. U praksi, mnogi industrijski slučajevi korišćenja mogu da rade sa:

manjim modelima
transfer učenjem
optimizovanim inferenciranjem
kombinacijom edge (kamera/PLC) i centralne analitike

1) Kontrola kvaliteta (computer vision)

Odgovor prvo: vizuelna inspekcija je često prvi AI projekat jer daje merljive rezultate: manje škarta, manje reklamacija, brže puštanje serije.

Primeri iz proizvodnje (tipično primenljivo i u Srbiji):

detekcija ogrebotina, nepravilnosti, loših varova, neujednačene boje
provera kompletnosti (da li nedostaje komponenta)
kontrola etiketa/štampe i serijskih brojeva

Šta je ključ uspeha? Dobro definisana tolerancija greške i dogovor sa kvalitetom: da li optimizujete “false reject” ili “false accept” i koliko košta jedna greška.

2) Prediktivno održavanje (zastoji koštaju više nego što piše u izveštajima)

Odgovor prvo: prediktivni modeli smanjuju neplanirane zastoje, ali samo ako imate disciplinu u podacima (vibracije, temperatura, struja, servisni zapisi).

Ovo je dobar teren za “manje” modele i statistiku, ne morate odmah LLM. Često su dovoljni:

anomalija detekcija na senzorima
modeli koji predviđaju kvar unutar 7–14 dana
pametno zakazivanje servisa (kada je linija ionako u mirovanju)

3) Planiranje proizvodnje i lanac snabdevanja

Odgovor prvo: AI ovde donosi mirniji rad: manje hitnih narudžbi, manje prekovremenih, manje zaliha koje stoje.

Tipične AI primene:

prognoza potražnje po kupcu ili SKU
optimizacija zaliha (sigurnosne zalihe po riziku dobavljača)
raspoređivanje (scheduling) uz ograničenja mašina, ljudi i alata

Za mnoge firme, ovo je “tihi” dobitak: niko ne slika model, ali CFO vidi brojke.

Kako da planirate AI infrastrukturu kad su GPU resursi skupi

Odgovor prvo: najbolji pristup je hibrid: pametan izbor use-case-a + optimizacija modela + jasna odluka šta ide u cloud, a šta ostaje u firmi.

Evo okvira koji se pokazao praktičnim u industrijskim timovima:

Korak 1: Odvojite trening od izvršavanja (inference)

Trening je GPU-intenzivan i povremen. Inference je stalna i mora biti pouzdana.

Trening: često ima smisla koristiti cloud ili iznajmljene resurse
Inference: često ima smisla držati lokalno (edge/server u fabrici) zbog latencije i troška

Korak 2: Birajte projekte koji rade i sa manjim modelima

Ako je jedini način da projekat radi taj da trenirate ogromne modele svaki mesec — projekat je verovatno pogrešno postavljen.

Dobri industrijski projekti obično imaju:

jasnu metriku uspeha (npr. -20% reklamacija)
stabilan izvor podataka
kontrolisan domen (jedna linija, jedan proizvod, jedna kamera)

Korak 3: Optimizujte modele pre kupovine hardvera

Pre nego što potpišete nabavku servera, često možete dobiti veliki deo performansi kroz:

kvantizaciju (npr. INT8/FP16 gde ima smisla)
batching i pravilno dimenzionisanje
pipeline koji izbacuje nepotrebne korake

Poenta: inženjering je jeftiniji od hardvera.

Korak 4: Ugovorite “AI kapacitet” kao resurs, ne kao igračku

Ako idete na cloud ili kolokaciju, ugovor treba da pokrije:

garantovanu dostupnost resursa (da ne čekate GPU nedeljama)
trošak po satu / po inferenciji
bezbednosne zahteve (industrijski podaci nisu demo set)

„People also ask“: pitanja koja dobijam od proizvodnih timova

Da li nam treba H200 da bismo uveli AI u proizvodnju?

Odgovor: Ne. Za većinu industrijskih slučajeva (kvalitet, anomalije, optimizacija) možete krenuti sa manjim GPU resursima ili čak bez GPU-a u prvoj fazi. H200 je relevantan kad trenirate velike modele ili imate masivne potrebe za paralelnom obradom.

Da li je bolje kupiti GPU server ili ići na cloud?

Odgovor: Ako imate 24/7 inference u fabrici i stabilan obim, server se često isplati. Ako radite povremeni trening i iteracije, cloud je fleksibilniji. Najčešće rešenje je hibrid.

Koji je prvi korak za AI projekat u fabrici u Srbiji?

Odgovor: Izaberite jednu liniju i jedan problem koji košta novac svake nedelje (škart, zastoj, reklamacije). Zatim proverite da li imate podatke (ili možete brzo da ih prikupite).

Šta da uradite u narednih 30 dana (bez velikih investicija)

Odgovor prvo: spremite teren: podatke, metrike i mali pilot — pa tek onda infrastrukturu.

Praktična lista:

Mapirajte top 3 gubitka: škart, zastoji, energija, reklamacije.
Izaberite jedan slučaj sa jasnom metrikom (npr. “smanjiti škart sa 3% na 2%”).
Proverite podatke: gde su, ko je vlasnik, koliko su čisti.
Napravite mini-pilot (2–4 nedelje) sa realnim podacima.
Tek onda odlučite: cloud, lokalni server, ili kombinacija.

Ovakav redosled štedi budžet i skraćuje put do rezultata.

Šira slika: AI čipovi su novi industrijski kapacitet

Odgovor prvo: potražnja za H200 čipovima nije samo priča o Nvidiji i Kini — to je dokaz da je računarska snaga postala resurs poput energije, mašina i alata.

Za Srbiju, koja želi da zadrži i proširi industrijsku bazu, najpametniji potez nije “kupiti najjače”. Najpametniji potez je organizovati AI kao proizvodnu sposobnost: jasno vlasništvo nad podacima, definisane metrike, tim koji spaja proizvodnju i IT, i plan infrastrukture koji je otporan na tržišne šokove.

Ako želite da AI u proizvodnji u Srbiji donese merljive rezultate u 2026, počnite od procesa i podataka — a GPU nabavku tretirajte kao posledicu dobrog plana, ne kao početak priče.

Koja je jedna tačka u vašem proizvodnom procesu gde biste, uz malo bolje podatke i automatizaciju, mogli da dobijete 10% poboljšanja već ove godine?