Podaci su nova sirova nafta, a mašinsko učenje predstavlja plamen koji je pokreće. Ko ima kontrolu nad ovim dvama resursima, taj će oblikovati budućnost sveta.
Ovo nije scena iz distopijskog filma, već naša sadašnjost.
To je surova stvarnost.
Stvaranje novog globalnog poretka zasniva se na prikupljanju obimnih količina relevantnih podataka i njihovoj analizi kako bi se dobile primenljive spoznaje. To je podvig koji ljudska civilizacija nikada ranije nije postigla. Ova tehnologija omogućava nacijama da ostvare superiornost i na kraju dominiraju svetom.
Upravo zbog toga, napredne zemlje sveta ovaj koncept shvataju veoma ozbiljno.
Atraktivan karijerni put
Ostavljajući po strani geopolitičke igre, nauka o podacima i mašinsko učenje predstavljaju nove oblasti s ogromnim potencijalom. Potražnja za stručnjacima je izuzetno velika, a broj kvalifikovanih naučnika za podatke je nedovoljan. Čak i oni sa prosečnim sposobnostima su deficitarni.
Situacija je slična kao da smo otkrili veliki broj novih, naseljenih planeta, a nemamo dovoljno ljudi da ih istražimo. Iako se možda ponavljam, mislim da sledeća infografika to bolje ilustruje:
Izvor: insidebigdata.com
Možemo zaključiti da početne plate se kreću od 50.000 dolara pa naviše, dok menadžeri mogu zaraditi i preko 250.000 dolara.
Pored toga, prosečna osoba na našoj planeti generiše približno 1,7 MB podataka svake sekunde. To je više od 3500 TB podataka tokom života. To je količina podataka s kojom se još uvek ne znamo nositi, a kamoli analizirati. Predvideti svetlu budućnost u ovom polju je možda i previše skromna procena.
Da li su nauka o podacima i mašinsko učenje komplikovani?
Odlično pitanje!
Iz mog iskustva, odgovor je istovremeno „da“ i „ne“.
Veštačka inteligencija, odnosno mašinsko učenje, izuzetno je kompleksna tema ako vas interesuje istraživanje i pomeranje granica. Za takav poduhvat, čak ni doktorat iz informatike i matematike nije dovoljan. Ipak, većina ljudi nema ni ambicije ni vremena za takvu vrstu studija.
S druge strane, tu je takozvana primenjena nauka o podacima i mašinsko učenje.
To se odnosi na upotrebu postojećih alata, tehnika i algoritama za rešavanje stvarnih problema. Ova oblast zahteva posvećenost, sposobnost razumevanja i kreativno razmišljanje, kao i poznavanje nekih osnovnih matematičkih koncepata (koji se brzo usvajaju). Kada je reč o tehničkim znanjima, ovo je daleko lakše od posla softverskog inženjera.
Drugim rečima, ovo nije lagan zadatak, ali je odnos uloženog truda i potencijalne koristi izuzetno povoljan.
Sada kada ste doneli odluku da postanete stručnjak za podatke ili inženjer mašinskog učenja, hajde da istražimo najbolje opcije za to.
Mašinsko učenje (Google)
Mnogi nisu svesni da Google nudi sveobuhvatan, izuzetno praktičan i besplatan kurs o mašinskom učenju. Kako navode iz kompanije, to je deo njihove posvećenosti unapređenju AI/ML tehnologija i deljenju znanja sa zajednicom.
Najbolja stvar u vezi s ovim kursom je da nema preduslova. Ipak, treba da budete spremni da posvetite dodatno vreme samostalnom proučavanju statističkih koncepata.
To nije obavezno, ali ukoliko nemate iskustva sa naprednom statistikom, objašnjenja koja se daju na kursu možda neće biti dovoljna. Dodatna napomena je da ovaj kurs koristi TensorFlow, ML implementaciju koju je razvio Google, za uvođenje u mašinsko učenje. Na neki način, Google promoviše svoje API-je za mašinsko učenje, ali imajući u vidu vrednost koju ovaj kurs pruža, to ne bi trebalo da bude prepreka.
Uostalom, TensorFlow je jedan od jednostavnijih načina da se započne sa učenjem mašinskog učenja, i veoma je popularan (za poređenje AI okvira pogledajte ovde).
Data Science
Ime Harvarda izaziva strahopoštovanje, kao i ovaj kurs.
Pre svega, treba naglasiti da ovo nije brzi kurs gde se površno upoznajete sa mašinskim učenjem pišući nekoliko linija koda. Ovaj kurs zahteva naporan rad i značajno ulaganje vremena.
Kurs uključuje besplatne video snimke, kod (koji se nalazi na GitHub-u) i rešenja za laboratorijske vežbe, tako da ništa vas ne može sprečiti da ga pohađate.
Kome je kurs namenjen?
Pa, vama…naravno, ne šalim se!
Rekao bih da je idealan za profesionalce s pristojnim matematičkim obrazovanjem, čak i ako se više ne bave matematikom (navike zaključivanja i dokazivanja su najvažnije). Ipak, upozoravam vas da će ovaj kurs biti težak, a problemi na vežbama bi vas mogli dovesti do suza. Ali, to bi možda baš moglo biti ono što vam treba!
Mašinsko učenje
Uđite u prostoriju punu stručnjaka za podatke i pitajte ko je Endrju Ng. Dobili biste žestok odgovor.
U svetu nauke o podacima i mašinskog učenja, Endrju Ng ima status božanstva, zahvaljujući svom izvanrednom kursu na Courseri: Mašinsko učenje.
Ako sumnjate u Endrjua Nga, pogledajte sledeće:
Ovo je plaćen kurs, jer je deo Coursera programa, ali finansijska posvećenost nije jedini uslov. Kurs je dugačak jer Endrju duboko zalazi u matematičke osnove mašinskog učenja i secira popularne algoritme. Srećom, ovo je kompletan kurs i bićete vođeni korak po korak kroz sve složenosti.
Toplo preporučujem ovaj kurs, jer se hvaljenje sertifikatom o njegovom završetku smatra stvarom prestiža.
Primenjena nauka o podacima
Specijalizacije na Courseri se sastoje od niza kurseva koji imaju za cilj da vas provedu kroz učenje određenog koncepta od početka do kraja. Ako tražite kompletan, ozbiljan, ali jednostavan kurs o nauci o podacima i mašinskom učenju uz upotrebu Pythona, preporučujem ovu specijalizaciju.
Po završetku kursa dobijate sertifikat.
DataCamp
DataCamp nudi obiman izbor kurseva iz oblasti nauke o podacima, uključujući i kurseve za sticanje određenih veština i razvoj karijere. Od manipulacije podacima do mašinskog učenja, steći ćete veštine koje su vam potrebne za karijeru naučnika podataka u Python-u i R-u.
Uz DataCamp-ov sadržaj veličine zalogaja, možete učiti sopstvenim tempom. Ovi kursevi pružaju vam praktično iskustvo koje će vam pomoći da unapredite svoje veštine u nauci o podacima.
Možete započeti sa besplatnom verzijom i proceniti kurs tako što ćete prvo pogledati prvo poglavlje.
edX
Učite od MITx-a, Harvardx-a, IBM-a, RICEx-a, UCSanDiegox-a i GTx-a na edX platformi.
Sve ove ustanove nude sveobuhvatan nastavni plan i program koji vam pomaže da ovladate veštinama potrebnim naučniku za podatke. Ovi programi su najprikladniji za one koji imaju iskustva u statistici ili informatici.
Ukoliko ne tražite ceo program, možete birati kurseve po želji. Na edX-u ćete naći više od 200 kurseva vezanih za nauku o podacima, koji uključuju Python, R, Excel, verovatnoću, statistiku, mašinsko učenje, vizuelizaciju podataka i još mnogo toga.
Codecademy
Codecademy je još jedna platforma koja vam nudi odličan način da naučite programiranje. Veruju u „učenje kroz rad“ i imaju veliki broj praktičnih projekata i testova na svojoj platformi.
Kurs nauke o podacima koji nudi Codecademy uključuje SQL, Python 3, NumPy, Pandas, Matplotlib, Scikit-learn i mnoge druge biblioteke.
Ceo karijerni put sadrži 26 kurseva, što je više nego dovoljno da vam pomogne da postanete uspešan stručnjak za podatke.
Ovaj kurs podataka:
- Pruža vam duboko znanje o nauci o podacima
- Nudi putokaz koji je lako pratiti
- Omogućava vam da steknete dosta praktičnog iskustva
Udemy
Udemy ne treba posebno predstavljati.
Python for Data Science and Machine Learning Bootcamp na Udemy-ju je jedan od najpopularnijih kurseva sa preko 85.000+ ocena 4.6, a pohađalo ga je više od 370.000 studenata širom sveta.
Slede teme koje se obrađuju u ovom kursu:
Ispod su karakteristike ovog kursa:
- 25 sati video sadržaja na zahtev
- Potpuni doživotni pristup
- 13 članaka i pet resursa za preuzimanje
- Pristup putem mobilnog telefona i TV-a
- Sertifikat o završenom kursu
- 30-dnevna garancija povrata novca
Ako vam je budžet ograničen, ovo bi mogao biti idealan kurs za početak.
Google AI
Da li biste bili zainteresovani da učite o mašinskom učenju od stručnjaka iz Google-a?
U tom slučaju morate pogledati kurseve na Google AI.
Ova platforma nudi kurseve i materijale za mašinsko učenje i nauku o podacima za studente, softverske inženjere, naučnike podataka, pa čak i istraživače. Ovi kursevi su besplatni.
Za početak, Crash Course on Machine Learning na Google AI bi trebalo da bude vaša polazna tačka. To je brzi kurs sa praktičnim uvodom koji koristi TensorFlow API-je. Ispod su detalji ovog kursa:
Ova platforma takođe nudi posebne kurseve o važnim temama iz oblasti mašinskog učenja, kao što su klasterizacija, sistemi preporuka, testiranje i pronalaženje grešaka u mašinskom učenju, priprema podataka i inženjering svojstava u mašinskom učenju. Ako već poznajete osnove mašinskog učenja, ovi kursevi će vam biti od dodatne vrednosti.
Udacity
Udacity je takođe popularna platforma za e-učenje koja nudi veliki broj kurseva o aktuelnim tehnologijama. Nudi neke od vodećih programa u industriji, koje su kreirale i akreditovale vodeće svetske kompanije, kao što su AT&T, AWS, Google i IBM.
Jedan od programa na Udacity-ju je vezan za nauku o podacima – Škola nauke o podacima. Ovaj program vam pomaže da se kvalifikujete za poslove analitičara podataka, naučnika podataka, inženjera podataka i poslovnog analitičara. Kurs „Data Scientist“ je ključni kurs koji pokriva koncepte mašinskog učenja, dubokog učenja i softverskog inženjeringa. Potrebno je osnovno znanje o mašinskom učenju da biste se prijavili na ovaj kurs.
Ako znate Python programiranje, ali ste novi u mašinskom učenju, postoji još jedan program na Udacity-ju – Škola veštačke inteligencije. Ovaj program nudi kurseve koji kreću od osnova mašinskog učenja.
Duboko učenje
Ovaj kurs je dragulj i moja omiljena preporuka na ovoj listi, ako ste programer.
Još jednom bih to ponovio: ako ste programer.
Razlog za to je što ovaj kurs ne troši vreme na podučavanje osnova programiranja. Opis kursa to jasno naglašava:
Pretpostavljamo da svi koji pohađaju ovaj kurs imaju barem godinu dana iskustva u programiranju. Kurs koristi Python kao nastavni jezik. Ako ga ne poznajete, pretpostavljamo da ćete ga savladati. Za iskusnog programera, Python bi trebalo da bude prilično jednostavan jezik za učenje.
Ako već znate Python (ili ga možete brzo naučiti ovde), ovo je savršen kurs za pragmatičare koji žele da izgrade stvarne, upotrebljive sisteme, bez previše brige o teorijskim osnovama algoritama.
Mogao bih čak reći da je idealan za one koji su nestrpljivi (kao ja!) i ne vole formalnosti i monotoniju.
Da li sam spomenuo da je 100% besplatan i da ima sjajnu zajednicu?!
Zaključak
Uf!
Ovo je bila komplikovana lista za sastavljanje. Ne zato što nije bilo dovoljno dobrih izvora, već zbog toga što ih ima previše!
Mašinsko učenje je oblast koja se munjevito razvija i rešava teške probleme na vrlo elegantan način. Postoje stotine kurseva na mreži, besplatnih i plaćenih, i većina njih su zaista dobri. To takođe može biti izvor konfuzije, zato sam pokušao da smanjim izbor na jedanaest kurseva, koji su namenjeni različitim tipovima studenata u zavisnosti od njihovog nivoa iskustva.
Nadam se da je pomoglo!