- Nejc Ačkun
- Jernej Leskovšek
Odločila sva se, da bova kot najino zbirko podatkov uporabila evidenco vseh registriranih vozil v Sloveniji. Podatke se lahko najde tukaj: https://podatki.gov.si/dataset/evidenca-registriranih-vozil-presek-stanja.
Zbirka je sestavljena iz približno 2 milijona elementov. Mislila sva, da je zbirka že omejena na avtomobile, ampak zbirka vsebuje VSA vozila v Sloveniji, in vključuje:
- Motorna kolesa
- Delovne stroje
- Dvigala
- Traktorje
- Priklopnike itd.
Odločila sva se, da se bova omejila samo na avtomobile. Oba naju zanimajo avtomobili, in sklepava, da bova tako lahko tudi lažje potrdila dobljene rezultate oz. lažje opazila napake in posebnosti, ki bi se lahko pojavile.
Na srečo v podakovni zbirki obstaja stolpec, ki opisuje tip vozila, tako da je bila filtracija trivialna.
Po filtraciji sva naletela še na kar nekaj problemov. Obstaja več atributov, ki se navezujejo samo na določen tip vozila (recimo stolpec "Q-Razmerje moc/masa (samo za motorna kolesa)"). Te stolpce sva pobrisala pred začetkom analiz.
Drugi večji problem pa so nekonsistentnosti pri podatkih. Lep primer tega je recimo proizvajalec "Alfa Romeo". V podatkih se pojavijo kar trije različni načini zapisa (ALFA ROMEO, ALFA-ROMEO, ALFA- ROMEO). Te podatke sva seveda lahko popravila, ampak samo zato, ker točno veva pravilno obliko podatkov.
Zaplete se recimo pri stolpcu "D.3-Komerc. oznaka" kjer so podatki, kot so model, prostornina motorja in še kakšna druga lastnost ločeni z znakom "/". Tukaj pa pravilnosti, oz. večih vnosov z istim pomenom ne moreva več zaznavati in popravljati.
Osredotočila se bova na spremembe v populaciji avtomobilov skozi čas. S tem se bova tudi izognila večini glavobolov, ki jih lahko povzročijo nekonsistentonosti v podatkih, omenjene zgoraj.
Poskušala bova prikazati različne vidike sprememb (od najpopularnejših znamk, števila registriranih avtomobilov na leto, popularnost različnih vrst goriv itd.). Misliva, da bodo spremembe skozi čas dovolj očitne, da se bodo lepo prikazale na vizualizacijah.
Zanimivo bo videti tudi spremembe, ki jih je v Slovenijo prinesla, recimo, pridružitev EU. Meniva, da je populacija avtomobilov na takšne spremembe dokaj občutljiva.
Kot je napisano zgoraj, želiva doseči rezultate, ki bodo jasno poudarili spremembe skozi čas s pomočjo vizualizacije. Če bova lahko, bova ustvarila animacijo, podobno tisti, na Google-ovem portalu za podatke. Najina sicer verjetno ne bo interaktivna, ampak spremembe, in potencialne posebnosti, bodo enostavno vidne.