Skip to content

Opis udostępnianej bazy

Mateusz Żółtak edited this page Sep 28, 2015 · 2 revisions

Wstęp

Baza służy przechowywaniu możliwie kompletnych informacji o polskich egzaminach zewnętrznych, które przetwarzane są w IBE.

Wyróżnić w niej można cztery główne części (przy czym są one ze sobą ściśle powiązane):

  • Bank zadań
    Przechowuje informacje o zadaniach użytych w testach egzaminacyjnych oraz testach używanych w PAOU i EWD, w tym:
    • rodzaj zadania
    • sposób punktowania
    • treść zadania
    • parametry zadania
    • informacje o egzaminach i/lub testach, w których zadanie zostało użyte
  • Baza wyników egzaminacyjnych
    Przechowuje wyniki egzaminów oraz testów PAOU i EWD
  • Baza wyników skalowań oraz wartości wskaźników PWE i EWD
    Przechowuje estymacje PWE i EWD na poziomie uczniów używane m.in. przez strony http://pwe.ibe.edu.pl, http://gimnazjum.ewd.edu.pl i http://matura.ewd.edu.pl
  • Baza szkół
    Przechowuje informacje o danych teleadresowych szkół w poszczególnych latach

Możliwości dawane przez bazę

Baza może uprościć wykonywanie analiz poprzez:

  • Dostępność wszystkich informacji w jednym miejscu.
  • Dostępność gotowych:
    • wskaźników na poziomie szkół i/lub JST;
      • opartych na uznanej i zweryfikowanej metodologii;
      • także możliwość samodzielnego liczenia niektórych wskaźników na samodzielnie wybranym poziomie agregacji;
    • wyskalowanych wyników uczniów.
      • wyniki wyskalowane pozbawione są wielu niekorzystnych cech wyników surowych;
    • parametrów zadań (zarówno KTT jak i IRT).
  • Ustandaryzowaną formę dostępu do danych.

Przepływ danych w bazie

przepływ danych

Grupy danych

Z uwagi na różnorodność danych przechowywanych w bazie, nie ma możliwości udostępnienia ich w postaci jednego zbioru danych i zachodzi konieczność podzielenia ich na pewne grupy.

Wyróżnione grupy to:

  • wyniki: surowe wyniki egzaminów i testów zrównujących ;
  • oszacowania: oszacowania umiejętności uczniów uzyskane w wyniku skalowania IRT;
  • parametry: oszacowania parametrów IRT i KTT zadań z egzaminów i testów;
  • normy: tabele przeliczeniowe dla sumarycznych wyników punktowych;
  • skale: wykaz skal i skalowań użytych do uzyskania oszacowań umiejętności uczniów i/lub parametrów zadań; także informacje o normach ekwikwantylowych;
  • uczniowie: wykaz uczniów i tych ich cech, które nie zmianiają się w czasie (płeć, data urodzenia, id_cke);
  • uczniowieTesty: wykaz cech uczniów w momencie przystępowania do danego egzaminu lub testu (np. dysleksja czy bycie laureatem konkursu przedmiotowego);
  • szkoly: wykaz szkół (w podziale na lata);
  • testy: wykaz egzaminów i testów (data przeprowadzenia, zakres tematyczny, itp.);
  • kryteriaOceny: wykaz pytań i kryteriów oceny występujących w egzaminach i testach;
  • wskazniki: wykaz wskaźników EWD i PWE (wskaźniki dla szkół i, w wypadku PWE, jednostek samorządu terytorialnego);
  • wartosciWskaznikow: wartości wskaźników EWD i PWE.

Dane każdej z grup pobrać można odpowiednią funkcją pakietu ZPD - podsumowanie tych funkcji oraz listy zmiennych w zwracanych przez nie zbiorach danych znajduje się na stronie http://zpd.ibe.edu.pl/doku.php?id=r_gr.

Dokładne omówienie poszczególnych zmiennych dostępne jest tutaj.
(proszę zwrócić uwagę na możliwość filtrowania - pole wyszukiwania znajduje się w prawym górnym rogu tabeli)

Dane EWD (OKE) i dane PAOU/ZAOU (CKE)

Oddzielnego omówienia wymagają źródła surowych wyników egzaminacyjnych, które znajdują się w bazie.

  • Wyniki egzaminacyjne w bazie pochodzą z dwóch źródeł OKE i CKE.
  • Do pewnego czasu z obydwu źródeł pobierano dane
    • dla nieco inaczej zdefiniowanych populacji (z OKE tylko uczniowie, którzy do egzaminu podchodzili po raz pierwszy i którym OKE udało się przyłączyć wynik na poprzednim egzaminie, z CKE wszyscy uczniowie podchodzący do egzaminu)
    • w nieco innym zakresie (z OKE tylko wyniki punktowe, z CKE dystraktory dla zadań zamkniętych).
  • Przed 2010 rokiem możliwość złączania ze sobą informacji o tych samych uczniach z danych CKE i OKE była bardzo ograniczona lub zgoła niemożliwa (brak było dobrego wspólnego identyfikatora ucznia pomiędzy zbiorami z OKE i CKE).
  • Ponieważ złączanie nie było możliwe, zaistniała potrzeba przechowywania w bazie oddzielnych kopii danych z nominalnie tego samego egzaminu.
    • Kopię z danych OKE nazywamy "danymi EWD" lub "danymi OKE" (bowiem dane z OKE gromadzono na potrzeby wyliczania EWD).
    • Kopię z danych CKE nazywamy "danymi PAOU/ZAOU" (bowiem były one gromadzone przez Zespół Analiz Osiągnięć Uczniów) lub "danymi CKE".
    • Dane z CKE są na poziomie uczniów niełączliwe między latami, tzn. nie umiemy dla nich połączyć wyników np. sprawdzianu i egzaminu gimnazjalnego, jak również rozstrzygnąć, czy uczeń wielokrotnie przystępował do danego egzaminu.
    • Powyższe zastrzeżenie dotyczy oszacowań umiejętności uczniów liczonych na podstawie tych danych.
    • Patrz uwagi pod tabelą podsumowującą dane dostępne w bazie (tutaj lub na kartce przed Państwem).

Od kiedy istnieje możliwość złączania ze sobą zbiorów danych z CKE i OKE, dane złączone przechowywane są w bazie jako "dane EWD". Dane złączone obejmują:

  • wszystkie dane maturalne;
  • egzamin gimnazjalny od 2010 roku (włącznie);
  • sprawdzian od 2014 roku (włącznie).

Źródła dokumentacji

Dokumentacja bazy dostępna jest na stronie http://zpd.ibe.edu.pl, szczegółowo zaś:

  • ogólna informacja o zakresie danych - tutaj
  • ogólny opis grup danych - tutaj
  • indeks zmiennych w grupach danych - tutaj
  • opis pakietu ZPD dla R (także linki do szczegółowych opisów grup danych) - tutaj