Ubistva i kretanje izbeglica na Kosovu
od marta do juna 1999.
Izveštaj Međunarodnom krivičnom sudu za bivšu Jugoslaviju

3. januar 2002.

Patrick Ball, Wendy Betts, Fritz Sheuren, Jana Dudukovich i Jana Asher

 

 

AMERIČKO UDRUŽENJE ZA NAUČNI NAPREDAK
Američka advokatska komora
Srednjoevropska i istočnoevropska pravna inicijativa

Ovde sadržani materijali pretstavljaju mišljenja autora i urednika i ne mogu se smatrati stavom Programa za nauku i ljudska prava Američkog udruženja za naučni napredak (American Association for the Advancement in Science – AAAS) ili Srednjoevropske i istočnoevropske pravne inicijative Američke advokatske komore (American Bar Association Central and East European Law Initiative – ABA/CEELI) ili neke od organizacija učesnica. AAAS-ov Komitet za naučnu slobodu i odgovornost (Committee on Scientific Freedom and Responsibility – CSFR), u skladu sa svojim mandatom i politikom Udruženja, podržava izdavanje ovog izveštaja kao naučnog doprinosa ljudskim pravima. Interpretacije i zaključci pripadaju autorima i ne pretstavljaju stanovišta Odbora AAAS-a, Veća, CSFR-a ili članova Udruženja. Isto tako, ovde izneta stanovišta nisu odobrili Poslanički dom ili Odbor guvernera ABA-e, pa se stoga ne može smatrati da pretstavljaju politiku ABA-e.

Ništa sadržano u ovoj publikaciji ne treba smatrati pravnim savetom za konkretne slučajeve, te su čitaoci odgovorni za dobijanje takvih saveta od sopstvenih pravnih savetnika. Ova publikacija, kao i sve ovde sadržane formulacije i stavovi namenjeni su isključivo za obrazovne i informativne svrhe.

Autorsko pravo 2002
Američko udruženje za naučni napredak
1200 New York Avenue, NW
Washington, DC 20005

Kontakt:
AAAS-ov Program za nauku i ljudska prava
1200 New York Avenue, NW
Washington, DC 20005

Telefon: 202 326 6600
Telefaks: 202 289 4950
E-pošta: shrp@aaas.org
URL: http://shr.aaas.org

Sažetak

Ubistva i kretanje izbeglica na Kosovu od marta do juna 1999: analiza i zaključci 2

1. Svrha izveštaja. 2

1.1. Hipoteze. 2

1.2. Podaci i analiza. 2

1.3. Glavni nalazi 3

2. Identifikovanje obrasca. 3

3. Statistička analiza kretanja izbeglica. 4

4. Statistička analiza ubistava. 5

4.1. Procena ukupnog broja ubistava. 5

4.2. Obrasci ubistava tokom vremena. 7

4.3. Kretanje izbeglica i ubistava prema geografskoj lokaciji 7

5. Ispitivanje predloženih hipoteza. 8

5.1. Aktivnost Oslobodilačke vojske Kosova. 10

5.2. Vazdušni udari NATO-a. 11

5.3. Dejstvo aktivnosti OVK i vazdušnih udara NATO-a. 11

5.4. Jugoslovenske snage. 12

6. Sažetak zaključaka. 13

Dodatak 1: Podaci i sravnjivanje. 14

1. Uvod. 14

2. Izvori podataka. 14

2.1. Srednjoevropska i istočnoevropska pravna inicijativa Američke advokatske komore (ABA/CEELI) 15

2.2. Ekshumacije (EXH) 16

2.3. Human Rights Watch (HRW) 17

2.4. Organizacija za evropsku bezbednost i saradnju (OEBS) 18

3. Početno uređivanje podataka. 18

3.1. Geografsko kodiranje. 18

3.2. Uređivanje podataka o imenu i polu. 19

3.3. Formatiranje datuma smrti 20

4. Početno sravnjivanje podataka. 20

4.1. Promenljive veličine korišćene za intrasistemsko sravnjivanje pojedinačnih zapisa. 21

4.2. Osnovni pristup intrasistemskom sravnjivanju pojedinačnih zapisa. 21

4.3. Intersistemsko sravnjivanje pojedinačnih zapisa. 23

4.4. Intra- i intersistemska obrada anonimnih grupnih zapisa. 24

4.5. Objedinjavanje podataka o anonimnim grupnim ubistvima između sistema. 25

5. Pročišćavanje postupka uređivanja i sravnjivanja. 25

5.1. Nedoslednosti u sravnjivanju. 26

5.2. Izbor "najboljih" datuma. 26

5.3. Podaci o ekshumaciji 27

5.4. Ostala uređivanja konačno utvrđenih podudarnosti 27

6. Konačni sažetak rezultata podataka. 28

6.1. Obrada podataka prema izvoru za pojedinačne zapise. 28

6.2. Obrada podataka među izvorima za imenovane, pojedinačne zapise. 28

6.3. Procena potpunosti pojedinačnih podataka. 29

Dodatak 2: Statistička metodologija i analiza. 31

1. Uvod. 31

1.1. Ograničenja direktnih opažanja. 31

2. Metodološka pozadina. 33

2.1. Procena dvojnih sistema. 33

2.2. Procena trojnih sistema. 34

2.3. Procena višestrukih sistema. 37

2.4. Izbor modela. 38

3. Metodologija. 38

3.1. Analiza eksploratornih podataka. 39

3.2. Prilagođavanje i izbor modela za ukupan broj ubistava. 41

3.3. Agregacija unakrsnih klasifikacionih tabela za objašnjenje oskudnosti 41

3.4. Globalno prilagođavanje modela među svim vremensko-prostornim tačkama. 44

3.5. Modeliranje po delovima među vremenskim i prostornim tačkama. 45

3.6. Projekcija dvodnevne serije vremenskih tačaka na šestodnevnu seriju vremenskih tačaka za svaki region 46

3.7. Poređenje rezultata globalnog i pojedinačnog modeliranja. 47

3.8. Analiza odnosa između originalnih lista, složenosti modela izabranih pomoću pravila selekcije, te vremena i prostora 48

4. Analiza odnosa između rezultata modeliranja procene višestrukih sistema i aktivnosti OVK/NATO-a  52

5. Diskusija. 55

5.1. Analiza osetljivosti izveštaja o datumu smrti 55

5.2. Sažetak zaključaka modeliranja. 57

Dodatak 3: Dodatni izvori za aktivnosti OVK i NATO-a. 58

Bibliografija. 60

Izjave zahvalnosti 63

Autori i urednici 64

Odbor za stručnu recenziju. 65

Autorske organizacije. 66

Beleška o autorima. 67

Sažetak

U ovoj studiji pretstavljeni su rezultati analize statističkih obrazaca kretanja izbeglica i ubistava na Kosovu u periodu od marta do juna 1999. Podaci su dobijeni iz evidencije albanske pogranične policije u kojima su registrovana lica koja su ulazila u Albaniju preko sela Morina /Morinë/; razgovora koje su obavili Srednjoevropska i istočnoevropska pravna inicijativa Američke advokatske komore (ABA/CEELI) i njeni partneri; razgovora koje je obavio Human Rights Watch (HRW); razgovora koje je obavila Organizacija za evropsku bezbednost i saradnju (OEBS); te izveštaja o ekhumacijama koje su sproveli međunarodni timovi u ime Međunarodnog krivičnog suda za bivšu Jugoslaviju (MKSJ). Ove analize se odnose na ukupni procenjeni broj ubistava i ukupni broj izbeglica koje su napustile svoje domove prema vremenu i mestu.

 Zaključak ovog izveštaja je da su se ubistva i kretanje izbeglica odvijali po pravilnom obrascu koji karakterišu tri faze. U svakoj fazi, nakon velikog broja ubistava i izbeglica usledio bi znatno manji broj ubistava i izbeglica. Ovi nalazi su potom korišćeni za procenu tri moguća objašnjenja za taj obrazac.

 

  • Aktivnosti Oslobodilačke vojske Kosova (OVK) motivisale su stanovnike Kosova da napuste svoje domove.

 

  • Vazdušni napadi od strane Organizacije severnoatlantskog pakta (Northern Atlantic Treaty Organization – NATO) stvorili su lokalne uslove usled kojih su stanovnici Kosova bivali ubijani i zbog kojih su napuštali svoje domove.

 

  • Sistematska kampanja jugoslovenskih snaga proterala je stanovnike Kosova iz njihovih domova.

 

U ovoj studiji zaključeno je sledeće:

 

  • Obrasci, kako kretanja izbeglica tako i ubistava, pokazuju karakteristike koje ukazuju na postojanje spoljašnjeg uzroka.

 

  • Kretanje izbeglica i ubistva događali su se na istim mestima u isto vreme, što implicira da su obe pojave imale zajednički uzrok.

 

  • Dve od hipoteza predloženih da bi se objasnili obrasci ubistava i migracije, aktivnosti OVK i NATO-a, ne odgovaraju uočenim obrascima kretanja izbeglica i ubistava.

 

  • Statistički dokazi potvrđuju hipotezu da su jugoslovenske snage sprovodile sistematsku kampanju ubijanja i proterivanja.

 


Ubistva i kretanje izbeglica na Kosovu od marta do juna 1999: analiza i zaključci

 

1.             Svrha izveštaja

U ovoj studiji pretstavljeni su rezultati analize statističkih obrazaca kretanja izbeglica i ubistava na Kosovu u periodu od marta do juna 1999. Ova analiza podataka opisuje procenjeni ukupni broj ubijenih, te ukupni broj izbeglica koje su napustile svoje domove prema vremenu i mestu. Cilj analize je da se uporede tri hipoteze o mogućim uzrocima ubistava i kretanja izbeglica da bi se utvrdilo koje hipoteze analiza pobija, a koje potvrđuje.

1.1.       Hipoteze

U studiji se prvo ispituje da li je postojala pravilna struktura ubijanja i kretanja izbeglica. Stoga je naša prva hipoteza

 

  • Hipoteza 1: Ubistva i kretanje izbeglica odvijali su se prema jasnim obrascima koji ukazuju na postojanje zajedničkog uzroka obe ove pojave.

 

Ako analiza podataka podržava Hipotezu 1, postoje tri moguća objašnjenja za obrazac.

 

  • Hipoteza 2.1: Aktivnosti Oslobodilačke vojske Kosova (OVK) motivisale su stanovnike Kosova da napuste svoje domove, bilo direktno, jer je OVK naredila ljudima da odu, bilo indirektno, jer su stanovnici Kosova pobegli od borbi između OVK i jugoslovenskih snaga.

 

  • Hipoteza 2.2: Vazdušni udari Organizacije severnoatlantskog pakta (NATO) stvorili su lokalne uslove koji su doveli do toga da stanovnike Kosova ubijaju i da oni napuste svoje domove. Upliv NATO-a je mogao da bude direktan, pri čemu su neki ljudi poginuli od vazdušnih udara, a drugi pobegli ili, pak, indirektan, pri čemu su lokalne jugoslovenske vlasti odgovorile na vazdušne udare ubijajući stanovnike Kosova i proterujući ih iz njihovih domova.

 

  • Hipoteza 2.3: Sistematska kampanja jugoslovenskih snaga isterala je stanovnike Kosova iz njihovih domova. Ubistva su korišćena bilo zato da se ljudi podstaknu na odlazak ili su bila rezultat kampanje.

 

Iako mogu postojati i druga objašnjenja za pravilne obrasce ubijanja i kretanja izbeglica, smatram da su ova tri najverovatnija. Hipoteze su jasno razdvojene. Iako se nužno međusobno ne isključuju, svaka od hipoteza u odeljcima 2.1-2.3 implicira drukčiju odgovornost. Statističkom analizom nije moguće dokazati da je ijedna od ovih hipoteza definitivan uzrok obrazaca vidljivih u dva oblika nasilja. Međutim, kao što će se videti, moguće je pronaći podatke koji pobijaju neke hipoteze, a podupiru druge hipoteze.

1.2.       Podaci i analiza

Podaci za ovaj projekat došli su iz nekoliko izvora.

 

  • Kretanje izbeglica: za analizu kretanja izbeglica korišćena je evidencija albanske pogranične policije gde su registrovana lica koja su ulazila u Albaniju preko sela Morina. Dodatni izvori korišćeni su da bi se statistički obrasci za ljude koji su ulazili u Albaniju transformisali u analizu njihovog napuštanja domova i odlaska u izbeglištvo.[1]

 

  • Ubistva: podaci o ubistvima dobijeni su iz četiri izvora: razgovora koje su obavili Srednjoevropska i istočnoevropska pravna inicijativa Američke advokatske komore (ABA/CEELI) i njeni partneri; razgovora koje je obavio Human Rights Watch (HRW); razgovora koje je obavila Organizacija za evropsku bezbednost i saradnju (OEBS); te izveštaja o ekhumacijama koje su sproveli međunarodni timovi u ime Međunarodnog krivičnog suda za bivšu Jugoslaviju (MKSJ).

 

Statistička analiza ubistava objedinjuje informacije iz više od 15.000 razgovora i izveštaja o ekshumaciji.[2] Analiza uključuje statističku procenu ubistava o kojima nije obavešćen nijedan od četiri izvora.[3]

1.3.       Glavni nalazi

Ovim izveštajem utvrđeno je slede}e:

 

  • Ubistva i kretanje izbeglica odvijali su se po pravilnom obrascu koji karakterišu tri faze. U svakoj fazi, posle velikog broja ubistava i izbeglica sledilo je znatno smanjenje broja ubistava i izbeglica. Ubistva i kretanje izbeglica po pravilu su se dešavali u isto vreme i na istim mestima. Zaključujemo da je ovaj obrazac u skladu sa Hipotezom 1;

 

  • Procenjuje se da je ubijeno 10.356 kosovskih Albanaca[4];

 

  • Opaženi i procenjeni obrasci ne odgovaraju Hipotezama 2.1 i 2.2, odnosno aktivnostima OVK i vazdušnim udarima NATO-a. Obrasci se podudaraju sa Hipotezom 2.3, odnosno aktivnostima jugoslovenskih snaga.

 

Svaki od ovih nalaza objašnjen je u narednim poglavljima. 

2.             Identifikovanje obrasca

Struktura obrazaca kretanja izbeglica i ubistava tokom vremenskog perioda o kome se ovde radi pretstavlja ključnu komponentu za nalaze ove studije. U ovom kontekstu, obrazac znači niz jasno određenih kretanja sa tendencijom rasta ili pada broja izbeglica i ubijenih, za koja je jasno da nisu slučajna,. Dva ili više obrazaca smatraju se sličnim ako pokazuju iste visoke i niske tačke u istim (ili skoro istim) vremenskim periodima.

 Statistički je neuverljiva pretpostavka da su obrasci na kakve ukazuju ovi nalazi rezultat ad hoc odlučivanja ili nasumičnih spoljnih uzroka. Povezane, gotovo istovremene varijacije društvenih pojava koje su merene (ubistava i kretanja izbeglica) prema vremenu i mestu izrazito ukazuju na postojanje zajedničkog, sistematskog uzroka čiji su rezultat ovi obrasci.

 Identifikovanje obrasca samo po sebi niti potvrđuje niti pobija Hipoteze 2.1, 2.2. ili 2.3. Međutim, ono ne ide u prilog tvrdnji da su ubistva i kretanje izbeglica bili slučajni. To znači da postojanje obrasca izrazito ukazuje na to da je postojao zajednički uzrok, te da se ubistva i kretanje izbeglica nisu odvijali nezavisno.

3.             Statistička analiza kretanja izbeglica

U ovom odeljku opisuje se odlazak etničkih Albanaca sa Kosova od kraja marta do maja 1999.[5] Približno 95% izbeglih kosovskih Albanaca ušlo je u Albaniju između 24. marta i 11. maja (Ball 2000, str. 5). Analiza kretanja ovih izbeglica tokom ovog perioda pokazuje obrazac naglih uspona nakon kojih bi usledili nagli padovi.

 Jedna ranija analiza odlaska izbeglica iz njihovih domova pokazala je da su od kraja marta do kraja maja 1999. etnički Albanci napuštali svoje domove na Kosovu tokom tri odvojena perioda ili faze (vidi sliku 1). Te faze su bile slede}e: od 24. marta do 6. aprila; od 7. aprila do 23. aprila; i od 24. aprila do 11. maja.[6]

Bitna karakteristika ove fazne strukture jeste prisutsvo niskih urednosti u broju izbeglica koje su napuštale svoje domove od 6. do 8. aprila i od 23. do 25. aprila, odnosno datumi prelaska iz jedne faze u drugu.[7] Te niske tačke su značajne jer ne traju duže vreme, a prethode im i slede ih izraziti skokovi. Drugim rečima, tokom ova dva prelazna intervala, pojava napuštanja domova gotovo nestaje, za razliku od visokih brojki koje su opažene za vreme dotičnih faza.

 

Slika 1: Procenjeno ukupno kretanje izbeglica tokom vremena

 

Faza 1

Faza 2

Faza 3

52 043

 

 

 

ljudi koji su napustili domove

 

 

 

16 158

 

 

 

0

24. mart 6. april  24. april 11. maj

 

Kao što pokazuje Slika 1, tokom prelaznog intervala između dve faze, od 6. do 8. aprila, broj izbeglica pada na približno 6.000, u odnosu na svoju najvišu vrednost iz prve faze kada je iznosio nešto preko 52.000.  Tokom prelaznog intervala između faza, od 23. do 25. aprila, broj izbeglica pada na približno 1.000, dok je na vrhuncu druge faze iznosio više od 16.000. U trećoj fazi javljaju se dve najve}e vrednosti od približno 8.000 i 6.000 početkom maja, koje pretstavljaju poslednje talase izbeglica. Kretanje izbeglica opada na manje od 100 ljudi po dvodnevnom intervalu nakon 11. maja.

 Ova ekstremna fluktuacija između visokih i niskih vrednosti čini obrazac kretanja izbeglica. Migracija koja je rezultat disperzivnih, decentralizovanih uzroka ne bi pokazivala jasne razlike između momenata kretanja visokog i niskog intenziteta. Da je pojava napuštanja domova bila nesistematična, distribucija brojeva u tom vremenskom periodu bila bi ujednačenija, uz eventualne manje skokove. Ekstremni, jasno definisani skokovi koji su opaženi u ovoj analizi ne mogu se desiti slučajno. Masovni egzodus kosovskih Albanaca ovih razmera i sa ovakvim obrascem mogao je biti podstaknut jedino zajedničkim uzrokom.

4.             Statistička analiza ubistava

U ovom odeljku se opisuje broj i obrazac ubistava koja su se desila na Kosovu od kraja marta do sredine juna 1999. Analiza podataka o ubistvima pokazuje da je, prema procenama, ubijeno 10.356 civila kosovskih Albanaca, te da su obrasci ubijanja slični obrascima kretanja izbeglica. Kao i kod kretanja izbeglica, zaključujemo da statistički obrasci ubistava ukazuju na postojanje zajedničkog uzroka.

4.1.       Procena ukupnog broja ubistava

Pre nego što razmotrimo gde i kada su se desila ubistva, potrebno je najpre proceniti ukupan broj ubistava koja su se desila tokom ovog vremenskog perioda. Nekoliko koraka preduzeto je kako bi se izvršila ova procena. Kao prvo, ukupan broj pojedinačnih žrtava, sa dokumentovanim imenima, uvršten je u tabele. Popisane su sve žrtve koje su u jednom ili više izvora podataka identifikovane imenom; upoređene su deskriptivne informacije o žrtvama kako bi se uklonili duplikati, a ukupan broj pojedinaca se poklapao.[8] Od oko 10.000 `rtava evidentiranih poimence, ovim postupkom identifikovano je 4.400 pojedinaca. Broj od 4.400 nije procena, nego stvaran broj individualno prijavljenih žrtava.

 

Slika 2. Procena ukupne migracije izbeglica i ubistava tokom vremena

 

Faza 1

Faza 2

Faza 3

 

 

 

 

 

52 043

 

 

 

 

ljudi koji su napustili domove

 

 

 

 

 

1316

 

 

 

0

ubijenih

 

 

 

 

 

 

 

 

 

0

24. mart 6. april  24. april 11. maj 22. jun

 

Drugo, budući da žrtve navedene u izvorima podataka nisu bile jedine žrtve ubistava, bilo je potrebno proceniti broj nedokumentovanih žrtava kako bi se izvršila opšta procena ukupnog broja poginulih. Ovaj broj, 10.356, dobijen je pomoću mnogo korišćene demografske statističke tehnike poznate pod imenom "procena višestrukih sistema", koja se oslanja na uzorke populacije.[9] Budući da je opšta procena od 10.356 poginulih dobijena iz uzoraka – a ne iz (nepoznate) savršene liste poginulih – potrebno je izračunati marginu greške. Naša procena je da taj interval iznosi od 9.002 do 12.122. Valja primetiti da su procena i margina greške u skladu sa procenama žrtava ubijanja na Kosovu iz ranijih radova ABA-e i AAAS-a, kao i sa procenama koje se navode u drugim, nezavisnim studijama.[10]

 

 

Slika 3: Regioni Kosova

 

Sever

 

Leposavić /Leposaviq/

Zvečan

Kosovska Mitrovica /Mitrovicë/

Zubin Potok

Vučitrn /Vushtrri/

Srbica /Skenderaj/

Obilić /Obiliq/

Glogovac /Gllogoc/

 

Zapad

 

Istok /Istog/

Peć /Pejë/

Klina /Kline/

Dečani /Decar/

Orahovac /Rahovec/

Đakovica /Gjakovë/

 

Jug

 

Suva Reka /Suharekë/

Prizren /Përzeren/

[trpce /Shterpce/

Gora /Dragashi/

 

Istok

 

Kosovo Polje /Fushë Kosovë/

Priština /Prishtinë/

Kosovska Kamenica /Kamenica/

Novo Brdo /Novobërdë/

Lipljan /Lipjan/

Gnjilane /Gjilan/

Štimlje /Shtirme/

Uroševac /Ferizaj/

Vitina /Viti/

Kačanik /Kaçanik/

 

4.2.       Obrasci ubistava tokom vremena

Kada se razmotri procenjeni broj žrtava tokom vremena, koristeći iste dvodnevne intervale koji su upotrebljeni za podatke o izbeglicama, opaženi obrazac ubistava veoma liči na obrazac kretanja izbeglica. Analiza je pretstavljena na Slici 2.

 Podaci pokazuju vrhunac u broju ubistava krajem marta, a drugi vrhunac sredinom aprila. Najvažnije je primetiti da, kao i kod podataka o kretanju izbeglica, pojava ubistava opada gotovo na nulu u periodu od 6. do 7. aprila i ponovo od 22. do 24. aprila. Prema tome, ne samo da broj ubijenih pokazuje iste ekstremne kontraste između visokih i niskih vrednosti kao što je slučaj sa kretanjem izbeglica, nego se te visoke i niske vrednosti javljaju gotovo u isto vreme kao i kod kretanja izbeglica. Ovi skokovi ne bi se javili slučajno, pa stoga zaključujemo da su posledica zajedničkog uzroka.

4.3.       Kretanje izbeglica i ubistava prema geografskoj lokaciji

Uz ispitivanje vremena kada su se dešavala kretanja izbeglica i ubistva, važno je razmotriti gde se to događalo. Analiza mesta odakle je poteklo kretanje izbeglica i gde su se dogodila ubistva pokazuje široko rasprostranjen obrazac koji odgovara nasilju koje je povezano sa raseljavanjem.

Kad se broj ljudi koji su napustili svoje domove i broj ubijenih analizira na regionalnom nivou, mogu da se identifikuju ekstremni kontrasti između visokih i niskih vrednosti koji slede fazni obrazac sličan onome koji je opisan gore, u opštoj analizi (vidi Slike 4-7). Relativni obrasci prema vremenu i prostoru su slični. U svim regionima, datumi od 6. do 7. i od 22. do 24. aprila označavaju niske vrednosti u kretanju izbeglica i u broju ubijenih ljudi.

U jednoj ranijoj analizi kretanja izbeglica opaženo je da je više od tri četvrtine izbeglica koje su prešle u Albaniju tokom Faze 1 poteklo iz južnih i zapadnih delova Kosova, dok je za vreme Faze 2, više od tri četvrtine izbeglica poteklo iz severnih i istočnih delova Kosova (Ball 2000). Slike 4-7 pokazuju da ubistva slede sličan obrazac. Ubistva u zapadnim i južnim delovima desila su se prvenstveno za vreme Faze 1; za vreme docnijih faza, bilo je relativno manje ubistava u ta dva regiona. U severnim i istočnim regionima, ubistava je takođe bilo za vreme Faze 1. Međutim, u ovim regionima, za razliku of južnih i zapadnih regiona, takođe je ubijan značajan broj lica za vreme Faze 2.[11]

 Kao što pokazuju ovi grafikoni, ne samo da obrasci kretanja izbeglica i ubistava pokazuju slične karakteristike tokom vremena, nego su obrasci slični i za različite regione. Iako, kada se gleda izolovano, lokalna kretanja izbeglica i ubistva mogu izgledati kao lokalna reakcija na lokalni uzrok, gledano sa zbirnog aspekta, statistička analiza otkriva obrazac koji podrazumeva zajednički uzrok. Drugim rečima, ubistva i egzodus izbeglica dešavali su se na istim mestima i otprilike u isto vreme. Analiza pokazuje da su se ovi događaji odvijali prema sličnim obrascima u svakom od četiri regiona. Analiza ne dokazuje šta je bio uzrok bilo kojeg od obrazaca, niti da je jedan obrazac izazvao drugog. Međutim, analiza pokazuje da su činovi nasilja – ubistva – bili vremenski i prostorno povezani sa odlascima izbeglica iz njihovih domova.

5.             Ispitivanje predloženih hipoteza

Kao što je gore navedeno, statistike ne dokazuju da je neki konkretan proces prouzrokovao obrasce kretanja izbeglica ili masovnog ubijanja. Ipak, analiza može pokazati da li su hipoteze u skladu sa statističkim dokazima ili ih ovi pobijaju. Navedene su tri hipoteze o uzrocima obrazaca kretanja izbeglica i ubistava. Ove tri hipoteze su aktivnost OVK, vazdušni udari NATO-a i sistematska kampanja koju su sprovodile jugoslovenske snage.

 Moguće je upotrebiti statističke metode da bi se ispitao odnos između aktivnosti OVK i vazdušnih udara NATO-a i gore opisanih obrazaca. Ako se aktivnost OVK ili vazdušni udari doga|aju neposredno pre ili za vreme perioda intenzivnog ubijanja i migracije, ovi događaji mogu pretstavljati verovatan uzrok rastućeg i opadajućeg obrasca. Međutim, ako vazdušni udari i aktivnost OVK ne prethode vrhuncu ubistava ili kretanja izbeglica, tada uzročno-posledični odnos valja dovesti u pitanje ili odbaciti. Analiza aktivnosti OVK i vazdušnih udara NATO-a prema vremenu i mestu pokazuje da se nijedna od njih nije desila u vreme i na mestima gde bi bili primarni uzork kretanja izbeglica i ubistava.

 

Slika 4: Procena ukupne migracije izbeglica i ubistava tokom vremena, severni region

 

Faza 1

Faza 2

Faza 3

 

 

 

 

 

7958

 

 

 

 

ljudi koji su napustili domove

 

 

 

 

 

526

 

 

 

0

Ubijenih

 

 

 

 

 

 

 

 

 

0

24. mart 6. april  24. april 11. maj 22. jun

 

Slika 5: Procena ukupne migracije izbeglica i ubistava tokom vremena, južni region

 

Faza 1

Faza 2

Faza 3

 

 

 

 

 

24 103

 

 

 

 

ljudi koji su napustili domove

 

 

 

 

 

 

 

 

 

 

vidi raspravu u tekstu

266

 

 

 

0

Ubijenih

 

 

 

 

 

 

 

 

 

0

24. mart 6. april  24. april 11. maj 22. jun

 

Slika 6: Procena ukupne migracije izbeglica i ubistava tokom vremena, istočni region

 

Faza 1

Faza 2

Faza 3

 

 

 

 

 

5042

 

 

 

 

ljudi koji su napustili domove

 

 

 

 

 

195

 

 

 

0

Ubijenih

 

 

 

 

 

 

 

 

 

0

24. mart 6. april  24. april 11. maj 22. jun

 

Slika 7: Procena ukupne migracije izbeglica i ubistava tokom vremena, zapadni region

 

Faza 1

Faza 2

Faza 3

 

 

 

 

 

20 673

 

 

 

 

ljudi koji su napustili domove

 

 

 

 

 

732

 

 

 

0

Ubijena

 

 

 

 

 

 

 

 

 

0

24. mart 6. april  24. april 11. maj 22. jun

 

Slika 8: Vremensko poređenje napada OVK sa ubistvima i kretanjem izbeglica

 

Vreme

Ubistva

Procenat

Kretanje izbeglica

Procenat

Pre ili istovremeno sa vrhuncem

11

38%

10

34%

Posle vrhunca

12

41%

11

38%

Ne može da se zaključi

6

21%

8

28%

 

Da bi analizirali pojavu aktivnosti OVK ili NATO-a u odnosu na obrazac ubistava i kretanja izbeglica, koristili smo sledeću proceduru. Za svaku opštinu na Kosovu hronološki smo beležili, po dvodnevnim periodima, broj izbeglica koje su napustile domove, broj prijavljenih ubistava i pojavu aktivnosti OVK i NATO-a.[12] Za ovu analizu, aktivnost OVK uključivala je i borbe, kao i izolovana ubistva Srba. Identifikovani su dvodnevni periodi koji su označavali vrhunce kretanja izbeglica i ubistava. Ako je do aktivnosti OVK ili NATO-a došlo u istom periodu ili u periodu od dva dana pre vrhunca, zaključili smo da se ta dva događaja podudaraju. Ako aktivnost OVK ili NATO-a nije zabeležena pre vrhunca, zaključili smo da je aktivnost OVK ili NATO-a usledila tek posle vrhunca. Ako se aktivnost OVK ili NATO-a javila više od dva dana pre vrhunca, računato je da opština ima obrazac iz kojeg ne može ništa da se zaključi.

 Da bismo testirali zaključke izvedene ovom metodom, upotrebili smo drugu statističku metodu kojom smo ispitali zajedničke korelacije između aktivnosti OVK i NATO-a i obrazaca kretanja izbeglica i ubistava. Svrha korišćenja druge statisičke tehnike je da se kontroliše korelacija između aktivnosti OVK i vazdušnih udara NATO-a, te broja ubistava i kretanja izbeglica na prostornom i vremenskom planu.

5.1.       Aktivnost Oslobodilačke vojske Kosova

Podaci o aktivnosti OVK dobijeni su putem razgovora i niza nevladinih izveštaja koje je MKSJ sažeo i dostavio za ovaj projekat.[13] Koristeći ove informacije, pri istraživanju je izračunat broj zabeleženih borbi između OVK i jugoslovenskih snaga koje su se tokom vremena odvijale u svakoj opštini. Nije računat intenzitet pojedinih borbi, ali su odvojeni vatreni okršaji brojani posebno. Izolovani napadi OVK koji su za posledicu imali ranjavanje, nestanak ili smrt etničkih Srba takođe su uvršteni u tabelu prema broju žrtava. To su brojke o prijavljenim srpskim žrtvama, a ne procene. Podaci su bili nedovoljni za procenu ukupnog broja nestalih.

 

Slika 9: Vremensko poređenje vazdušnih udara NATO-a sa ubistvima i kretanjem izbeglica

 

Vreme

Ubistva

Procenat

Kretanje izbeglica

Procenat

Pre ili istovremeno sa vrhuncem

3

10%

9

31%

Posle vrhunca

20

69%

13

45%

Ne može da se zaključi

6

21%

7

24%

 

 Kako zahteva testiranje hipoteza, prijavljena aktivnost OVK poređena je sa ubistvima i kretanjem izbeglica za svaku od 29 opština na Kosovu. Rezultat ove analize vremenskih podudaranja prikazan je na Slici 8, koja pokazuje da se u 11 od 29 opština, odnosno 38%, aktivnost OVK podudarala sa opštim vrhuncem u broju ubistava, ili da se odvijala unutar dvodnevnog intervala pre vrhunca. U 12 opština, odnosno 41%, aktivnost OVK usledila je ili posle vrhunca u broju ubistava ili se uopšte nije javila. U šest opština, odnosno 21%, nije bilo moguće izvesti zaključke iz obrasca.

 Kretanje izbeglica ima sličan obrazac. U 10 opština, odnosno 34%, aktivnost OVK podudarala se sa opštim vrhuncem kretanja izbeglica, ili se odvijala unutar dvodnevnog intervala pre vrhunca. U 11 opština, odnosno 38%, aktivnost OVK usledila je ili posle vrhunca kretanja izbeglica ili se uopšte nije javila. U preostalih osam opština, odnosno 28%, aktivnost OVK javila se u vremenskim tačkama koje se podudaraju s ostalim visokim, niskim ili prelaznim tačkama u broju ubistava ili kretanju izbeglica.

 Da bi aktivnost OVK uzrokovala obrazac koji je opažen kod ubistava i kretanja izbeglica, pojava aktivnosti morala bi prethoditi visokim vrednostima. Međutim, ova analiza pokazuje da je aktivnost OVK sledila nakon vrhunaca broja ubistava i izbeglica na više mesta nego što im je prethodila. Stoga nema jasnog uzročno-posledičnog odnosa između aktivnosti OVK i ovde opisanog obrasca.

5.2.       Vazdušni udari NATO-a

U ovoj analizi razmatra se broj vazdušnih udara NATO-a kako su izvestili jugoslovenski državni izvori.[14] Nije se nastojalo da se utvrdi jačina svakog vazdušnog napada, nego su izveštaji o različitim vazdušnim napadima računati odvojeno. Kao i kod aktivnosti OVK, prijavljeni vazdušni udari poređeni su sa ubistvima i kretanjem izbeglica za svaku od 29 opština na Kosovu.

 U samo tri opštine, odnosno 10%, vazdušni udari NATO-a poklopili su se sa pojavom najvi}ih vrednosti u broju ubistava, ili su se odvijali unutar dvodnevnog intervala pre tog vrhunca. U 20 opština, odnosno 69%, vazdušni udari NATO-a javili su se ili posle vrhunca u broju ubistava ili se uopšte nisu javili, a u šest opština, odnosno 21%, obrazac ne upućuje ni na kakav zaključak.

 Obrazac kretanja izbeglica nije tako neujednačen, ali upućuje na iste zaključke. U devet opština, odnosno 31%, vazdušni udari NATO-a podudarali su se sa najvišim vrednostima broja izbeglica, ili su se odvijali unutar dvodnevnog intervala pre tog vrhunca. U 13 opština, odnosno 45%, vazdušni udari izvedeni su ili pošto su brojke koje se odnose na kretanje izbeglica dostigle vrhunac ili se uopšte nisu javili. U preostalih sedam opština, odnosno 24%, vazdušni udari NATO-a javili su se u drugo vreme i podudarali se s ostalim visokim, niskim ili prelaznim tačkama u broju ubistava ili kretanju izbeglica.

 Još jedna činjenica koju valja naglasiti u vezi s vazdušnim napadima NATO-a jeste da su od 2. do 4. aprila napadi bili uveliko smanjeni zbog lošeg vremena.[15] Uprkos tome, u ovom periodu u kome je bilo relativno malo vazdušnih udara NATO-a, prisutne su izrazito visoke vrednosti u broju ubistava i kretanju izbeglica širom Kosova. Kao i kod nalaza zasnovanih na podacima o OVK, analiza podataka o NATO-u pokazuje da su vazdušni udari češće sledili nakon što bi broj ubistava i izbeglica dostigao vrhunac nego što su im prethodili. Stoga hipoteza da su vazdušni udari NATO-a direktno ili indirektno prouzrokovali obrasce ubistava i kretanja izbeglica treba da se odbaci.

 

Slika 10: Procena ukupnog broja ubistava i ostataka tokom vremena

 

1316

Faza 1

Faza 2

Faza 3

 

 

 

 

 

Ubijeni

0

 

 

 

 

 

 

 

 

Ostaci

-788

 

 

 

 

24. mart 6. april 24. april 11. maj 22.jun

5.3.       Dejstvo aktivnosti OVK i vazdušnih udara NATO-a

Uz prethodnu analizu, podaci su takođe sabrani na regionalnim nivoima, a obrasci tokom vremena za svaki od četiri regiona analizirani su zajedno s obrascima ubistava i kretanja izbeglica. Cilj je bio da se ispita obrazac ubistava nakon što se ukloni statistička korelacija s aktivnošću OVK i vazdušnim udarima NATO-a.

Drugim rečima, ova analiza razmatra zajedničko dejstvo aktivnosti OVK i NATO-a pomoću procene broja ubistava predskazanog statističkom interakcijom podataka o OVK i NATO-u, te oduzimanjem te procene od originalnog obrasca. Rezultat tog oduzimanja naziva se "ostatak" i on daje obrazac ubistava i kretanja izbeglica koji ostaje posle uklanjanja dejstva kontrolnih promenljivih veličina (aktivnost OVK i NATO-a). Rezultat ove analize prikazan je na Slici 10.

 Na Slici 10, gornja linija pretstavlja ukupan procenjeni broj žrtava tokom vremena kao što je pokazano na Slici 2. Niža linija na Slici 10 je isti obrazac, uz kontrolisanje statističkog uticaja obrazaca OVK i NATO-a.[16] Kada se poništi uticaj korelacija s vazdušnim udarima NATO-a i aktivnošću OVK, obrazac ubistava tokom vremena ostaje suštinski nepromenjen. Sve vrhunske vrednosti su iste, iako su neke od ni`ih vrednosti nešto ve}e na donjoj liniji.

 

Slika 11: Procena ukupnog kretanja izbeglica i ostataka tokom vremena

 

52 043

Faza 1

Faza 2

Faza 3

 

 

 

 

 

Ljudi koji su napustili domove

0

 

 

 

 

 

 

 

 

Ostaci

-14 529

 

 

 

 

24. mart 6. april  24. april 11. maj 25. maj

 

 Ista analiza može se primeniti na kretanje izbeglica. Rezultati su prikazani na Slici 11. Kao i kod ubistava, obrazac kretanja izbeglica, uz kontrolisanje statističkog uticaja obrazaca OVK i NATO-a, veoma je sličan originalnom obrascu. Međutim, statistička merenja ukazuju na to da aktivnost OVK (ali ne i vazdušni udari NATO-a) imaju slabu, ali primetnu vezu sa obrascem kretanja izbeglica.[17] Ta veza je posebno vidljiva na dvema tačkama u vremenskom nizu: tokom Faze 1 u severnom regionu i tokom prelaza iz Faze 1 u Fazu 2 u istočnom regionu. U ova dva regiona u te dve vremenske tačke, ostatak obrasca odstupa od obrasca procenjenog kretanja izbeglica. Osim ovih dvaju izuzetaka, aktivnost OVK i NATO-a imaju malo uticaja na obrazac kretanja izbeglica.

 Analiza obrazaca ubistava i kretanja izbeglica, uz kontrolisanje uticaja aktivnosti OVK i vazdušnih udara NATO-a pokazuje da, iako mogu postojati povremene podudarnosti, opšte dejstvo aktivnosti OVK i vazdušnih udara NATO-a znatno ne menja obrasce ubistava i kretanja izbeglica. To pruža dalje dokaze za odbacivanje hipoteze da su aktivnost OVK ili vazdušni udari NATO-a prouzrokovali ubistva ili kretanje izbeglica.

5.4.       Jugoslovenske snage

Sada ćemo da razmotrimo treću hipotezu – da su jugoslovenske snage organizovale i sprovele sistematsku kampanju nasilja koja je za posledicu imala ubistva i kretanje izbeglica: statistička analiza korelacija ne može da dokaže da su jugoslovenske snage bile onaj spoljašnji uticaj koji je bio odgovoran za opažene obrasce. Međutim, nalazi ove studije u saglasnosti su s hipotezom da je akcija jugoslovenskih snaga bila uzrok ubistava i kretanje izbeglica.

 Posebno jedan od nalaza ove studije ukazuje na vezu između aktivnosti Jugoslovenske vojske i opaženog obrasca ubistava i kretanja izbeglica. Ekstremno opadanje broja ubistava i izbeglica zapaženo u periodu od 6. do 7. aprila podudara se s jednostranim prekidom vatre koje su jugoslovenske vlasti objavile povodom pravoslavnog Uskrsa.[18] Tokom perioda kada su jugoslovenske snage prekinule neprijateljstva, broj ubistava i izbeglica koje su napuštale domove drastično je opao. Dalje veze mogu se povući ako se pokaže da je do pokreta jugoslovenskih trupa dolazilo prema istim obrascima kao i u slučaju ubistva i kretanja izbeglica. Međutim, takva analiza prelazi okvire ove studije.

6.             Sažetak zaključaka

U skladu s ranijim analizama, nalazi ove studije pokazuju da su se ubistva i kretanje izbeglica odvijali u talasima. Tokom vremena, kretanje izbeglica koje su napuštale domove javljalo se u različitim regionima Kosova, i odvijalo se u intenzivnim periodima, koji su međusobno razgraničeni periodima mnogo nižeg stepena kretanja. Kao što pokazuje Slika 2, obrasci ubistava kroz vreme slede obrasce kretanja izbeglica. Tako obrasci ubistava i kretanja izbeglica pokazuju karakteristike koje upućuju na postojanje spoljašnjeg uzroka. Taj nalaz podupire opažanje da su se ova dva procesa odvijala zajedno.

 U ovoj studiji takođe su analizirani obrasci ova dva niza tokom vremena i prema regionu. Kada se ukupne procene uporede na regionalnom nivou, ostaje jasan odnos između obrazaca kretanja izbeglica i ubistava. Tako su se kretanje izbeglica i ubistva dešavali na istim mestima i u isto vreme, što ukazuje na zajednički uzrok obe ove pojave.

 Analiza takođe pokazuje da dve hipoteze koje su predložene da bi se objasnili obrasci ubistava i migracija, odnosno aktivnost OVK i NATO-a, nisu u saglasnosti s opaženim obrascima kretanja izbeglica i ubistava. I aktivnost OVK i vazdušni udari NATO-a češće su se dešavali nakon najvećeg broja ubistava i najvećeg nivoa kretanja izbeglica nego pre tih kulminacija. Uz kontrolisanje statističkog dejstva aktivnosti OVK i vazdušnih udara NATO-a, obrasci ubistava i kretanja izbeglica tokom vremena ostali su suštinski nepromenjeni.

 Analiza je u saglasnosti sa hipotezom da su jugoslovenske vlasti sprovodile kampanju ubistava i proterivanja. Prekid vatre povodom Uskrsa koji je proglasila jugoslovenska vlada potpuno se podudara sa drastičnim smanjenjem broja ubistava i kretanja izbeglica, a taj nalaz pojačava saglasnost analize s ovom hipotezom.

 Svaki od ovih nalaza u saglasnosti je s narativnim saopštenjima o situaciji na Kosovu tokom ovog perioda koje su davale brojne nevladine organizacije. Koherentnost faza, blizak odnos između procenjenog broja ubistava i kretanja izbeglica, te njihova pojava širom Kosova idu u prilog tvrdnji da je postojao koordiniran uzrok nasilja nad etničkim Albancima u periodu od marta do juna 1999.

 


Dodatak 1: Podaci i sravnjivanje

1.             Uvod

Ova studija se zasniva na zbiru više od 62.000 prijavljenih smrtnih slučajeva, od kojih je približno 52.000 bilo anonimno.[19] Imena 9.569 ljudi bila su prijavljena jednoj ili više organizacija koje su prikupljale informacije o ubistvima na Kosovu u periodu od marta do juna 1999. U Dodatku 1 opisuje se kako smo obrađivali izveštaje o anonimnim i imenovanim smrtnim slučajevima. Kao što će se videti, ova dva tipa podataka pretstavljaju sasvim različite izazove.

 Ovaj Dodatak podeljen je u odeljke, počevši od Uvoda (koji predstavlja Odeljak 1). U Odeljku 2 opisujemo procedure prikupljanja podataka koje su obezbedile osnovne ulazne podatke za naš rad. U Odeljku 3 detaljno se razmatraju koraci pri početnom uređivanju podataka kada se podaci pročišćavaju i pripremaju za analizu. U sledećem odeljku (Odeljak 4) opisuju se naši početni pokušaji da identifikujemo višestruke izveštaje o istom smrtnom slučaju. U Odeljku 5 opisujemo kako smo u drugom krugu preispitali podudarnost podataka. Konačni podaci rezimirani su u poslednjem odeljku Dodatka 1 (Odeljak 6).

2.             Izvori podataka

Podaci koji su analizirani u ovoj studiji prikupljeni su iz četiri izvora: razgovora koje su obavili Srednjoevropska i istočnoevropska pravna inicijativa Američke advokatske komore (ABA/CEELI), Human Rights Watch (HRW) i Organizacija za evropsku bezbednost i saradnju (OEBS), kao i izveštaja o ekhumacijama koje su sastavili međunarodni timovi u ime Međunarodnog krivičnog suda za bivšu Jugoslaviju (EXH). Opšti sažeci projekata prikazani su na Slici 1.

 Prvi red rezimira rad na prikupljanju podataka od strane ABA/CEELI. Oni su obavili 1.674 razgovora u kojima je prijavljeno o 5.089 ubistava. Svoje prikupljanje podataka su obavili u pet zemalja. Posljednji stubac tabele uključuje oznaku "Da" koja znači da su svi koji su prikupljali podatke za ABA/CEELI koristili standardizovan anketni formular.

 

Slika 1: Sažetak izvora podataka

 

Projekat

Razgovori

Incidenti

Gde

Kada

Formular

ABA/CEELI

1674

5089

Albanija

Makedonija

SAD

Poljska

Jugoslavija

Maj-jun 1999

Maj-jun 1999

Maj-jun 1999

Maj-jun 1999

Avg 99 – avg 00

Da

Da

Da

Da

Da

Ekshumacije

-

1767

Kosovo

Jun 1999 – apr 2001

-

HRW

337

1717

Albanija

Makedonija

Kosovo

Mar-jun 1999

Mar-jun 1999

Jun-dec 1999

Ne

Ne

Ne

OEBS

1837

6686

Albanija

Makedonija

Mar-jun 1999

Mar-jun 1999

Da

Da

 

S uopštenijeg aspekta, za svaki izvor, oznaka "incident" može da uključi informacije o smrti više od jednog lica. U jednom razgovoru, svedok može da opiše jedan ili više takvih incidenata. Prema tome, incident jeste izveštaj jednog lica identifikovanog po imenu ili jednog anonimnog lica ili grupe ljudi koji nisu posebno identifikovani.

 Kod ubistava prijavljenih od jedinstvenog izvora, različiti svedoci često su prijavljivali smrt istih žrtava. Neki svedoci identifikovali su žrtve poimence, navodeći za svaku žrtvu njegovo ili njeno puno ime i prezime[20], starost i pol, kao i datum i mesto smrti.

 Druge žrtve identifikovane su isključivo anonimno. Postoje izveštaji o pojedinačnim žrtvama, no bez imena ("Video sam leš starca"). Druge žrtve identifikovane su kao članovi neke grupe ("Video sam deset leševa na hrpi pored druma"). Tela koja su ekshumirana ali nikad nisu identifikovana, takođe su uvrštena u ovu kategoriju. Te se žrtve nazivaju grupama (čak i ako je u "grupi" samo jedna žrtva). 

2.1.       Srednjoevropska i istočnoevropska pravna inicijativa Američke advokatske komore (ABA/CEELI)

Izvori 1.674 razgovora koji sačinjavaju podatke ABA/CEELI razlikovali su se prema zemlji gde su podaci prikupljeni, sa različitim partnerima u svakoj zemlji. Zemlje gde su obavljani razgovori uključivale su Albaniju, Makedoniju, Sjedinjene Američke Države, Poljsku i Kosovo u Jugoslaviji.

 Albanija: ABA/CEELI obavio je 35% razgovora u Albaniji, gde su sarađivali sa koalicijom lokalnih albanskih nevladinih organizacija pod nazivom Centar za mir putem pravde. Zajedno s ovim Centrom, ABA/CEELI je obavljao razgovore u izbegličkim logorima i među izbeglicama smeštenim u privatnim kućama širom Albanije. Prikupljanje podataka u Albaniji počelo je u maju 1999. a dovršeno je u avgustu 1999. U logorima su lica koja su vodila razgovore tražila ispitanike od šatora do šatora.

 Makedonija: ABA/CEELI je oko 16% razgovora obavio u Makedoniji. Među ispitanicima su bili Kosovski Albanci smešteni kod porodica-domaćina širom Makedonije, ali su razgovori prvenstveno vođeni u izbegličkim logorima. Pri tome je ABA/CEELI radio s timom etničkih Albanaca, gra|ana Makedonije. ABA/CEELI je ostvarivao kontakte za razgovore putem preporuka humanitarnih organizacija, usmenih saopštenja i oglasa u lokalnim novinama. U logorima su tražili ispitanike od šatora do šatora. Prikupljanje podataka u Makedoniji počelo je u maju 1999. i završilo se u avgustu 1999.

 SAD i Poljska: Američki advokati su uz pomoć prevodilaca razgovarali s izbeglicama smeštenim u vojnoj bazi Fort Dix u New Jerseyju. ABA/CEELI je 10% svojih razgovore obavio u Fort Dixu, a ispitanici su pronađeni putem oglasa i usmenih informacija u logoru. Prikupljanje podataka u SAD započelo je u maju 1999. i završilo se u julu 1999. CEELI je takođe obavio broj razgovora (4) u jednom izbegličkom logoru u Poljskoj i dobio manji broj informacija iz razgovora koje je obavila Kosovska diplomatska posmatračka misija u Poljskoj.

 Jugoslavija: ABA/CEELI sarađivao je s dvema organizacijama na Kosovu na prikupljanju informacija nakon jugoslovenskog povlačenja u junu 1999. godine; razgovori vo|eni na Kosovu sačinjavaju 38% ukupnih razgovora koje je obavio ABA/CEELI. Centar za mir putem pravde počeo je sa prikupljanjem podataka u avgustu 1999, a završio u novembru 1999, i to u sledećim opštinama: Đakovici, Glogovcu, Klini, Mitrovici, Peći, Podujevu /Podujevë/, Prištini, Prizrenu, Orahovcu, Suvoj Reci, Vučitrnu, te u nekolicini drugde na Kosovu. Dodatne podatke prikupilo je Veće za odbranu ljudskih prava i sloboda. Njihovi su intervjui započeti u julu 2000. a završeni u avgustu 2000. Razgovori su vođeni u opštim centrima za prikupljanje informacija u središtima sledećih gradova: Gnjilane, Vučitrn, Kačanik, Uroševac i Štimlje.

 Svi razgovori vođeni su uz pomoć standardizovanog formulara koji je dozvoljavao i narativan opis događaja. Informacije iz formulara unošene su u bazu podataka. Tim za kodiranje posebnu je pažnju poklanjao preciznosti datuma koji su navodili ispitanici. Neki datumi su tačno identifikovani, dok su drugi identifikovani relativno ("dve nedelje pre nego što smo napustili dom") ili približno ("neko vreme pre nego što su došli Srbi"). Kodiranje preciznosti datuma docnije je korišćeno za analizu osetljivosti nalaza na pogreške u saopštavanju datuma.[21]

 Za statističke svrhe ove studije, svi podaci su prekategorisani iz originalne baze podataka u nove strukture podataka. Svi su podaci ponovo kodirani iz svojih orginalnih formata u standardne geografske klasifikacije i kodove preciznosti datuma.

 Podaci ABA/CEELI obrađivani su u dva dela: prvi deo podataka uključivao je 634 razgovora obavljena provedena na Kosovu. Ovi su podaci poređeni i potpuno nezavisno integrisani s podacima HRW-a, OEBS-a i ekshumacionim podacima kako je opisano u Odeljku 4. Drugi skup podataka ABA/CEELI (koji je uključivao razgovore obavljene izvan Kosova) iskorišćen je u jednoj ranijoj publikaciji koju su izdali ABA/CEELI i AAAS (2000). Ovih 1.040 razgovora su sravnjeni sami sa sobom, a zatim integrisani sa celim skupom podataka (koji je uključivao podatke OEBS-a, HRW-a, ekshumacije i ABA/CEELI podatke iz prvog skupa). Druga faza rada ABA/CEELI sprovedena je na kraju procesa intersistemskog sravnjivanja (vidi Odeljak 4 i Odeljak 5).

2.2.        Ekshumacije (EXH)

Ekshumacije su vršene na mestima gde se smatralo da postoje grobnice kosovskih Albanaca ubijenih u mesecima pre povlačenja jugoslovenskih snaga. Iako ekshumacije nisu bile ravnomerno raspoređene po Kosovu, sprovedene su u 24 od 29 kosovskih opština. Ukupan broj ekshumiranih tela i broj identifikovanih za svaku opštinu navedeni su na Slici 2.

 Podaci o ekshumacijama nisu uključivali datum kada je žrtva ubijena, pa ovi podaci imaju belešku o datumu samo ako odgovaraju žrtvama iz nekog drugog sistema podataka (vidi Odeljak 5). Mesto ekshumacije može, ali ne mora da bude mesto gde je žrtva ubijena. Identifikacije su pažljivo vršene, pa su ekshumacioni podaci posebno važan izvor za proveru da li se isto ime ponavlja. Mnogi ljudi na Kosovu imaju slična prezimena, pa stoga može da bude teško razlikovati ljude samo prema prezimenu.[22]

 

Slika 2: Ukupan broj ekshumiranih i procenat identifikovanih tela po opštinima

 

Opština

Ukupan broj ekhumiranih tela

Procenat identifikovanih tela

Mesto nije navedeno

4

0,0%

Dečani

54

9,3%

Đakovica

388

33,5%

Glogovac

421

39,4%

Gnjilane

54

83,3%

Dragaš

1

0,0%

Istok

208

40,4%

Kačanik

142

69,0%

Klina

24

41,7%

Kosovo Polje

11

54,5%

Kamenica

8

100,0%

Mitrovica

149

50,3%

Lipljan

91

92,3%

Obilić

5

100,0%

Orahovac

368

40,8%

Peć

312

62,5%

Podujevo

90

72,2%

Priština

357

21,0%

Prizren

510

21,6%

Srbica

343

64,1%

Štimlje

24

75,0%

Suva Reka

371

50,1%

Uroševac

22

77,3%

Vitina

8

100,0%

Vučitrn

246

61,0%

Ukupno

4211

45,4%

2.3.       Human Rights Watch (HRW)

Od marta do juna 1999, HRW je razgovarao s izbeglicama po napuštanju Kosova. Od svih ispitanika koji su dali izjave HRW-u, sa 25% je razgovor obavljen kad su prešli granicu sa Albanijom ili kad su se smestili u izbegličkim logorima ili privatnim kućama; sa 11% je razgovarano u Makedoniji, a sa 3% u Crnoj Gori.[23]

 Od juna do decembra 1999. HRW je vodio razgovore na Kosovu; 60% razgovora HRW-a vo|eno je na Kosovu. Geografski regioni unutar Kosova izabrani su na osnovu izbegličkih izveštaja o masovnim kršenjima ljudskih prava i izveštaja o masovnim kršenjima koji su potekli iz drugih izvora. Ispitanici su birani na osnovu onoga što im je bilo poznato o konkretnim zloupotrebama unutar pokrajine. Razgovori su vođeni u opštinama Dečani, Đakovica, Glogovac, Gnjilane, Istok, Kačanik, Kamenica, Klina, Kosovo Polje, Lipljan, Mitrovica, Orahovac, Peć, Podujevo, Priština, Prizren, Orahovac, Suva Reka, Srbica i Vučitrn.

 Svi razgovori vođeni su tako da se dobiju otvoreni narativni iskazi o tome šta je ispitanik video. Nisu korišćeni standardizovani anketni formulari (HRW 2001). Iako nisu korišćeni standardizovani anketni formulari, razgovori su pretstavljali bogat izvor informacija o ubistvima. Kodirani su i uneseni u bazu podataka. Kodiranje za ovu studiju vršilo se nezavisno od originalne baze podataka HRW-a i prethodnog statističkog rada u HRW-u (2001).

2.4.       Organizacija za evropsku bezbednost i saradnju (OEBS)

Verifikaciona misija OEBS-a za Kosovo (OSCE Kosovo Verification Mission – VMK) prikupila je 1.837 razgovora u kojima se pominje jedno ili više ubistava. Izjave su uzimane od marta do juna 1999. Razgovori su vođeni na više od 90 pojedinačnih lokacija u Albaniji (37% razgovora) i na barem šest lokacija u Makedoniji (61% razgovora). Obavljen je i manji broj razgovora (22) za koje mesto nije navedeno. Na samom Kosovu nisu prikupljene nikakve informacije. Lica koja su vodila razgovore iz OEBS-a/VMK-a otvorila su kancelarije na centralnim lokacijama blizu mesta okupljanja izbeglica (uglavnom logora), a ispitanici su dolazili da daju izjave. OEBS je informisao potencijalne ispitanike o projektu preko lokalnih nevladinih organizacija, oglasa u štampi i kontakata s lokalnim klinikama i bolnicama. Većina razgovora (preko 80%) obavljena je u izbegličkim logorima; ostali razgovori obavljeni su na javnim okupljalištima ili u privatnim kućama.

OEBS/VMK je koristio standardizovane formulare za razgovore slične onima koje je koristio ABA/CEELI. Informacije su zatim unošene u bazu podataka, takođe sličnu onoj koju je koristila ABA. Za našu studiju, podaci su nezavisno zabeleženi kao što je bio slučaj i s HRW-om. Polustrukturirani razgovori OEBS-a preformatizovani su da bi bili kompatibilni sa formatom koji smo izradili za korišćenje sa podacima ABA/CEELI.

3.             Početno uređivanje podataka

Iako su sve organizacije pažljivo prikupljale skupove podataka, bio je potreban značajan napor da se podaci standardizuju na formate koji su nam omogućivali da utvrdimo u kojim zapisima su identifikovane iste žrtve. Izvršena su dva kruga uređivanja podataka. U prvom krugu, pripremili smo podatke za sravnjivanje. U drugom krugu, dodatnim uređivanjem, podaci su pročišćeni, sravnjivanje je finalizovano. U ovom odeljku opisuje se početno uređivanje podataka. U Odeljku 5 opisuje se konačno uređivanje podataka.

3.1.       Geografsko kodiranje

Sva mesta koja su u razgovorima identifikovana kodirana su prema pojedinačnim geografskim lokacijama. Pre sravnjivanja, nekoliko geografskih sistema usaglašeno je s jedinstvenom kodnom šemom. Kodna šema koristi listu imena mesta. Budući da mnogo mesta ima isto ime, lista mesta nije jedinstveno identifikovana imenima. Umesto toga, svakom pojedinom mestu dodeljen je kod. Kodovi su dodati geografskoj širini i dužini mesta na koje se odnose.

 Započeli smo sa geografskom strukturom koja je opisana u Ball (2000) i ABA/AAAS (2000), koja koristi 29 opština. Ove strukture ispuštale su mnogo mesta koja su pomenuta u novim podacima prikupljenim za ovu studiju. Lista mesta dostupna preko “on-line” Informativnog centra humanitarne zajednice (Humanitarian Community Information Centre – HCIC) povezivala je imena mesta s koordinatama na mreži na detaljnom atlasu. Lista HCIC-a korišćena je za standardizovanje imena mesta.[24]

 Sva su mesta kodirana prema geografskoj širini i dužini. U prvoj fazi korišćeni su Popis lokacija naseljenih mesta američke Nacionalne agencije za kartografske projekcije i izradu karata (National Imaging and Mapping Agency - NIMA).[25] Lista NIMA-e uključuje geografsku širinu i dužinu, povezana je sa listom HCIC-a pomoću imena mesta. Ako su imena bila dvosmislena, ručno smo povezali kodove koristeći imena opština i proveravajući mesta na HCIC-ovoj karti i komercijalnoj karti.[26] Koristeći se listom i kartom HCIC-a, kao i komercijalnom kartom, izradili smo računarske rutine koje su potvrđivale geografsku širinu i dužinu svakog mesnog koda u odnosu na mrežne koordinate na karti HCIC-a. Lokacije koje se nisu poklapale sa svojom mrežnom koordinatom bile su ručno ucrtane i ponovo proverene.

 Nekoliko gradova i sela imaju ista imena kao i opštine. Nije uvek bilo moguće utvrditi navodi li se u nekom iskazu opština ili selo. Ponekad se takođe isto ime mesta javljalo u više od jedne opštine (npr. Drenovac je ime grada odnosno sela u četiri opštine: Orahovcu, Dečanima, Prištini i Klini). Naposletku, bilo je slučajeva kad se mesno kodiranje nije moglo primeniti (npr. "u planinama").

 Udaljenosti između lokacija računate su pomoću njihove geografske širine i dužine.[27] Ove udaljenosti koriš}ene su da bi se utvrdilo da li se protivrečni iskazi svedoka o nekoj lokaciji verovatno odnose na isto mesto. Lokacije koje su međusobno udaljene manje od 10 km rutinski su tretirane kao ista lokacija.[28]

3.2.       Uređivanje podataka o imenu i polu

Konsultovali smo doma}e Albance i nekoliko indeksa albanskih imena dostupnih preko interneta kako bismo interpretirali imena navedena u izvorima podataka.

 Ispravljene su česte pogreške u pisanju imena i prezimena. Pre ili za vreme sravnjivanja podataka identifikovani su i ispravljeni slučajevi obrtanja imena i prezimena. Neka su imena zapisana fonetski budući da su ih zabeležili pojedinci koji nisu umeli da govore albanski dok su kod drugih postojale očigledne greške pri unosu podataka.

 Pol je direktno navodio ispitanik ili je kodiran na osnovu imena (ako je ime bilo navedeno). Imena su unakrsno proveravana da bi bili sigurni da je isto ime uvek dodeljeno istom polu.[29]

Izvršena je potraga za žrtvama Srba koje je bilo moguće utvrditi. Neki slučajevi bili su očiti, npr. odrednica "srpski komandant". Ostali su identifikovani putem provere prema listi uobičajenih srpskih imena i prezimena.[30] Ukupan broj od 30 Srba, identifikovanih prema listama imena, ispušten je iz procena.[31]

3.3.       Formatiranje datuma smrti

Izvršeno je uređivanje podataka kako bi se ispravile zabune izazvane razlikama u redosledu prema kojem se dani i meseci konvencionalno zapisuju u Evropi (dan, mesec) i Americi (mesec, dan). U drugim zapisima zabeležene su netačne godine smrti (npr. 1990. i 2999; obe su ispravljene na 1999.). Posle uređivanja, svi su datumi standardizovani na ISO format GGGG-MM-DD, gde je G godina, M mesec, a D dan.

 Iako su nazvani "datumom smrti", izveštaji o razgovorima obično su sadr`avali mešavinu stvarno zapamćenih datuma incidenata i datuma kad su tela viđena. Stoga je moguće da je navedeni datum docniji od stvarnog datuma smrti.

 Kad su originalni razgovori uneti u bazu podataka, preciznost informacije o datumu kodirana je kao "tačna", "pibližna", "nepecizna" ili "nepoznata". Kodiranje preciznosti grubo odgovara stepenu preciznosti definisanom prema danu, nedelji ili mesecu događaja, odnosno odsutsvu te preciznosti. Kao rezultat sravnjivanja zapisa s drugim zapisima, ponekad su za svaki zapis postojali višestruki datumi. Kodiranje preciznosti je korišćeno za izbor "najboljeg" datuma, kako je opisano u pododeljku 5.2.[32]

4.             Početno sravnjivanje podataka

Naša radna hipoteza bila je da svaki sistem podataka (osim ekshumacionih podataka) može sadr`ati mnoge dvostruke izveštaje o smrti iste žrtve. Naravno, trebalo je da se ti duplikati pronađu pre vršenja bilo kakve analize. Problem dvostrukih zapisa podeljen je na četiri podzadatka: intra- i intersistemsko sravnjivanje za pojedince, te intra- i intersistemsko sravnjivanje za grupe.

 Svaki pojedinačni zapis koji je mogao da se identifikuje najprije je poređen sa ostalim pojedinačnim zapisima koji su mogli da se identifikuju u njegovom izvornom skupu podataka. Ovaj se proces naziva "intrasistemsko sravnjivanje" ili “samosravnjivanje” jer se njime jedan izvor podataka sravnjuje sa samim sobom.[33]

 Nakon što su svi pojedinačni zapisi nekog izvora podataka sravnjeni sa samim sobom, izveštaji iz svakog izvora sravnjivani su sa onima iz drugih izvora. Taj smo proces nazvali “intersistemsko sravnjivanje”. Imenovani pojedinci u svakom sistemu poređeni su s imenovanim pojedincima u svim drugim sistemima, a podudarnosti su beležene. Primarne promenljive veličine za proveru duplikata bile su imena (ime, prezime) i geografska lokacija. Ostale informacije, kao što je datum smrti, starost ili pol, bile su takođe razmatrane da bi se potvrdili ili odbacili potencijalno podudarni podaci.

 Isti proces intra- i intersistemskog sravnjivanja ponovljen je i kod podataka o anonimnim grupama. Lokacija i vreme bile su dve ključne promenljive veličine korišćene za objedinjavanje eventualnih dvostrukih izveštaja o anonimnim ubistvima. U principu, izveštaji o anonimnim smrtnim slučajevima mogli su se odnositi na pojedince koji su u drugim izveštajima identifikovani imenom. Pronašli smo nekoliko načina za kombinovanje pojedinačnih i grupnih podataka kako je niže opisano. Pristupi koje smo razmatrali daju uverljiv skup donjih granica ukupnog broja ubistava, kako je opisano u Odeljku 6. U Dodatku 2 opisuju se pristupi modelovanja kojima se unapre|uju ove donje granice.

 Iako je proces sravnjivanja bio računarski potpomognut, odluke su donosili ljudi. Sravnjivanje je vršio mali tim pažljivo obučenih kodifikatora koje je nadzirao jedan od autora. Tokom drugog kruga sravnjivanja koji je opisan u Odeljku 5, preduzeti su drugi koraci za merenje kvaliteta sravnjivanja.

4.1.       Promenljive veličine korišćene za intrasistemsko sravnjivanje pojedinačnih zapisa

Ključni elementi za identifikovanje dvostrukih izveštaja o istim licima bila su imena i prezimena. Bilo je mnogo uobičajenih grešaka u pisanju (ili krivih transkripata) nekih imena, uključujući sledeće: Hysen, Hyseni, Iseni; Ymeraj, Imeraj; Krasniqi, Krasnici, Krasniki; Kuci, Kuki, Quki, Quci; Cake, Caka, Cakaj; te Loki, Loku. Uopšteno je "H" kao prvo slovo često ispušteno u transkriptima intervjua.

 Prezimena koja počinju određenim slovom često su se javljala u različitim kombinacijama: K je moglo da bude C ili Q; često su brkani Y i I; Xh je moglo da bude Gj ili Sh. Sve su ove kombinacije rutinski upoređivane. Uz rutinska pravila, tražene su manje uobičajene ali očite greške u vezi sa sličnim slovima u sredini imena. Tokom vremena, kodifikatori su se upoznali sa raznim načinima pisanja različitih imena.

 Kada su zapisi sadržavali slična imena, vođeni su kao podudarni osim ako se nisu jasno razlikovali prema nekoj drugoj informaciji. Informacije koje su pobijale pretpostavku da su dva zapisa podudarna uključivale su starost i pol žrtava, kao i datum i mesto smrti. Podaci o starosnoj dobi retko su bili od koristi, jer su često bili približni. Međutim, ako je bila reč o razlici od 20 ili više godina, pretpostavili smo da su zapisi različiti; teorija je bila da su dve žrtve istog imena a različite starosti verovatno bile rođaci. Podaci o polu retko su se razlikovali, osim ako su se razlikovala i imena, budući da su u ranijim fazama uređivanja podataka imena korišćena za razlikovanje polova.

 Mesto smrti pretstavljalo je najvažniju dodatnu informaciju za procenu podudarnosti zapisa. Zapisi kod kojih su se imena podudarala a starosna dob razlikovala za manje od 20 godina smatrani su istovetnima ako su mesta bila ista. Posebno, ako su mesta bila u istoj opštini ili susednim opštinama, smatrana su istovetnim.

4.2.       Osnovni pristup intrasistemskom sravnjivanju pojedinačnih zapisa

Literatura o povezivanju arhivskih zapisa nudi mnogo pristupa sravnjivanju lica na listama.[34] Međutim, kompleksnost ovde opisanih podataka, zahtevala je da se koristimo manuelnim metodama. Dok smo se informisali i uređivali podatke, uspeli smo da u ve}oj meri automatizujemo ovaj proces. Usled ograničenja u resursima, nismo mogli da odredimo kvantitet svih grešaka u procesu sravnjivanja kao što je učinjeno u Belin i Rubin (1995). Umesto toga, oslanjali smo se na ponavljanje računarski potpomognutog sravnjivanja pri kojem je u poslednjim etapama pronađeno veoma malo podudarnosti. Kako bismo minimalizovali dejstvo preostalih grešaka u sravnjivanju, u svim nejasnim slučajevima zapise smo pre smatrali podudarnim, što znači da su procene bile manje.

 Unutar svakog skupa podataka, zapisi su sravnjivani tako da je papirna lista štampana u obliku tablice. Liste su razvrstane prema nekoliko promenljivih veličina: prema mestu, u sledećoj etapi najpre prema prezimenu pa imenu, a u narednoj najpre prema imenu pa zatim prezimenu.[35] Iako je moguće da se podudrani zapisi pojave na udaljenim položajima u jednom tipu razvrstavanja, oni }e se pojaviti jedan blizu drugog barem u jednom tipu razvrstavanja. Na primer, dva zapisa sa istovetnim imenima i prezimenima pojaviće se zajedno pri razvrstavanju i prema imenu i prema prezimenu. Dva zapisa sa različito napisanim prezimenima, ali istim imenima, pojaviće se zajedno pri razvrstavanju prema imenu. Kad se pronađu zajedno, prezimena mogu odmah da se identifikuju.

 Korišćenjem tehnike višestrukog razvrstavanja (ili svrstavanja u blokove), kodifikatori su identifikovali blokove istovetnih zapisa. Odabran je zapis sa najboljim podacima (odnosno na kojem je ime najbolje zapisano, a vreme i mesto bili najprecizniji). Svi brojevi zapisa grupisani su u "krug" i sačuvani za kasniju analizu najverovatnijeg datuma (kao što je opisano u Odeljku 5) za konačan zapis.[36] Taj zapis nazvan je "ključnim" zapisom.[37]

 Tehnika se menjala kako su kodifikatori sticali sigurnost. U prvom delu tri kodifikatora su nezavisno sravnjivala sve podatke HRW-a sami sa sobom i deo podataka ABA-e koji su se sastojali od razgovora obavljenih na Kosovu. Nakon što je završen proces samosravnjivanja za zapise HRW-a i ABA-e, pristup se pokazao dovoljno rutinski, pa je jedan kodifikator mogao da postigne gotovo jednako pouzdane rezultate kao i dvojica ili trojica. Stoga je samo jedan kodifikator samosravnjivao podatke OEBS-a i drugi deo podataka ABA-e.

 Iako je proces bio rutinski, rezultati sravnjivanja bili su kompleksni jer su podrazumevali sažimanje jednog neodređenog i nepredvidivog broja zapisa u jedan "ključni" zapis. Iako greške nisu uvek bile očigledne, unutrašnja konsistentnost sažetih zapisa mogla je da se proceni (vidi niže).

 Kod intrasistemskog sravnjivanja HRW-a i ABA-e, uočene su pojedinačne žrtve koje su dva kodifikatora različito klasifikovala. Kodifikatori su razmotrili razlike i zajedno izradili konsenzusnu listu podudarnosti.[38] Saglasnost među kodifikatorima kretala se od 75% do 90%. Sve razlike pregledao je i razrešio jedan od autora studije.

 Za sve intrasistemske podudarnosti, struktura odluke u procesu sravnjivanja procenjena je prema uverljivosti. Naročito je, za svaki sistem, procenjivan svaki krug koji je sadržavao dva ili više zapisa poređenjem ključnih polja podudarnosti kako bi se postigla saglasnost. Kod svakog izvora i za svaki krug koji je sadržavao više od jednog zapisa, svi zapisi su poređeni sa ključnim zapisom. Za svako od tri polja (prezime, datum, mesto), izbrojano je koliko je zapisa u saglasnosti sa ključnim zapisom.

 Prezimena: Udeo zapisa unutar krugova koji su bili međusobno podudarni s obzirom na prvih tri ili sedam znakova unesen je u tabelu. Ovo poređenje je vršeno samo za zapise sa imenima koja su imala najmanje tri ili sedam znakova. Podudarnosti prezimena bile su veoma bliske: kada se uzmu u obzir tri skupa podataka, između 85% i 95% sravnjenih zapisa imalo je zajednička najmanje prva tri slova. Zapisi čija se prva tri slova ne podudaraju ne moraju se nužno smatrati različitim. Indeksom sličnosti imena mo`e se meriti način pisanja ili varijacije u transkripciji kod izvornih zapisivača. Mi tumačimo visok stepen saglasnosti kao indikaciju da su imena najčešće identifikovana kao podudarna sa drugim, sličnim imenima.

 Datumi: Takođe je razmotrena vremenska blizina intrasistemskih podudarnih zapisa. Kod procesa samosravnjivanja, između 79% i 84% preciznih datuma u podudarnim zapisima bilo je u razmaku od jedne nedelje. Datumi koji su kodirani kao približni nisu pore|ani.

 Lokacije: Uz primenu preciznih kodova za lokacije, za pojedince u intrasistemskim podudarnim zapisima bili su navedeni identični kodovi u 66% (OEBS) da 99% (HRW) slučajeva; kada je poređenje lokacija prošireno na mesta međusobno udaljena do 25 km, kod dodatnih 28% sravnjenih zapisa OEBS-a utvrđena je podudranost za mesni kod, čime je stepen podudarnosti mesta porastao na 94%.

 Slična imena, datumi i mesta koja se tačno ne podudaraju mogu da odražavaju razlike u sećanju svedoka, odnosno ne pretstavljaju nužno greške u kodiranju. Međutim, visok stepen slaganja u ovim merama ukazuje na to da su zapisi sa sličnim imenima, kao i datumima i mestima, pravilno identifikovani kao podudarni ako su vremenski ili prostorno bliski. Zapisi sa različitim podacima ređe su identifikovani kao podudarni.

 Naši rezultati posle ovog početnog intrasistemskog sravnjivanja imena pojedinaca smanjili su broj zapisa koji su prosleđeni u sledeće etape za otprilike jednu trećinu. Pronađeni duplikati omogućili su nam da poboljšamo izveštaje o datumima i da naučimo više o varijacijama albanskih imena. Iako u ovoj etapi nisu pronađeni svi duplikati, ona je dala osnovu na kojoj su započeto intersistemsko poređenje opisano u pododeljku 4.3.

 Kao što ćemo razmotriti u Odeljku 5, docniji koraci u procesu omogućili su otkrivanje većine preostalih duplikata. Međutim, postojao je mo`da mali broj "preterivanja u podudarnostima", koja nisu mogla da budu otkrivena u docnijim koracima pa stoga mogu da pretstavljaju razlog za zabrinutost. "Preterana podudarnost" može se javiti kada se pri samosravnjivanju povežu zapisi o dva različita lica. Nema načina da se docnije u postupku isprave takve greške, jer zapis o jednom od lica više nije raspolo`iv. Preterana podudarnost ima tendenciju da smanjuje broj ubistava te stoga dovodi do potcenjivanja ukupnog broja žrtava.[39]

4.3.       Intersistemsko sravnjivanje pojedinačnih zapisa

Intersistemsko sravnjivanje sastojalo se od poređenja svakog pojedinog zapisa u jednom izvoru podataka ("izvor") sa svim mogućnim podudarnim podacima u drugom izvoru podataka ("cilj"). Kao i kod intrasistemskog sravnjivanja, sav je posao obavljen manuelno. Mogući zapisi u ciljnoj bazi podataka uključivali su sve pojedince čija su imena počinjala na isto slovo (ili jedno od slova koja se slično izgovaraju, kako je gore opisano). Tablični kalkulatori koji su korišćeni kod samosravnjivanja zamenjeni su specijalizovanim softverom koji je napravljen sa namerom da olakša proces odlučivanja pri sravnjivanju.[40]

 Svaki izvorni skup podataka podeljen je na podskupove. Svaki podskup (nazvan "režanj") bio je proporcionalno stratifikovan (prema datumu smrti i regionu) slučajni uzorak celine. Režnjevi su izrađeni tako da približno pretstavljaju posao obavljen za pola dana. Kada bi par kodifikatora završio isti režanj, nadležni istraživač bi poredio rezultate i proveravao sva neslaganja sa oba kodifikatora. Na taj način, objedinjeni su različiti stilovi kodiranja, a suptilne razlike u kodifikatorskom radu su uočene i uklonjene. Kodifikatori su dobijali jedan ili više probnih režnjeva za obuku, a njihov rad nije prihvatan dok ne bi postigli barem 90% rezultata saglasnih sa standardnim odgovorima za probne režnjeve. Identifikovani su kodifikatori čiji je rad imao nizak stepen slaganja sa probnim režnjevima i oni su prošli dodatnu obuku.

 Jedinstveni "ključni" zapisi koji su preostali nakon procesa samosravnjivanja pretstavljali su ulazne podatke za intersistemsko sravnjivanje. Poređenje podudarnosti vršeno je prema istim pravilima koja su navedena i u pododeljku 4.1. Svaki zapis u svakom izvoru pore|en je sa svakim zapisom u ostala tri izvora. Poređenja nisu bila simetrična. To znači, ako je izvor A poređen sa izvorom B, izvor B nije poređen sa izvorom A (iako su povremeno vršena simetrična poređenja za dodatnu redundaciju). Budući da su barem dva (a često i više) kodifikatora donosila odluke o podudarnosti za svako poređenje, bilo je preko dvostruko više odluka nego mogućh poređenja. Ukupno su donesene 18.462 odluke o podudarnostima, a grubi udeo ukupne saglasnosti po ovim odlukama iznosio je 94%.

 Iako je stepen slaganja između kodifikatora bio prilično visok, bilo je i neslaganja. Jedan od autora ove studije razmotrio je sve slučajeve neslaganja i doneo konačnu odluku.

 Kao što je prethodno pomenuto, razgovori koje je ABA obavila izvan Kosova obrađivani su drugačije nego drugi izvori. Dok su postupci samosravnjivanja ovog dela podataka bili istovetni onima koji su opisani u pododeljku 4.2, intersistemsko sravnjivanje je vršeno nakon što su ostali sistemi sravnjeni i objedinjeni. No, u ostalim elementima, postupci su bili jedanki. Dva različita kodifikatora nezavisno su sprovodila postupak sravnjivanja, a njihove su odluke poređene. Udeo slaganja među kodifikatorima za ovu opciju bio je relativno niži (približno 80%). Međutim, kao i kod drugih sravnjenih zapisa, sva neslaganja su razmotrena i razrešena.

 Pri početnom intrasistemskom sravnjivanju podataka primećena su izvesna područja u podacima koja su zahtevala dodatnu proveru, posebno kod ekshumacionih podataka, ali i na drugim mestima. Zanimljivo je da je, kao i kod etape samosravnjivanja, broj smrtnih slučajeva opet smanjen otprilike za trećinu. U Odeljku 5, opisaćemo kako smo svoja saznanja iskoristili za donošenje konačnih odluka o podudarnosti pojedinačnih smrtnih slučajeva.

4.4.       Intra- i intersistemska obrada anonimnih grupnih zapisa

Pri dosad opisanom sravnjivanju poređene su pojedinačne žrtve koje su identifikovane po imenu sa drugim takvim žrtvama. Međutim, izvori opisuju približno sedam puta više žrtava u anonimnim grupama nego pojedinačnih imenovanih žrtava. Po svojoj prirodi, izveštaji o anonimnim grupama sadrže manje informacija pomoću kojih se može utvrditi da li su izveštaji o grupama međusobno jedinstveno podudarni. Nakon opsežne analize, zaključili smo da je nemoguće sravniti podatke o pojedincima sa podacima o grupama unutar sistema podataka ili sravniti grupe sa drugim grupama između različitih sistema podataka uz dovoljnu pouzdanost da bi se modelirale informacije koje nedostaju kako je opisano u Dodatku 2.

 Ipak, sravnjivanje grupa sa drugim grupama i pojedincima donosi nekoliko prednosti. Kao prvo, sravnjivanje bilo kakvih zapisa obezbe|uje dodatne informacije o preciznosti (ili eventualnoj nepreciznosti) podataka o datumu i mestu. Ako je najverovatniji parnjak za neki zapis (na osnovu kvalitativnih informacija u poljima za beleške, ili ako se mesta podudaraju, a datumi razlikuju) drugi zapis koji je vremenski ili prostorno udaljen, to implicira da jedan od ta dva zapisa sadr`i neprecizan podatak o datumu ili mestu. Kao drugo, sravnjivanjem podataka o grupama i pojedincima unutar sistema, moguće je proceniti osnovnu donju granicu broja ubijenih koji nedostaju na listi identifikovanih.

 Proces sravnjivanja za grupe sproveden je na sledeći način.

 Kao prvo, sravnili smo izveštaje o grupama same sa sobom u svakom izvoru podataka. Anonimne grupe spojene su po određenim mestima i datumima. To znači da su grupe ljudi za koje je utvrđeno da su ubijeni na nekoj konkretnoj lokaciji unutar približno 10 dana smatrane duplikatima; širi datumski raspon uvršten je ako su dalji datumi bili neprecizni ili ako su narativne informacije iz intervjua ukazivale na to da se radi o istom incidentu. Na gotovo svim seoskim lokacijama bilo je vrlo malo grupa i one su bile okupljene oko određenih datuma. Nakon što su izvršena sravnjivanja za grupe, procenjene su sve grupe sa više od jednog podudarnog zapisa. Samo 15 njih imalo je datume koji su bili udaljeni više od 14 dana. "Najbolji" datum odabran je prema istoj logici kao i kod pojedinaca sravnjivanih unutar istog sistema.

Drugo, u svakom sistemu podataka podaci o pojedincima sravnjeni su sa podacima o grupama. Sravnjivanje je vršeno prvenstveno prema lokaciji i datumu, iako su u mnogim slučajevima dodatne informacije o grupi pomogle pri sravnjivanju. Neki inače neidentifikovani zapisi obeleženi su kao "brat žrtve 27" ili je grupa identifikovana kao "porodica X". Sravnjivanje podataka o pojedincima i grupama je u nekim slučajevima povećalo količinu informacija o pojedinačnim ubistvima. Na primer, ako izveštaj o nekom pojedinačnom ubistvu nije nosio specifičan datum kada se ubistvo dogodilo, anonimni izveštaj (o grupi) mogao je da pru`i tu informaciju. Čak i ako je pojedinačni izveštaj sadržao podatak o datumu, grupni izveštaj je korišćen kao potvrda originala.[41]

Treće, podaci o pojedincima sravnjivani su sa grupnim podacima u drugim izvorima podataka. Taj je proces imao iste prednosti što se tiče potvrde informacija kao što je gore opisano.

^etvrto, brojnosti po grupama pretstavlja metodu za ispitivanje broja smrtnih slučajeva koji nisu prijavljeni u sklopu pojedinačnih zapisa. Pomoću brojnosti jedinstvenih grupa možemo da procenimo da li je obrazac ubistava koja nisu prijavljena kao pojedinačna ravnomerno distribuiran po prostoru i vremenu ili to nije slučaj. Ovo pitanje detaljnije je razrađeno u Dodatku 2.

4.5.       Objedinjavanje podataka o anonimnim grupnim ubistvima između sistema

Žrtava koje su prijavljene tokom razgovora kao članovi anonimnih grupa bilo je približno pet puta više nego imenovanih žrtava. [42] U ovom odeljku opisa}emo kako smo se ovim informacijama koristili da bismo istražili broj žrtava koje nisu identifikovane po imenu.

 Nakon samosravnjivanja grupa, utvrdili smo da je postojao velik stepen ponavljanja u grupnim podacima: faktor ukupne redukcije prijavljenih podataka na neduplikovane podatke iznosio je više od pet. Neduplikovani zapisi o grupama nastali kao rezultat sravnjivanja sastojali su se od jednog ili više zapisa o grupama. Tako je svaki zapis sadržao distribuciju veličine grupa koja je mogla da se iskoristi za procenu "najbolje" veličine te grupe. Za svaku grupu procenjivane su tri veličine. Za procenu minimalne veličine, uzeli smo najmanju prijavljenu veličinu grupe koja je bila veća od broja pojedinaca koji je sravnjivan sa tom grupom (unutar tog sistema podataka). Medijanska veličina bila je medijan svih veličina većih od broja pojedinaca koji je sravnjivan sa grupom. Maksimalna veličina bila je najveća navedena veličina bilo koje grupe u krugu.

 Sume po grupnim zapisima prema vremenu i prostoru u svakom sistemu podataka nisu duplikovane. Međutim, brojnosti po grupama ne mogu direktno da se sabiraju između sistema podataka jer podaci o grupama nisu bili sravnjeni između sistema. Uklonili smo duplikate iz brojnosti po grupama upoređujući sumu brojnosti po grupama (pomoću minimalnih, medijanskih i maksimalnih brojnosti) u tri sistema. Na svakoj tački smo izabrali maksimum triju sistema, pri čemu smo pretpostavili da su druga dva sistema potpuno sravnjena sa najvećim. To je najkonzervativnije pravilo za objedinjavanje koje se može upotrebiti.

 Tako dobijeni podaci pretstavljaju procenu ukupnog broja anonimnih ubistava u vremenu u prostoru, te se koriste za ocenu potpunosti jedinstvenih pojedinačnih zapisa (vidi Odeljak 6.3).

5.             Pročišćavanje postupka uređivanja i sravnjivanja

Kad su sve odluke u vezi sa početnim intra- i intersistemskim sravnjivanjem i uređivanjem primenjene na sirove podatke, kombinovani skup podataka mogao se revidirati, uz korišćenje informacija prikupljenih tokom prethodnih etapa. Revizija se skoncentrisala na nedoslednosti u sravnjivanju, na biranje najbolje promenljive veličine koja će da pretstavlja ceo skup sravnjenih zapisa, imputovanje nedostajućih datuma, ponovnu procenu ekshumacionih podataka i na opšte popravljanje nedoslednosti u zapisivanju, te na druge greške pronađene u našem početnom radu.

5.1.       Nedoslednosti u sravnjivanju

Zbog načina na koji smo sravnjivali ciljeve sa izvorima u početnom procesu sravnjivanja, moguće je da su zapisi u različitim skupovima podataka sravnjivani prema nedoslednim obrascima. Na primer, razmotrimo tri odluke o sravnjivanju parova: AB1, CA1 i BC2. U ovom primeru, zapis A1 (iz skupa podataka A) bio je poređen sa skupom podataka B i sravnjen sa zapisom B1. U zasebnom postupku, zapis C1 poređen je sa skupom podataka A i sravnjen sa zapisom A1. U trećem sravnjivanju, zapis B1 poređen je sa skupom podataka C i sravnjen sa zapisom C2.

 Nakon objedinjavanja, čini se da se zapisi A1 i B1 podudaraju i sa C1 i C2. Ako je skup podataka C ispravno samosravnjen, radi se o kontradikciji. Ukupno, bilo je 298 zapisa poput C1 i C2. Rešenje je bilo očigledno: u svakom paru pogrešno sparenih zapisa, trebalo je da se obrazac sravnjivanja za jedan od zapisa modifikuje.

 Sve ove kontradikcije bile su revidirane i razrešene. Postoje dva načina za njihovo razrešavanje: jedna mogućnost je da je C1 i C2 trebalo da budu identifikovani kao podudarni u toku intrasistemskog sravnjivanja. U tom slučaju, jedan od dva zapisa može prosto da se ispusti iz analize.[43] Tako je rešeno osamdeset zapisa. Druga mogućnost je da je identifikovana podudarnost u slučaju C1 ili C2 pogrešna pa zapisi treba da budu razdvojeni; preostalih 218 pogrešno sparenih zapisa bilo je razrešeno razdvajanjem. U nekim slučajevima, ako su zapisi pogrešno spareni, mogla je postojati prava podudranost koja je zasenjena pogrešnom. Takve potencijalno propuštene podudarnosti tražene su pri završnom uređivanju (vidi Odeljak 5.4.).

5.2.       Izbor "najboljih" datuma

Svaki zapis u konačnom skupu podataka pretstavljao je kombinaciju svih zapisa koji su sa njim bili podudarni. Takav kombinovan zapis potencijalno je sadržavao mnogo datuma. Izbor "najboljeg datuma" vršio se na sledeći način. Prvo smo agregovali podudarne zapise prema datumu. Po pravilu je u skupu podudarnih zapisa jedan datum uobičajeniji od drugih. Ako je bilo moguće, najpre smo odabrali taj datum. Među preostalim datumima, izabrali smo datum sa najvišim stepenom preciznosti (koji je definisan prema najpreciznijem zapisu u tom krugu). Ako je postojalo više od jednog datuma sa tim stepenom preciznosti, izabrali smo datum sa najvećim brojem sastavnih zapisa u tom krugu. U slučajevim gde su postojale veze (datumi sa istom preciznošću i brojem sastavnih zapisa), izabrali smo raniji datum. Argumenat za takvu odluku jeste da su docniji datumi verovatno bili posledica toga što su ljudi videli tela nakon što je ubistvo izvršeno, a ne samo ubistvo.

 Kod 204 zapisa bez informacija o datumu, primenjena je tzv. “hot deck” procedura za dodeljivanje slučajnog datuma iz "donatorskog" zapisa koji je geografski najbliži lokaciji zapisa kojem nedostaje datum.[44] Od potencijalnih donatora nasumično su odabrana tri datuma, te su napravljene kopije originalnog zapisa za svaki od uzorkovanih datuma. Svakom novom zapisu dodeljena je težina od 0,33.[45]

 Neki od datuma imputovanih “hot-deck” procedurom bili su izvan datumskog raspona interesa za ovu studiju (od 20. marta do 22. juna). Ti zapisi (i njihove parcijalne težine) bili su stoga isključeni iz analize.

 Osetljivost procena na "najbolji" izbor datuma i imputovanje analizirani su u Dodatku 2. Kao što pokazuje Dodatak 2, glavni statistički rezultati robusni su prema nesigurnostima izazvanim nedoslednostima u datumima ili time što je u malom broju slučajeva bilo izvršeno imputovanje podataka.

5.3.       Podaci o ekshumaciji

U početnim koracima uređivanja i sparivanja opisanim u Odeljcima 2-4, pretpostavili smo da su ekshumacioni podaci po definiciji jedinstveni. To znači da smo pretpostavili da nije bilo slučajeva da su različiti posmrtni ostaci bili identifikovani kao ista žrtva. U ovoj fazi smo kritički preispitali tu pretpostavku. Sravnjeni su zapisi sa istovetnim imenima kod kojih je kao mesto smrti navedeno isto selo, a starosna dob bila ista (ili nije bila navedena). Međutim, čak i ako su imena bila istovetna, ali su zabele`ene starosne dobi bile različite, zapisi nisu spajani.

 Ukupno, 232 ekshumaciona zapisa koji su sadržali imena spareni su na ovaj način. To je rezultiralo neto smanjenjem ukupnog broja pojedinačnih ekshumacionih zapisa sa imenima za ovaj broj. Broj anonimnih žrtava povećali smo za isti iznos, zaključujući da su ekhumacioni izveštaji dokumentovali dva tela, ali da su za ta tela sprovedeni drugi oblici indirektne identifikacije, što je dovelo do dvostrukog registrovanja istog lica.

5.4.       Ostala uređivanja konačno utvrđenih podudarnosti

Kad je prikupljen ceo skup podataka, jedan od autora pregledao ga je pet dana. Pri tome je pronašao 329 modifikacije pri sparivanju, kao i 400 ispravaka imena, datuma i mesta. Proces je bio jednostavan: lista se sortira prema ključnom polju (prezime, ime ili mesto) i zatim se skeniranjem traže ponavljanja.[46]

 Navedenih 400 ispravaka prvenstveno se odnosilo na ispravljanje različitih varijanti zapisivanja imena. Na primer, prezime jedne žrtve bilo je "Pashi", što je očigledno pogrešno napisano "Gashi". Posebna pažnja je poklonjena imenima i prezimenima koja su se pojavila samo jednom, jer se pretpostavljalo da bi se moglo raditi o greškama u pisanju.

 U ovoj etapi međusobno su usklađeni imena, datumi i mesta koji su bili očigledno nedosledno vođeni u različitim sistemima podataka. Na primer, bilo je slučajeva kod kojih je cela porodica identifikovana na jednoj lokaciji u ekhumacionim podacima, ali je u drugom izvoru postojao izveštaj koji ih je smeštao u neku drugu opštinu. Proveravajući lokacije, zaključili smo da to nije bio prost slučaj pogrešnog kodiranja. Verujemo da se radi o slučajevima gde su tela pokopana na lokacijama daleko od mesta ubistva.

 Jedan od najizrazitijih primera ove vrste odnosi se na tela sedmoro članova jedne porodice koji su ekhumirani u Donjoj Šipašnici. ABA/CEELI projekat dobio je izveštaj da je njih petoro ubijeno u 70 km udaljenoj Sušici. Preostala dva člana porodice nisu identifikovana ni u jednom od skupova podataka koji su se bazirali na razgovorima. Svih sedam ljudi pripisano je Sušici. Kada su zapisi zasnovani na ekshumacijama protivrečili zapisima iz ostalih skupova podataka, lokacija navedena u razgovoru koriš}ena je pre nego lokacija ekshumacije.

 Neke druge provere bile su kompleksnije. Na primer, otkrili smo dodatne podudarne zapise koji su promakli jer su kodirani na međusobno udaljene lokacije. Kodifikatori nisu u početku sparili zapise budući da je merenje udaljenosti pokazivalo da su mesta smrti međusobno veoma udaljena. Kad smo revidirali listu, otkrili smo da su sela bila u različitim opštinama ali da su nosila isto ime. Na primer, brkana su sela Pogra|e (u opštini Gnjilane) i Pogra|e (u opštini Klina) te su različiti izveštaji o istoj žrtvi kodirani za dve lokacije. Kodifikatori su odbacili mogućnost podudarnosti jer su ta dva sela međusobno udaljena 83 km. Našli smo pet slučajeva takvog tipa.

 Neki su zapisi zahtevali značajnije modifikacije. Kad su završene ispravke imena, pronašli smo 153 zapisa koji su trebali biti spareni tokom samosravnjivanja. Konačno, 176 novih podudarnosti pronađeno je posle uređivanja. Svaki od ovih zapisa objedinjen je sa svojim novim parnjacima, čime se povećao broj izvora u kojima su nađeni.

 Iako je moguće da još uvek ima neotkrivenih dvostrukih zapisa, verujemo da ih je veoma malo. Kad smo završili konačni pregled, proverili smo koliko su nam puta promakli podudarni zapisi koje je trebalo da pronađemo uz pomoć naših pravila za početno sravnjivanje. Otkrili smo 97 novih podudarnih zapisa koji su teoretski mogli da budu pronađeni pomoću izvornih pravila za sravnjivanje. To pretstavlja stopu greške u našem početnom procesu koja iznosi manje od 2%. Tako nizak stepen greške jeste razlog zbog kojeg verujemo da su, nakon završne etape sravnjivanja opisane u ovom Odeljku, eventualne preostale greške zanemarljive.

6.             Konačni sažetak rezultata podataka

Da bismo saželi rezultate koraka za obradu podataka, pogledaćemo rezultate postignute po izvorima za pojedinačne zapise. Drugo, ispitaćemo rezultate dobijene povezivanjem različitih izvora, ponovo za pojedinačna ubistva. Treće, ispitaćemo načine kombinovanja podataka o anonimnim ubistvima sa podacima o pojedinačnim smrtnim slučajevima.

6.1.       Obrada podataka prema izvoru za pojedinačne zapise

Ranije smo na Slici 1 naveli brojnosti ulaznih podataka koje smo dobili iz svakog izvora. Sada možemo sumarno da prikažemo broj ubistava imenovanih pojedinaca koje smo dobili kao rezultat nakon početnog i završnog intrasistemskog sravnjivanja. Ovi rezultati su prikazani na Slici 3.

 Izvori koji su se zasnivali na razgovorima smanjeni su za 29%-51%, dok su ekshumacioni podaci smanjeni za 11%. Ono što nije prikazano na Slici 3 jeste stepen do kojeg je proces sravnjivanja i uređivanja poboljšao kvalitet informacija u svim izvorima podataka putem nadopunjavanja informacija između podudarnih zapisa.

6.2.       Obrada podataka među izvorima za imenovane, pojedinačne zapise

Drugi način na koji možemo sažeti rezultate naše obrade podataka jeste da pogledamo ukupan broj pojedinačnih smrtnih slučajeva iz svih izvora, nakon eliminisanja dvostrukog računanja. Broj jedinstvenih pojedinačnih zapisa pronađenih u svakoj kombinaciji podudarnosti prikazan je na Slici 4. On uključuje samo zapise koji su imali valjanu informaciju o datumu, u rasponu od 20. marta do 22. juna. Žrtve koje su ubijene pre 20. marta i posle 22. juna nisu uključene.

 Tabela ukazuje na to da je od ukupnog broja od 4.400 žrtava relativno malo žrtava dokumentovano u tri ili četiri projekta, kao što pokazuju ćelije levo gore. Na primer, samo 27 žrtava dokumentovano je u sva četiri izvora podataka. Ova ćelija nalazi se levo gore na tabeli, na preseku "da-da" reda i "da-da" stupca.

 Ako se pomaknemo niže i nadesno, ćelije pokazuju vrednosti za progresivno manje frekventno dokumentovane žrtve. Na primer, 1.131 žrtva dokumentovana je samo u ekshumacionim podacima.[47] Slika 4 ne uključuje procenu za "ne-ne-ne-ne" ćeliju (koja je označena kao "nije primenjivo"), odnosno, broj ljudi koji nisu individualno dokumentovani ni u jednom od četiri projekta.

 

Slika 3. Pojedinačne brojnosti iz osnovnih izvora, bruto ukupan iznos i neto neduplikovane brojnosti

 

Skup podataka

Bruto pojedinaca

Neduplikovani pojedinci

ABA/CEELI

2.800

1.528

EXH

2.155

1.910

HRW

966

685

OEBS

3.648

1.786

 

Slika 4. Broj pojedinačnih žrtava ubistava, prema dokumentacionom statusu (uključujući i žrtve sa imputovanim datumom smrti)

 

 

ABA

da

da

ne

ne

 

 

EXH

da

ne

da

ne

 

HRW

OEBS

 

 

 

 

Ukupno

da

da

27

32

42

123

 

da

ne

18

31

106

306

 

ne

da

181

217

228

936

 

ne

ne

177

845

1.131

nije primenjivo

 

 

Ukupno

 

 

 

 

4.400

 

6.3.       Procena potpunosti pojedinačnih podataka

Pojedinačne žrtve zacelo su potcenjene. "Ne-ne-ne-ne" ćelija na Slici 4 ne može da bude prazna. Nekoliko je mogućnih metoda kojima se može proceniti broj ubistava koja nisu pojedinačno identifikovana. Podaci o anonimnim grupama pružaju prvu indikaciju da postoji značajan broj žrtava koje nisu dokumentovane među imenovanim pojedincima.

 Grupna procena poređena je sa pojedinačnom procenom za svaku vremensku ili prostornu tačku, kako je opisano u pododeljku 4.5. I ovde smo, držeći se najkonzervativnijeg pravila za objedinjavanje, zbir pojedinaca na svakoj vremensko-prostornoj tački oduzeli od grupnog zbira na toj tački. Time se pretpostavlja da je svaki dokumentovani pojedinac takođe dokumentovan i kao član anonimne grupe. Rezultat oduzimanja je "neto" grupna brojnost, odnosno, broj žrtava identifikovan u anonimnim grupama koji preostaje nakon što se uklone svi potpuno identifikovani pojedinci. To se može interpretirati kao minimalna donja granica broja žrtava koje nisu dokumentovane kao pojedinci. Minimalan, medijanski i maksimalan neto grupni zbir iznosi 2.755, 2.889 odnosno 5.859.

 Nakon sabiranja sa 4.400 pojedinačnih žrtava, brojnosti grupa daju opšte procene koje se kreću od 7.155 do 10.259. Ovim vrednostima procenjen je ukupan broj dokumentovanih žrtava. Iz ovih procena isključene su žrtve koje nisu dokumentovane ni u sklopu grupa ni kao pojedinci, pa ti brojevi još uvek pretstavljaju potcenjen ukupan broj smrtnih slučajeva. Druge metode za procenu ukupnog broja žrtava ubistava izložene su u Dodatku 2.


Dodatak 2: Statistička metodologija i analiza

1.             Uvod

U Dodatku 1 ove studije detaljno je izložen proces kojim je izrađena unakrsna klasifikaciona tablica za broj pojedinačnih žrtava ubistava na Kosovu u periodu od marta do juna 1999. Ukupan broj identifikovanih žrtava naveden u Dodatku 1 iznosi 4.400, a raspon procena ukupnog broja ubistava na osnovu dokumentovanih ubistava neindentifikovanih žrtava iznosi između 7.155 i 10.259. Malo je verovatno da su sva ubistva obuhvaćena procesom prikupljanja podataka koji predstavlja osnovu ovih grubih brojčanih procena. Iz tog razloga, potreban je niz statističkih metodologija da bi se podaci opisani u Dodatku 1 iskoristili za procenu najverovatnijeg broja ubistava na Kosovu u periodu od marta do juna 1999. U Dodatku 2 detaljno je opisana celokupna statistička metodologija koja je potrebna za izvođenje procena koriš}enih u glavnom delu ove studije i logika prema kojoj je izabrana ta metodologija.

 Organizaciona struktura Dodatka 2 jeste sledeća. U Odeljku 1.1, raspravljaju se ograničenja direktnih prebrojavanja kao mere ukupnih ubistava i kretanja ubistava u vremenu i prostoru. Ova ograničenja potakla su korišćenje metoda za procenu višestrukih sistema kako bi se izradio model broja ubistava u vremenu i prostoru. U Odeljcima 2.1. do 2.3. predočeno je nekoliko metoda modeliranja procene višestrukih sistema, a u Odeljku 2.4. raspravlja se o procedurama za izbor modela. Odeljak 3 započinje ispitivanjem valjanosti pretpostavki za ove podatke na kojima su zasnovani modeli opisani u Odeljku 2. Odeljak 3 nastavlja skupom procedura za modeliranje kojim se obrazlažu ove pretpostavke i koji rezultira nizom interno konsistentnih procena za različite nivoe vremenske i prostorne agregacije[48].

 Iako ovaj Dodatak uglavnom dokumentuje naše razmišljanje o načinima procene neprijavljenih žrtava, takođe razmatramo druga pitanja u vezi sa modeliranjem koja su važna za hipoteze koje ocenjuje ova studija. U odeljku 4 data je analiza odnosa između broja ubistava i podataka o OVK-u i NATO-u /? podataka o OVK-a i NATO-a/. Ovaj Dodatak se završava Odeljkom 5, u kojem je izložena kratka analiza osetljivosti izveštaja o datumima smrti opisanih u Dodatku 1.

 

Slika 1: Dokumentovana ubistva tokom vremena

 

639

Faza 1

Faza 2

Faza 3

 

1

 

 

 

 

24.mart 6.april  24. april 11.maj 18.jun

 

1.1.       Ograničenja direktnih opažanja

Direktna procena ubistava dokumentovanih u četiri izvora podataka korišćenih u ovoj studiji iznosi 4.400, a direktna procena intervala ukupnog broja ubistava jeste 7.155 do 10.259.[49] Postoji dobar razlog za verovanje da ove brojke ne predstavljaju tačan broj ubistava na Kosovu u toku navedenog perioda. Ovi podaci su prikupljeni iz niza podataka dobijenih kroz razgovore i u toku ekshumacija. Verovanje da su sva ubistva dokumentovana u ovim izvorima podrazumeva da su sva relevantna tela ekshumirana i identifikovana ili da su kod svih ubistava postojali svedoci i da su ta ubistva naveli u intervjuima, ili pak da su sva ubistva obuhvaćena barem jednim od ovih procesa. Takav scenarij je neuverljiv.

 S obzirom na to da su podaci koji su korišćeni za izradu ove studije nepotpuni, postavlja se pitanje koliko tačno oni odražavaju stvarne obrasce ubistava u prostoru i vremenu. Na Slici 1 prikazana su 4.400 dokumentovana ubistva koja su uvršćena u Sliku 4 u Dodatku 1 po dvodnevnim periodima. Valja primetiti da su karakteristike vremenskog sleda procenjene brojnosti predstavljene u glavnom delu ove studije jasno vidljive u vremenskom sledu sirovih brojnosti prikazanih na Slici 1. Najveći broj ubistava desio se u Fazi 1; količina naglo opada 7. aprila, te se ponovo uzdiže do vrhunca sredinom aprila. Nakon što je u periodu od 23. do 25. aprila opao gotovo na nulu, sled se početkom maja ponovo uzdiže do nekoliko malih vrhunaca.

Ovaj sled sirovih brojnosti može da bude dovoljan da podrži analizu sadržanu u glavnom delu izveštaja ako se pokaže da se prostorno-vremenski obrazac "pravih" brojnosti ubistava na Kosovu tokom perioda od marta do juna 1999. pravilno odražava u dokumentovanim ubistvima koja su unakrsno klasifikovana na Slici 4 Dodatka 1. Nemoguće je direktno uporediti vremenski sled sirovih brojnosti ubistava sa tim "pravim" brojnostima. Međutim, možemo uporediti grupne brojčane podatke opisane u Odeljku 6.3. Dodatka 1 sa pojedinačnim brojčanim podacima. Kako je pokazala analiza neto grupnih podataka u Dodatku 1, bilo je mnogo žrtava koje nisu dokumentovane kao imenovani pojedinci. Ako distribucija podataka o pojedinačnim brojnostima u vremenu i prostoru značajno odstupa od distribucije grupnih podataka, verovatno je da ta distribucija može značajno odstupati od distribucije i od stvarnog broja ubistava.

Stepen sličnosti između distribucija pojedinačnih i grupnih podataka izražen je apsolutnom relativnom razlikom između grupnih i pojedinačnih brojnosti podataka:

 

 

apsolutna relativna razlika =  |grupna brojnost – pojedinačna brojnost| (1)

pojedinačni brojnost 

 

Ako su distribucije u vremenu i prostoru za pojedinačne i grupne brojnosti slične, očekivali bismo da apsolutne relativne razlike definisane jednačinom (1) budu konstantne i da distribucija tih apsolutnih relativnih razlika ima malu standardnu devijaciju. U stvari, ako se izračunaju apsolutne relativne razlike za dvodnevne regionalne brojnosti, 114 od 192 jednake su nuli, što ukazuje na savršeno slaganje između grupnih i pojedinačnih podataka.[50] Međutim, preostalih 78 apsolutnih relativnih razlika varira od 0,01 do 48, sa medijanom od 0,83, sredinom od 2,67 i standardnom devijacijom od 6,48. Zaključili smo da apsolutne relativne razlike nisu konstantne, što ukazuje na to da pojedinačne i grupne brojnosti po dvodnevnim periodima i regijama ne slede istu distribuciju. Stoga moramo pokušati da procenimo "prave" brojnosti ubistava da bismo potvrdili ili opovrgnuli hipoteze izložene u glavnom delu ove studije o distribuciji ubistava na Kosovu u periodu od marta do juna 1999. U Odeljku 2 navedena je statistička tehnologija koja je za to bila potrebna.

2.             Metodološka pozadina

Procena višestrukih sistema ili procena višestrukog ponovnog obuhvata ima dugu istoriju, čiji su začeci procene brojnosti populacija životinja i biljaka u prirodi. Osnovni model obuhvata i ponovnog obuhvata pojavio se najkasnije kod Petersona (1896) i korišćen je u raznim naučnim poljima, uključujući epidemiologiju (vidi International Working Group, 1995a, 1995b), brojnosti opšte populacije (vidi Sekar i Deming, 1949; takođe Hogan, 1993, te Anderson i Fienberg, 2001a), kao i na području ljudskih prava za procenu broja ubistava tokom sukoba u Guatemali između 1960. i 1996. (Ball, 2000b).

2.1.       Procena dvojnih sistema

Najprostija verzija ove metodologije, procena dvojnih sistema, primenjuje se kada su dostupne dve zasebno prikupljene, ali nepotpune liste članova neke populacije. Procena dvojnih sistema oslanja se na tri statističke pretpostavke. Prva pretpostavka je da su liste nezavisne, što se statistički opisuje na sledeći način:

 

Pr(zapis i na listi L1 ½ zapis i na listi L2) = Pr (zapis i na listi L1).

 

Drugim rečima, ako su liste nezavisne, prisutstvo nekog lica na jednoj listi ne predvi|a prisutstvo ili odsutstvo tog lica na drugoj listi. Druga pretpostavka se tiče homogenosti obuvaćane populacije; drugim rečima, da svaki član populacije ima jednaku verovatnoću obuhvata za datu listu. Konačna pretpostavka je da nema grešaka u sravnjivanju lista.

Ako su ova tri opisana uslova ispunjena, tada procena dvojnih sistema predstavlja valjanu metodu procene ukupne brojnosti populacije. Neka xi j, i, j Î š0,1} predstavlja brojnost u dvosmerno-unakrsnoj klasifikacionoj tabeli brojnosti populacije za dve liste, kako sledi:

 

 

 

Lista 2

 

 

 

 

Ulaz

Izlaz

Ukupno

Lista

Ulaz

x11

x10

x1+

1

Izlaz

x01

x00

x0+

 

Ukupno

x+1

x+0

x++ = N

 

 

Ovde x00 predstavlja brojnost članova populacije koji nisu obuhvaćeni nijednom listom, a "+" predstavlja sabiranje brojnosti između lista (npr. x1+ = x11 + x10; x+1 = x01 + x11). Cilj je da se proceni N, ukupna brojnost članova populacije, a tradicionalni procenjivač za N je jednostavno


 

 

(2)


gde je  ceo broj dobijen zaokruživanjem . Može da se pokaže da je procenjivač  dobijen jednačinom (2) izveden pod pretpostavkom da je sledeći identitet tačan:


 

(3)

Problem se javlja kod procene dvojnih sistema ako osnovne pretpostavke o nezavisnosti lista i homogenosti verovatnoća obuhvata ne važe. U tom slučaju, na raspolaganju je nekoliko alternativnih metoda za procenu, ali sve zahtevaju dodavanje barem još jedne liste sistemu.

2.2.       Procena trojnih sistema

Iako u proceni dvojnih sistema postoji u osnovi samo jedna metoda procene, dodavanje jedne liste dopušta veću fleksibilnost modeliranja za trojne sisteme. U ovom pododeljku razmotrićemo nekoliko metoda za procenu trojnih sistema. Prva, čiji su autori Marks, Seltzer i Krótki (1974), koristi kombinaciju procenjivača dvojnih sistema za određivanje . Druga, koja je preuzeta od Bishopa, Fienberga i Hollanda (1975), zasniva se na loglinearnim modelima. Da bi razmatranje bilo potpuno, ukratko ćemo prikazati procenu trojnih sistema putem modela pune i kvazi-simetrije. Temeljna struktura podataka ista je za sve ove metode; procena trojnih sistema oslanja se na trosmerno unakrsno-klasifikacione tabele brojnosti populacije koje su sastavljene na sledeći način:

 

 

 

 

Lista 3

Lista

Ulaz

2

 

 

 

Ulaz

Izlaz

 

Lista 1

Ulaz

Izlaz

x111

x011

x101

x001

x1+1

x0+1

 

 

x+11

x+01

x++1

 

 

 

Lista 3

Lista

Izlaz

2

 

 

 

Ulaz

Izlaz

Ukupno

Lista 1

Ulaz

Izlaz

x110

x010

x100

x000

x1+0

x0+0

 

Ukupno

x+10

x+00

x++0

 

 

Prema ovom načinu beleženja, x000 predstavlja brojnost onih članova populacije koji nisu uključeni ni u jednu od triju lista, dok je svaka od sedam preostalih brojnosti pitanje uočljivosti. Ako se tih sedam brojnosti sabere kao n = x111 + x101 + x011 + x001 + x110 + x100 + x010, dobijamo minimalnu brojnost za ukupnu populaciju. Konačno, neopaženi ukupni broj iznosi N = n + x000.

 

Marks, Seltzer i Krótki

 


Marks, Seltzer i Krótki (1974) na početku primećuju da unutar tri sistema postoji šest mogućnih procenjivača dvojnih sistema: tri koji nastaju kad se uzmu samo zapisi koji se nalaze unutar dve od tri liste:

 

(4)


 

(5)

 


(6)

 

 

 

i tri koji nastaju sažimanjem preko dve liste, čime su iskorišćeni svi podaci za procenu dvojnog sistema:

 

 


(7)


 (8)


 (9)

 

 

Oni nadalje pokazuju da se opšta procena nedostajuće ćelije u problemu trojnih sistema može dobiti kombinacijom svih šest procenjivača dvojnog sistema (4-6) i (7-9). Rezultat toga jeste sledeća jednačina za :

 


 (10)

 

Marks, Seltzer i Krótki zatim napominju da su jednačine (7-9) podložnije zavisnosti od liste nego (4-6), zbog činjenice da u svakoj od jednačina (4-6), pretpostavka o nezavisnosti važi jedino za zapise koji su zabeleženi u dva izvora korišćena u procenjivaču, ali ne i u trećem. Ta manja relaksacija pretpostavke o nezavisnosti čini sledeću procenu   robusnijom u pogledu zavisnosti nego jednačina (10):

 


 

(11)

Bishop, Fienberg i Holland

 

Alternativni pristup trojnim sistemima jeste procena  kroz loglinearno modeliranje (npr. Bishop, Fienberg i Holland, 1975). U nekim strukturama prikupljanja podataka, loglinearno modeliranje može bolje da uzme u obzir zavisnost nego jednačina (11), kao i da dopusti razuman proračun standardne greške u uzorku i statistike prilagođenosti. Stvaranjem loglinearne reprezentacije za očekivane brojnosti, mijk = E(xijk), oblikuje se model za uočljive }elije koji se zatim projicira na neuočljive ćelije. Oblik tog modela je sledeći:

 

log (mijk) = u + u1(i) + u2(j) + u3(k) + u12(ij) + u13(ik) + u23(jk) (12)

 

 uz ograničenja na u-članove (npr. da je njihov zbir nula po svim supskriptima). (12) je standardni model bez interakcije drugog reda ili, drugim rečima, model koji dozvoljava zavisnost između parova lista, ali ne i trosmernu zavisnost lista. Budući da postoji samo sedam potencijalno uočljivih brojnosti po ćelijama, to je zasićeni model trojnih sistema koji savršeno odgovara podacima, tj. procene maksimalne verodostojnosti za očekivane brojnosti iznose .

 Unutar tog okvira, redukovani modeli mogu da se prilagode podacima uklanjanjem parametara iz (12). Obično se ovi parametri pažljivo uklanjaju da bi se osiguralo da je dobijeni loglinearni model hijerarhijski. Drugim rečima, članovi višeg reda mogu se uključiti samo ako se sa njima povezani članovi nižeg reda takođe uključe, tako da parametri višeg reda odražavaju samo odnose višeg reda između lista (vidi Fienberg, 1978).


 Za bilo koji odabrani hijerarhijski loglinearni model, procenjuju se očekivane vrednosti ćelija prema modelu i dobijeni model se projicira na nedostajuću (0,0,0) ćeliju. I za zasićene i za redukovane modele, procena N, , jeste:

 

 (13)

 

 Bishop, Fieneberg i Holland (1975) daju asimptotične jednačine varijanci[51], izvedene d-metodom, za svako  izvedeno putem hijerarhijskih loglinearnih modela za trojne sisteme. Ove jednačine se koriste u ovom dokumentu za stvaranje približnih nominalnih[52] 95-postotnih intervala pouzdanosti za procene koje su izvedene iz loglinearnih modela za trosmerne unakrsne klasifikacione tabele.

 

Ostali modeli

 

I model Marksa, Seltzera i Krótkog i loglinearni modeli uzimaju u obzir zavisnosti između lista. Međutim, ne uzimaju u obzir heterogenost verovatnoća obuhvata. Jedna jednostavna metoda za modeliranje ove heterogenosti jeste stratifikacija ciljne populacije po demografskim karakteristikama (vidi Hogan, 1993). Drugi pristup zasnovan na modelu jeste upotreba kvazisimetrijskih modela (vidi Cressie i Holland, 1983, Fienberg i Meyer, 1983, Holland 1900, Daroch et al., 1993, te Fienberg, Johnson i Junker 1999). Detaljno tehničko objašnjenje ovih modela za procenu trojnih sistema nalazi se u Asher i Fieneberg (2001). Za svrhe ovog dokumenta dovoljno je konstatovati da kod procene trojnih sistema parcijalni kvazisimetrijski modeli daju istovetne rezultate kao i gore opisani loglinearni modeli od šest parametara. Tako je korišćeno nekoliko kvazisimetrijskih modela u proceduri modeliranja opisanoj u Odeljku 3 ovog dodatka. U ovoj studiji se ne razmatraju puni kvazisimetrijski modeli, budući da ne verujemo da je heterogenost obuhvata istovetna u različitim listama.

2.3.       Procena višestrukih sistema

Hijerarhijski loglinearni pristup prirodno se proteže na modeliranje slo`enijih zavisnosti među 4 liste. Ako je n suma svih zapisa uočenih u kombinaciji sve 4 liste, onda je

 

 


 (14)

 

gde je  produkt procenjenih očekivanih vrednosti po ćelijama za sve ćelije čiji supskripti daju sumu neparne vrednosti, dok je produkt procenjenih očekivanih vrednosti po ćelijama za sve ćelije čiji supskripti daju sumu parne vrednosti. Formula (14) je samo generalizacija formule (13) i kao takva predstavlja procenu navjeće verodostojnosti za ukupan broj populacije (vidi Fienberg, 1972).

 Za modele četvorosmerne procene višestrukih sistema koji su uključeni u ovaj dokumenat, intervalske procene za N računaju se pomoću metoda verodostojnosti profila, čiji je autor Cormack (1992), putem programa koji je izradio Matthew Johnson iz Slu`be za testiranje u obrazovanju. Procena verodostojnosti profila skupa pouzdanosti 1 – a za N definisana je kao

 

šN : G2 (N – n) – G2( – n) < c2(1),1 – a } , (15)

 

gde je G2 devijanca modela, a c2(1),1 – a  je 1a kvantil c2(1) distribucije. Budući da se Splusovom glm( ) funkcijom procenjuju polinomni model obuhvata i ponovnog obuhvata pomoću Poissonove verodostojnosti, moramo aproksimovati polinomnu devijancu  iz Poissonove prilago|enosti. Upotrebili smo aproksimaciju koju je predložio Cormack (1992):


 (16)

 

gde je D(z) devijanca modela za loglinearni Poissonov model za 2J kontingencijsku tabelu sa z u nedostajućoj ćeliji.

2.4.       Izbor modela

Uz iznimku modela Marksa, Seltzera i Krótkog, prilagođenost svih modela opisanih u ovoj tački obično se ocenjuje pomoću jedne od sledeće dve statistike:


 

ili


 

Obe ove statistike, Pearsonov hi-kvadrat (X2) i devijanca (G2) imaju približne c2 distribucije sa q stepeni slobode, gde je q broj ćelija u unakrsnoj klasifikacionoj tabeli umanjen za broj parametara koji je uključen u model.[53] Obe statistike daju slične rezultate; međutim, Pearsonov hi-kvadrat je poznatiji. Stoga će se u ovom dokumentu koristiti Pearsonov hi-kvadrat za ocenu prilagođenosti probanih modela, a devijanca za stvaranje nekih intervala pouzdanosti putem metoda verodostojnosti profila.

 Da bi ocenili prilagođenost loglinearnog modela pomoću Pearsonovog hi-kvadrata, treba da uspostavimo ravnotežu da podaci ne bi bili ni preterano ni nedovoljno prilagođeni. To se postiže tako da se prihvataju samo modeli čija Pearsonova hi-kvadrat statistika, kada se uporedi sa c2 distribucijom prikladnog broja stepeni slobode, daje p-vrednost unutar zadanog raspona. Standardni donji prag za p-vrednost za Pearsonov hi-kvadrat iznosi 0,05; modeli sa p-vrednostima nižim od ovog praga ne odgovaraju dovoljno dobro podacima, pa se odbacuju. U kontekstu dostupnih modela treba takođe da se odredi prikladna gornja granica koja je potrebna da bi se sprečilo preterano prilagođavanje.

3.             Metodologija

Ciljevi statističkih analiza koje su preduzete u okviru ove studije su sledeći:

 

1.      Razvoj globalne procene broja ubistava.

 

2.      Procenjivanje broja ubistava unutar svakog od četiri regiona za svaki dvodnevni vremenski period između 20.-21. marta i 22.-23. juna.

 

3.      Analiza odnosa između broja ubistava za svaki dvodnevni vremenski period i aktivnosti OVK-a i NATO-a.

 

 Komplikovan je razvoj modela i analiza potrebnih za ostvarenje ovih ciljeva. U ostatku ovog odeljka daće se pregled, prema redosledu, metodoloških koraka preduzetih da bi se dovršile procene potrebne za ostvarivanje ciljeva 1 i 2. U odeljku 4 biće reči o cilju 3.

3.1.       Analiza eksploratornih podataka

Analiza eksploratornih podataka u kontekstu procene višestrukih sistema javlja se u dva oblika. Prvi oblik analize je istraživanje moguće zavisnosti među listama i heterogenosti kroz direktnu analizu karakteristika lista. Na primer, analizujući obrasce prikupljanja podataka po listi, vremenu i mestu, možemo da očekujemo izvesni uvid u kompleksnost procedure modeliranja koju zahteva procena. Drugi oblik analize je poređenje nekoliko rezultata zasićenih modela procene višestrukih sistema niskog nivoa. Moramo pažljivo da razjasnimo da ovi modeli, zbog činjenice da su zasićeni, ne predstavljaju kandidate za našu proceduru procene. U ovom momentu nas ne interesuje vrednost procena dobijenih tokom naše analize; samo želimo da utvrdimo međusobni odnos ovih procena. Na taj način su modeli prilagođeni tokom ove procedure samo eksplanatorni, ali ne i konfirmativni. Kad završimo analizu eksploratornih podataka, započećemo proceduru za procenu.

 

Slika 2: Postotak dokumentovanih ubistava, prema izvoru podataka i opštini

 

 

Regija

ABA

EXH

HRW

OEBS

1

24,6

32,9

24,6

22,5

2

33,4

22,1

 3,5

45,6

3

11,8

15,1

28,2

11,9

4

30,3

30,1

43,5

20,2

 

 

Direktna analiza liste

 

Da bismo razumeli prostornu i vremensku heterogenost za četiri liste, analiziraćemo obrasce prikupljanja podataka. Slika (2) prikazuje obrasce prikupljanja podataka za svaku od četiri liste prema regiji.[54] Postoci pretstavljaju udeo dokumentovanih ubistava za datu listu unutar svake opštine ili regiona. Treba primetiti da liste imaju veoma različite obrasce prikupljanja podataka; na primer, HRW pokriva proporcionalno manje regiju 2 i proporcionalno više regiju 4 nego druge liste. To ukazuje na to da postoji heterogenost lista koja se može rešiti stratifikacijom po regijama.

 Može da se izvrši slična analiza kako bi se odredili obrasci prikupljanja podataka po listama tokom vremena. Slika (3) prikazuje obrasce prikupljanja podataka za svaku od četiri liste tokom dvodnevnih vremenskih perioda, gde postoci predstavljaju udeo dokumentovanih ubistava za datu listu u svakom vremenskom periodu. Periodi u tabeli predstavljaju vremenske odsečke koji su od interesa za glavni deo ove studije. I ovde se čini da HRW sledi drugačiju distribuciju prikupljanja podataka tokom vremena od drugih lista, što ukazuje na heterogenost lista koja se može rešiti stratifikacijom po vremenu.

 

 

Eksploratorna procena dvojnih i trojnih sistema

 

Zavisnost i heterogenost lista mogu da se istražuju direktno, pomoću statističkog aparata za procenu višestrukih sistema. Pomoću  parova lista može da se oblikuje šest procena dvojnih sistema za globalni broj ubistava, tako što se utvr|uje koliko se blisko podudaraju. Tih šest procena prikazano je na Slici (4).

 

Slika 3: Postotak dokumentovanih ubistava, prema izvoru podataka i dvodnevnom vremenskom periodu

 

Vremenski period

ABA

EXH

HRW

OEBS

20. – 23. marta

2,1

1,8

1,6

2,9

24. marta – 5. aprila

59,4

57,8

67,1

54,5

7. – 23. aprila

21,0

23,0

11,1

27,7

25. aprila – 9. maja

11,0

9,2

10,6

10,3

11. maja – 18. juna

6,6

8,5

9,4

4,4

 

 

Slika 4: Procene dvojnih sistema

 

 

EXH

HRW

OEBS

ABA

7.245

9.689

5.970

EXH

 

6.777

7.135

HRW

 

 

5.461

 

 

Treba primetiti da sve osim dveju ovih procena padaju ispod n = 7.155, što je najniža procena ukupnog broja dokumentovanih ubistava. To upu}uje na visok stepen pozitivne zavisnosti između lista, što broj ubistava koja su zabeležena na obe liste (u x11 ćeliji) čini višim, a opšte procene stoga nižim. Izuzeci su procena dvojnih sistema pri kojoj su korišćene dve liste, ABA i EXH, i procena dvojnih sistema pri kojoj su korišćene dve liste, ABA i HRW. Uz to, čini se da postoji izvesna varijabilnost između procena (one se protežu od 5.461 do 9.689), što ukazuje na heterogenost pozadinskih obuhvata verovatnoća.

Ako pogledamo  zasićene procene trojnih sistema, dobijamo veći uvid u viši stepen zavisnosti između lista. Na Slici 5 navedene su ove procene.

 

Rezultati obećavaju malo više: nestale su pozitivne zavisnosti između lista koje su bile očigledne na dijagramu procene dvojnih sistema, što ukazuje na to da su zavisnosti između lista dobro modelirane dvosmernim interakcionim članovima. Međutim, treba ista}i istaknuti da je procena ABA-e, EXH-a i OEBS-a preterano velika u odnosu na ostale procene, što ukazuje na postojanje nekih negativnih zavisnosti višeg reda za ovaj skup sistema, dok se procena EXH-a, HRW-a i OEBS-a čini donekle niskom, što ukazuje na postojanje pozitivnih zavisnosti višeg reda među ovim listama.

 

Slika 5: Procene trojnih i četvorosmernih sistema (zasićene)

 

Liste

ABA, EXH, HRW

11 818

ABA, EXH, OEBS

22 331

ABA, HRW, OEBS

12 252

EXH, HRW, OEBS

8 014

ABA, EXH, HRW, OEBS

12 565

 

I direktna analiza obrazaca prikupljanja podataka i istraživanje obrazaca u procentima dvojnih i trojnih sistema ukazuje na to da između lista postoji visok stepen zavisnosti i heterogenosti. Stoga je prikladno da se za punu unakrsnu klasifikacionu tabelu prikazanu na Slici 4 Dodatka 1 istraži komplikovana procena četvorosmernih višestrukih sistema. U Odeljku 3.2. opisuje se procedura izbora koja je korišćena za određivanje modela najvišeg nivoa za globalnu[55] brojnost ubistava.

3.2.       Prilagođavanje i izbor modela za ukupan broj ubistava

Postoji 113 mogućnih hijerarhijskih loglinearnih modela za četvorosmernu unakrsnu klasifikacionu tabelu prikazanu na Slici 4 Dodatka 1, ali samo njih devet daje Pearsonov hi-kvadrat sa p-vrednošću većom od 0,05. Radi potpunosti, ovih devet modela prikazano je na Slici 6. Sistem obeležavanja koji je korišćen za predstavljanje modela je sledeći: interakcioni članovi predstavljeni su kao zajednički pomnožene liste; npr; ABA*EXH*HRW predstavlja trosmerni interakcioni član ovih lista. Budući da su izloženi modeli hijerarhijski, svaki izloženi interakcioni član takođe predstavlja svoje članove nižeg reda; npr; ABA*EXH*HRW predstavlja skup članova šABA, EXH, HRW, ABA*EXH, ABA*HRW, EXH*HRW i ABA*EXH*HRW}.

 Pet modela (1-4 i 7) imaju p-vrednosti iznad 0,30, dok ostalih četiri ima p-vrednosti između 0,06 i 0,08. S obzirom na ovu činjenicu, čini se logičnim da se izabere 0,3 kao gornja granica za p-vrednost kako bi se izbeglo preterano prilagođavanje. Nakon toga, ostaje nam zadatak da izaberemo najbolji od preostala četiri modela (5, 6, 8 i 9). Najlakše bi bilo prosto uzeti model sa najnižim Pearsonovim hi-kvadratom. Međutim, ako tako uradimo, zanemarićemo drugu dobru meru za modele – ekonomičnost, koja se meri minimalizacijom broja parametara odnosno maksimalizacijom stepeni slobode. Minimalizacija Pearsonovog X2 težiće ka modelima sa najtešnjom prilagođenošću i stoga najkompleksnijim modelima. Kao mogući kompromis između `elje da se izabere najbolje prilagođen model i `elje da se stvori najjednostavniji model za naš "najbolji" model izabrali smo onaj koji ima minimalno korigovan Pearsonov hi-kvadrat, X2/d, gde je d broj stepeni slobode. Pomoću ove statistike, izabran je model (9), koji daje globalnu procenu od 10.356 ubistava, sa 95-postotnim intervalom pouzdanosti (9.002, 12.122). Ovaj model daje konzervativnu procenu, budući da samo jedan model na Slici 6 daje niži .

3.3.       Agregacija unakrsnih klasifikacionih tabela za objašnjenje oskudnosti

Sledeći cilj ove analize jeste procena broja ubistava za svaku od 192 prostorne/vremenske tačke koje predstavljaju 48 dvodnevnih perioda i četiri geografske regiona. Da bi se to izvršilo, ćelije na Slici 4 Dodatka 1 moraju da se deagreguju u 192 unakrsne klasifikacione tabele. Nastojanje da se provede ova deagregacija pokazalo se prilično problematičnim. U koloni 4 Slike 7 navedene su frekvencije dvodnevnih unakrsnih klasifikacionih tabela sa 0-15 nula ćelija. Treba primetiti da, prema opštem pravilu, maksimalan broj nula ćelija koji dopušta valjano loglinearno modeliranje za procenu četvorosmernih višestrukih sistema iznosi 10; to dopušta po jednu brojnost koja nije jednaka nuli za svaki od parametara modela nezavisnosti. Od 192 dvodnevne tabele, njih 122 (64%) sadrži više od 10 nula ćelija. Uz to, oskudnost tabela koje dopuštaju procenu višestrukih sistema, a sadrže velik broj nula ćelija, može dovesti do iskrivljene procene.

 

Slika 6: Rezultati za modele globalne brojnosti ubistava

 

 

Model

Statistika prilagođenosti

Verodostojnost profila

X2

d

Pr.

Dev

95% C.I.

1

ABA*EXH*HRW+

ABA*EXH*OEBS+

EXH*HRW*OEBS

13.760

0,6

1

0,434

0,603

(9.695, 20.752)

2

ABA*EXH*HRW+

ABA*HRW*OEBS+

EXH*HRW*OEBS

22.923

0,8

1

0,386

0,755

(18.122, 29.394)

3

ABA*EXH*OEBS+

ABA*HRW*OEBS+

EXH*HRW*OEBS

13.467

0,9

1

0,337

0,917

(9.030, 21.419)

4

ABA*EXH*OEBS+

EXH*HRW*OEBS+

ABA*HRW

12.845

1

2

0,603

1,014

(9.700, 17.979)

5

ABA*HRW*OEBS+

EXH*HRW*OEBS+

ABA*EXH

20.734

4,9

2

0,085

4,964

(16.813, 25.889)

6

ABA*EXH*HRW+

EXH*HRW*OEBS+

ABA*OEBS

20.550

5,4

2

0,068

5,269

(16.708, 25.585)

7

ABA*EXH*OEBS+

EXH*HRW*OEBS

12.741

1,0

3

0,796

1,021

(10.202, 16.742)

8

ABA*OEBS*EXH +

HRW*EXH+

HRW*ABA+ HRW*OEBS

9.824

7,2

3

0,065

7,063

(8.449, 11.632)

9

ABA*OEBS*EXH +

HRW*OEBS+

HRW*EXH

10.356

8,9

4

0,063

9,333

(9.002, 12.122)

X2 = Pearsonov hi-kvadrat, d = stepeni slobode, Pr. = p-vrednost

Dev. = preostala devijanca, C.I. = interval pouzdanosti

 

 

Slika 7: Brojevi nula ćelija za četvorosmerne tabele

 

Broj nula ćelija

Po šestodnevnom periodu

Po četvorodnevnom periodu

Po dvodnevnom periodu

0

3

1

0

1

0

2

2

2

5

5

5

3

1

2

3

4

2

2

2

5

5

5

3

6

7

4

4

7

4

7

11

8

4

9

11

9

4

7

16

10

3

4

13

11

3

5

11

12

2

5

11

13

10

10

14

14

5

14

35

15

6

14

51

 

 

Sažimanje na 24 četvorodnevna perioda u četiri regiona daje 96 unakrsnih klasifikacionih tabela; od toga 48 (50%) sadrži više od 10 nula ćelija. Sažimanje na 16 šestodnevnih perioda u četiri regiona daje 64 unakrsne klasifikacione tabele; od toga 26 (41%) sadrži više od 10 nula ćelija. Daljnje sažimanje omelo bi željenu analizu.

Drugu opciju za sažimanje preko vremenskih tačaka daje sažimanje preko lista. Postoji  mogućnih trosmernih unakrsnih klasifikacionih tabela za svaku četvorosmernu unakrsnu klasifikacionu tabelu. To daje trosmerne unakrsne klasifikacione tabele od kojih svaka predstavlja dvodnevni interval, regiju i "sistem" lista. U ovom slučaju, više od tri nule sprečiće loglinearno modeliranje za procenu trojnih sistema. Na slici 8, sistemi se kreću u rasponu od 117 i 142 tabele sa više od tri nule, što rezultira time da je barem 70% ukupnih tabela između četiri sistema preoskudno za procenu trojnih sistema. Ovaj postotak je donekle zavaravajući, jer je svaka prostorna i vremenska tačka predstavljena pomoću četiri unakrsne klasifikacione tabele (po jedna za svaku listu). Stvarna pokrivenost prostornih/vremenskih tačaka pomoću ovih 768 tabela može da iznosi znatno više od 30%.

Čini se da je procena trojnih sistema na nivou dvodnevnih perioda i regija komplikovana, te je potrebna kombinacija smanjivanja unakrsnih klasifikacionih tabela (s četvorosmernih na trosmerne) i sažimanja po dvodnevnim periodima. Na Slikama 9 i 10 date su brojnosti nula za unakrsne klasifikacione tabele za četvorodnevne, odnosno šestodnevne periode.

Sažimanje na šestodnevne periode unutar trosmernih unakrsnih klasifikacionih tabela čini se kao prihvatljivo rešenje za oskudnost podataka. Iako na ovom nivou agregacije još uvek postoji velik broj oskudnih unakrsnih klasifikacionih tabela, redundantnost četiri trosmerna sistema omogućava da većina šestodnevnih vremenskih i regionalnih tačaka bude procenjiva. Neprocenjive vremenske i prostorne tačke uglavnom se javljaju kasnije u vremenskom rasponu od 96 dana, gde postoji manji interes za razumevanje tendencija podataka. Uz to, sažimanje dvodnevnih tabela po regiji unutar trosmernih unakrsnih klasifikacionih tabela omogućiće modeliranje na istančanijem vremenskom nivou, što će omogućiti bolje razumevanje opštih vremenskih tendencija u podacima. U Odeljcima 3.4. i 3.5. ovog Dodatka biće izložena dva skupa procena, koji će se zatim upoređivati u Odeljku 3.6.

 

Slika 8: Brojnosti nula ćelija za trosmerne tabele (dvodnevni period)

 

Brojnost nula ćelija

ABA, EXH i HRW

ABA, EXH i OEBS

ABA, HRW i OEBS

EXH, HRW i OEBS

0

10

29

7

12

1

4

14

9

6

2

16

15

13

13

3

20

17

22

16

4

25

17

28

27

5

26

14

20

17

6

35

34

39

33

7

56

52

54

64

 

 

Slika 9: Brojnosti nula ćelija za trosmerne tabele (četvorodnevni period)

 

Brojnost nula ćelija

ABA, EXH i HRW

ABA, EXH i OEBS

ABA, HRW i OEBS

EXH, HRW i OEBS

0

10

28

9

10

1

3

7

5

8

2

14

6

13

8

3

15

11

14

16

4

10

6

13

6

5

13

9

9

10

6

16

15

17

15

7

15

14

16

23

 

Slika 10: Brojnosti nula ćelija za trosmerne tabele (šestodnevni period)

 

Brojnost nula ćelija

ABA, EXH i HRW

ABA, EXH i OEBS

ABA, HRW i OEBS

EXH, HRW i OEBS

0

10

23

9

11

1

3

7

6

8

2

13

4

10

7

3

10

7

11

10

4

4

2

5

2

5

11

9

7

6

6

6

6

9

11

7

7

6

7

9

 

3.4.       Globalno prilagođavanje modela među svim vremensko-prostornim tačkama

Ova je analiza je započeta izradom globalne procene broja ubistava, koji je procenjen pomoću četvorosmernog modela za procenu višestrukih sistema prilagođenog prema Slici 4 Dodatka 1. Jedna opcija za modeliranje brojnosti na pojedinačnim prostornim/vremenskim tačkama jeste da se izgradi opšti linearni model u kojem se procenjuju parametri koji predstavljaju svaku pojedinu vremensku/prostornu tačku kao i parametri povezani sa odabranim modelom globalne procene višestrukih sistema, sa modelom 9 na slici 6.. Ovaj opšti model projektovaće globalni model sve do deagregovanih tačaka, što će omogućiti potpunu proceduru modeliranja za ceo sistem procena.

 Da bi se izvršilo podešavanje zbog oskudnosti, podaci su sažeti na šestodnevne vremenske tačke, a uključeno je samo prvih deset od ovih tačaka56. Rezultat je 71-parametarski model prilagođen brojnostima ubistava, sa matricom indikatorskih varijabli koje služe kao prediktori, od 70 stubaca. Iako ovi rezultati upućuju na zanimljive trendove, p-vrednost za Pearsonovu X2 statistiku je beznačajan. Taj nedostatak prilađenosti može da se objasni na sledeći način: iako globalni model dobro opisuje deagregovanu tabelu, on ne daje dobar opis svake prostorne/vremenske tačke. Opšti generalizovani linearni model omogućava da jedan model interakcija među listama opiše odnose među listama za svaku prostornu/vremensku tačku; heterogenost prostornih/vremenskih tačaka čini ovaj model neuspešnim na lokalnom nivou.

 Rešenje je da se omogući da opšti generalizovani linearni model sadrži parametre lista za svaku prostornu/vremensku regiju; počevši od potpuno zasićene matrice 14 listovnih parametara * 40 prostornih/vremenskih tačaka + 40 prostornih/vremenskih indikatora, može da se primeni stepenasta procedura za izbor 40 modela koji najbolje opisuju 40 prostornih/vremenskih tačaka. To je ekvivalentno vođenju 40 odvojenih generalizovanih linearnih modela, osim što statistika prilagođenosti za opšti model meri prilagođenost celog sistema, dok statistike prilagođenosti za 40 lokalnih modela mere svaku prilagođenost zasebno. Očigledno je jednostavnije voditi odvojene loglinearne modele za svaku vremensku/prostornu tačku. Ova procedura za procenu po delovima višestrukih sistema biće detaljnije raspravljena u Odeljku 3.5.

3.5.       Modeliranje po delovima među vremenskim i prostornim tačkama

Usled oskudnosti podataka, primena modela za procenu četvorosmernih višestrukih sistema, čak i sa podacima koji su agregovani u šestodnevne periode, daće vrlo malo modela koji su prihvatljivi sa stanovišta prilagođenosti. Sažimanje na procene dvojnih sistema daje modele za koje ne postoji merenje prilagođenosti, te za koje znamo da pretpostavke o nezavisnosti i homogenosti ne va`e. Rešenje koje preostaje - procena trojnih sistema – na svoj je način složeno. Postoji  = 4 mogućnih trosmernih sistema, a unutar svakog sistema postoji 8 mogućnih modela. Rezultat toga su do 32 modela za svaku od 64 vremenske i prostorne tačke.

 Potrebno je odrediti pravilo izbora prema kojem se može odabrati "najbolji" model. Sledeći skup pravila - jedan za dvodnevne tabelarne modele i jedan za šestorodnevne tabelarne modele prema regiji - odražava proceduru izbora za opšti model, uz jednu važnu razliku: izbor gornje granice za p-vrednost Pearsonovog hi-kvadrata. Pomicanje gornje granice previsoko dovešće do preterane prilagođenosti modela, ali pomicanjem granice nadole naposletku se odbacuju svi modeli za neku vremensku i/ili prostornu tačku. Stoga je odabrano da gornja granica p-vrednosti za svaki od dva skupa modela bude što manja, uz istovremeno što veći broj prostornih/vremenskih tačaka koje se procenjuju. Za šestodnevne modele prema regionu, p-vrednost iznosi 0,7, a za dvodnevne modele, p-vrednost je 0,5.

 Pravila izbora modela za dvodnevne procene su sledeća:

 

·        Ukloniti sve modele za koje  < x++++ (zadržano je 1132 od 1402 modela).

·        Ukloniti sve modele za koje  > 10.356 (zadržano je 974 od 1132 modela).57

 

·        Ukloniti sve modele za koje p < 0,05 (zadržano je 657 od 974 modela).

 

·        Ukloniti sve modele za koje p > 0,5 (zadržano je 247 od 657 modela).

 

·        Odabrati model sa najnižim prilagođenim Pearsonovim hi-kvadratom.

·        Ako ne postoji nijedan takav model, onda  < x++++.

 

 Pravila izbora modela za šestodnevne procene su sledeća:

 

·        Ukloniti sve modele za koje  < x++++ (zadržano je 1455 od 1856 modela)

·        Ukloniti sve modele za koje  > 10.356 (zadržano je 1235 od 1455 modela)

 

·        Ukloniti sve modele za koje p < 0,05 (zadržano je 876 od 1235 modela).

 

·        Ukloniti sve modele za koje p > 0,7 (zadržano je 381 od 856 modela).

 

·        Odabrati model sa najnižim prilagođenim Pearsonovim hi-kvadratom.

·          Ako ne postoji nijedan takav model, onda  < x++++.

 

3.6.       Projekcija dvodnevne serije vremenskih tačaka na šestodnevnu seriju vremenskih tačaka za svaki region

Ciljevi izneseni na početku ovog odeljka uključivali su stvaranje procena za svaki dvodnevni vremenski period između 20.-21. marta i 22.-23. juna unutar svakog regiona. Do ove tačke, napravljene su procene za šestodnevne periode unutar regiona, kao i procene za dvodnevne periode agregovane po regionima. Niz dvodnevnih procena za svaki region može da se izradi iz ovih dvaju odvojenih skupova procena na sledeći način:

 

·        Svaka šestodnevna procena na regionalnom nivou projektuje se na tri dvodnevne procene na globalnom nivou. Neka t Î (1,16) označava šestodnevni interval, a t1, t2 i t3 označavaju dvodnevne intervale povezane s t. Neka tr označava procenu za šestodnevni interval t i regiju r. Naposletku, neka  označava procenu za dvodnevni interval tj i regiju r.

 

·       

Za šestodnevnu procenu tr, treba napraviti proporciju za svaku od tri dvodnevne procene na sledeći način:

 

 (17)

 

·        Treba oblikovati dvodnevnu procenu za ti, region r, kako sledi:


 (18)

 

Rezultirajuće dvodnevne procene za region r predstavljaju mešavinu informacija o regionalnom i globalnom trendu u podacima.

3.7.       Poređenje rezultata globalnog i pojedinačnog modeliranja

Na Slikama 11 i 12, zajedno su grafički prikazane procene pojedinačnih i opštih modela brojnosti ubistava, uz intervale pouzdanosti za pojedinačne procene. Ovi grafički prikazi imaju dve ohrabrujuće karakteristike. Prva je da su procene izvedene iz opšteg modela prilično slične procenama izvedenim iz pojedinačnih modela; obe sugerišu iste vremenske trendove u obliku talasa ubistava. Druga je da oblik područja pouzdanosti, formiranih oko procena pojedinačnih modela, održava oblik krivulja dobijenih procenama. Ako se bilo koja tačka u intervalima pouzdanosti uzme kao prava brojnost ubistava, time se neće ukloniti ovi trendovi.

 Još jedna ohrabrujuća karakteristika rezultata višestrukih oblika procedura modeliranja jeste koliko dobro procene slede jedna drugu. Na Slici 13 prikazano je nekoliko verzija agregovanih procena iz četiri različite provedene procedure modeliranja. Sve opšte procene ukupnog broja ubistava su unutar intervala pouzdanosti procene globalnog modela; neke agregovane procene su sasvim blizu broja 10.356. Opšti trendovi tokom vremena čine se sličnim kako kod procena šestodnevnog perioda agregovanih po regionima tako i kod procena dvodnevnog perioda agregovanih po vremenu. Čini se da sistem modela dobro funkcioniše.

 Kao konačna provera kvaliteta procedure modeliranja napravljene za ovu studiju, procene koje su proizvedene u svakom sistemu modeliranja upoređene su sa procenama proizvedenim uzimanjem proseka četiri procene trojnih sistema Marksa, Seltzera i Krótkog, koje su date jednačinom (11). Na Slici 14 navedeno je koliko puta procena Marksa, Seltzera i Krótkog pada unutar intervala pouzdanosti delimične procene. Čini se da se dve procene bolje slažu na nižim nivoima agregacije u prostoru i vremenu. To ne iznenađuje; iako model Marksa, Seltzera i Krótkog objašnjava određen stepen zavisnosti između lista, on nije onoliko fleksibilan koliko su fleksibilni hijerarhijski loglinearni modeli. Kao takav, bolje će da funkcioniše ako je heterogenost blaga ili je nema.

 

Slika 11: Procena broja ubistava tokom vremena, sa nominalnim intervalom pouzdanosti

 

 

1939

Faza 1

Faza 2

Faza 3

 

 

 

Pojedinačna procena

 

 

 

Opšta procena

14

 

 

 

 24. mart 6. april 24. april 11. maj

 

3.8.       Analiza odnosa između originalnih lista, složenosti modela izabranih pomoću pravila selekcije, te vremena i prostora

Do ove tačke u ovom dodatku koncentrisali smo se na izradu procena brojnosti ubistava. Međutim, moguća je interesantna sporedna analiza odnosa odnosa između lista usled prirode procedure izbora modela za pojedinačne procene. Vršenjem ove analize i njenim upoređivanjem sa obrascima datim u Odeljku 3.1, dobićemo uvid u to koliko je dobro procedura pojedinačnog modeliranja podešena prema obrascima prostorne i vremenske heterogenosti.

 Na Slici 15 navedeni su izvorni sistemi za svaku od šestodnevnih procena po regionima i dvodnevnih procena. Prva kolona brojnosti pokazuje broj procena izvedenih iz svakog od tri sistema lista; drugi stupac brojnosti iskazuje broj procena, kojima je ta lista pridonela. Iako se čini da je svaka lista pridonela otprilike istom broju procena, sistem ABA, EXH i OEBS verovatno daje najveći ukupni broj procena. To je i logično s obzirom na strukturu lista koje su u osnovi procene. HRW je primenjivao drugačiju strategiju prikupljanja podataka, što je dovelo do razlike kako u vremenu tako i u prostoru, čime je pove}ana heterogenost listovnih sistema koji su je sadr`avali. Takođe, Human Rights Watch oslanjao se na istraživačku strategiju prikupljanja podataka kojom se stvara drugačiji skup pojedinačnih verovatnoća obuhvata nego kod strategije nabrajanja koju su primenjivale druge organizacije58.

 

Slika 12: Procena broja ubistava sa nominalnim intervalom pouzdanosti, prema regionu tokom vremena (šestodnevni periodi projektovani na srednji dan perioda)

 

 

Sever

 

 

 

2708

 

 

 

 

 

 

Pojedinačna procena

 

 

 

Opšta procena

2

 

 

 

24. mart 6. april  24. april 11. maj 18. jun

 

Istok

 

 

 

712

 

 

 

 

 

 

Delimična procena

 

 

 

Opšta procena

1

 

 

 

24. mart 6. april  24. april 11. maj 18. jun

 

Jug

 

 

 

1084

 

 

 

 

 

 

Pojedinačna procena

 

 

 

Opšta procena

2

 

 

 

24. mart 6. april 24. april 11. maj 18. jun

 

Zapad

 

 

 

2.511

 

 

 

 

 

 

Pojedinačna procena

 

 

 

Opšta procena

2

 

 

 

24. mart 6. april  24. april 11. maj 18. jun

 

Slika 13: Poređenje procena prema različitim procedurama modeliranja

 

 

 

Pojedinačni modeli

 

Opšti model

 

 

Područje

Šestodnevni period unutar regiona

 

Dvodnevni period

 

 

Globalno

 

 

Direktni GLM

Global

10.548

9.375

10.356

10.004

Region 1

3.925

 

 

2.748

Region 2

1.827

 

 

2.863

Region 3

1.608

 

 

1.393

Region 4

3.188

 

 

3.000

20. marta-25. marta

1.048

1.372

 

1.538

26. - 31. marta

3.502

2.322

 

3.203

1. - 6. aprila

2.426

1.735

 

1.557

7. - 12. aprila

472

280

 

571

13. - 18. aprila

1.144

1.312

 

1.411

19. - 24. aprila

373

227

 

271

25. - 30. aprila

175

246

 

322

1. - 6. maja

542

479

 

526

7. - 12. maja

157

216

 

238

13. - 18. maja

266

538

 

178

19. - 24. maja

64

124

 

61

25. - 30. maja

275

357

 

62

31. maja - 5. juna

62

128

 

23

6. - 11. juna

13

13

 

13

12. - 17. juna

25

25

 

25

18. - 23. juna

2

2

 

2

 

 

Slika 14: Poređenje procena Marksa, Seltzera i Krótkog sa procenama prema drugim procedurama modeliranja

 

 

 

Pojedinačni modeli

 

Status procena Marksa, Seltzera i Krótkog

Šestodnevni period unutar regiona

Dvodnevni period

Global

ispod 95% intervala pouzdanosti

6

3

1

unutar 95% intervala pouzdanosti

30

22

 

Iznad 95% intervala pouzdanosti

10

10

 

Nedostaje/neprocenjivo

12

9

 

 

 

Slika 15: Odnos između kriterijuma izbora modela i lista

 

Šestodnevni sistem X regiona

Izabrani modeli

 

Lista

Izabrani modeli

ABA, EXH, HRW

10

 

ABA

33

ABA, EXH, OEBS

14

 

EXH

37

ABA, HRW, OEBS

9

 

HRW

32

EXH, HRW, OEBS

13

 

OEBS

36

Ukupno

46

 

 

Ukupno od 46

 

Dvodnevni sistem

Izabrani modeli

 

Lista

Izabrani modeli

ABA, EXH, HRW

7

 

ABA

28

ABA, EXH, OEBS

13

 

EXH

27

ABA, HRW, OEBS

7

 

HRW

22

EXH, HRW, OEBS

8

 

OEBS

28

Ukupno

35

 

 

Ukupno od 35

 

Slika 16: Odnos između kriterijuma izbora modela i lista po regionu

 

Šestodnevni

Regioni

sistem X regiona

1

2

3

4

Ukupno

ABA, EXH, HRW

2

2

3

3

10

ABA, EXH, OEBS

4

5

3

2

14

ABA, HRW, OEBS

2

3

2

2

9

EXH, HRW, OEBS

4

2

1

6

13

Ukupno

12

12

9

13

46

 

 

Regioni

Lista

1

2

3

4

Ukupno

ABA

8

10

8

7

33

EXH

10

9

7

11

37

HRW

8

7

6

11

32

OEBS

10

10

6

10

36

Ukupno

36

36

27

39

138

 

Prostorne i vremenske zavisnosti liste mogu da se primete u obrascima sistema odabranim za procene u pojedinim regionima ili vremenskim intervalima. Sledeće dve tabele, prema redosledu, pokazuju brojnosti sistema koje pridonose procenama najprije prema regionu, a zatim vremenu. I ovde su prikazani zbirovi broja procena kojima je pridonela svaka lista, kao i broj procena kojima je pridonela svaka lista. Šest procena kojima su pridoneli EXH, HRW i OEBS u Regionu 4 posebno su interesantne. Gotovo polovina modela ovih sistema nalaze se u Regiji 4, a polovina modela u Regiji 4 su iz ovog sistema. Takođe je od interesa obrazac dvaju HRW,OEBS sistema tokom vremena; dok je doprinos drugih sistema grubo uzev, ve}i u početku nego kasnije, ABA, HRW, OEBS pridonose najviše prema sredini vremenskog okvira. Ovi obrasci odražavaju neke od prostornih i vremenskih zavisnosti između lista i još više potvrđuju potrebu za fleksibilnim i slo`enim sistemom modeliranja.

 Konačna mera prostornih i vremenskih zavisnosti između lista data je na Slici 18. Ovaj skup brojnosti prema broju parametara u modelu ukazuje na slo`enost modela za procene. Dok su šestodnevne procene prema regionu ravnomerno raspore|ene između najslo`enijih i najjednostavnijih tipova modela, četiri petine dvodnevnih procena izvedene su iz najslo`enijeg tipa modela.

 

Slika 17: Odnos između kriterijuma izbora modela i lista prema vremenskoj tački

 

Sistem

3/20

4/7

4/25

5/13

5/31

 

(2-dnevni)

do 4/6

do 4/24

do 5/12

do 5/30

do 6/17

Ukupno

ABA, EXH, HRW

3

2

1

0

1

7

ABA, EXH, OEBS

5

2

3

3

0

13

ABA, HRW, OEBS

1

3

1

2

0

7

EXH, HRW, OEBS

1

2

3

2

0

8

Ukupno

10

9

8

7

1

35

 

 

Slika 18: Slo`enost izabranih modela upoređenih prema nivou agaregacije

 

Parametri u modelu

Odabrani 6-dnevni modeli procene po regionu

Odabrani 2-dnevni modeli

4

6

0

5

16

7

6

24

28

Ukupno

46

35

 

Interpretacija ovih opažanja je relativno jednostavna. Šestodnevne procene po regionu odražavaju niži stepen geografije; unutar manjih geografskih jedinica odnosi između lista manje su komplikovani nego kod većih geografskih jedinica. Drugim rečima, geografskom "stratifikacijom" područja procene, smanjuju se zavisnosti i heterogenost. Međutim, u slučaju dvodnevnih procena, zavisnosti među listama nisu bile "stratifikovane" te su slo`eniji modeli bolje prilagođeni.

4.             Analiza odnosa između rezultata modeliranja procene višestrukih sistema i aktivnosti OVK/NATO-a

Do ove tačke, sva statistička metodologija i analize koje su opisane u ovom Dodatku bile su direktno povezane sa procenom brojnosti ubistava. Izvršena je jedna dodatna statistička analiza pri kojoj su se koristile već napravljene procene; o toj analizi }e sada biti reči.

 U glavnom delu ove studije, razmatra se odnos između vazdušnih udara NATO-a na Kosovu, aktivnosti OVK-a na Kosovu i obrazaca ubistava i migracije izbeglica. Metoda statističke analize koja omogućava bolje razumevanje ovih odnosa jeste jednostavna linearna regresija pri kojoj se koriste procene ubistava i kretanja migracije unutar određenog prostornog i vremenskog regiona kao zavisna varijabla. Potencijalne eksplanatorne varijable za model uključuju broj bitaka OVK-a unutar prostornog i vremenskog regiona, broj ubistava OVK-a unutar prostornog i vremenskog regiona, broj vazdušnih udara NATO-a unutar prostornog i vremenskog regiona, broj bitaka OVK-a unutar prethodnog prostornog i vremenskog regiona, broj ubistava OVK-a unutar prethodnog prostornog i vremenskog regiona i broj vazdušnih udara NATO-a unutar prostornog i vremenskog regiona. Kao nezavisne varijable mogu se koristiti i kvazivarijable, da bi se kontrolisala mogućnost da aktivnosti u jednom regionu dominiraju analizom.

 

 Regresionom analizom pomoću gore opisanih varijabli može da se proceni veza između aktivnosti NATO-a i OVK-a i migracija i ubistava Albanaca, prema nivoima va`nosti modela i svakog pojedinog parametra u modelu. Na Slici (19) prikazani su rezultati za četiri regresiona modela. U prvom i trećem varijable predstavljaju dvodnevne periode za celu zemlju, a u drugom i četvrtom šestodnevne periode unutar regiona. Nivo va`nosti parametara dat je obrascem * = 0,05, ** = 0,01 i *** = 0,001. Za regresione modele kod kojih se ubistva koriste kao zavisna varijabla, jedini značajni parametri su oni koji označavaju regionalne efekte. Drugim rečima, veza između varijabli OVK i NATO-a i brojnosti ubistava je slaba. To potvrđuju i niske vrednosti R2 za ova dva modela, koje iznose 0,253 i 0,147.

 

 Međutim, regresioni modeli kod kojih su migracije zavisna varijabla daju drugačiju interpretaciju. U ovom slučaju, čini se da postoji veza između aktivnosti OVK-a i migracije; preciznije, veza između bitaka OVK-a unutar prethodnog vremenskog perioda i migracija u tekućem vremenskom periodu čini se značajnom. Vrednosti R2 za oba ova modela su visoke, što samo potvrđuje tu vezu.

 U ovom momentu regresioni rezultati upu}uju na to da obrazac bombardovanja koje je tokom vremena NATO izvršio na Kosovu nije značajno povezan sa obrascem ubistava ili migracija na Kosovu tokom vremena. Međutim, čini se da je obrazac aktivnosti OVK-a povezan sa obrascem migracije.

 Daljnji dokaz nedostatka veze između aktivnosti OVK-a, NATO-vih bombardovanja i obrazaca ubistava na Kosovu daje poređenje reziduala iz svake od gore opisanih regresija sa njihovim zavisnim varijablama. Ako regresioni model dobro opisuje svoju zavisnu varijablu, tada će reziduali za taj regresioni model biti nasumični. Međutim, ako regresioni model ne daje dobar opis svoje zavisne varijable, tada će reziduali tokom vremena slediti isti obrazac kao i prvobitna zavisna varijabla. Slike 20 i 21 prikazuju poređenja reziduala za modele za koje ubistva i migracije unutar šestodnevnog perioda i regiona predstavljaju zavisne varijable. Na Slici 20, reziduali usko prate procenjene brojnosti ubistava, podržavajući jasne trendove u podacima.

 Na Slici 21, odnos između reziduala i kretanja migracije je očigledan, ali ne tako snažan kao odnos između reziduala i ubistava u prethodnom modelu. To ne iznenađuje s obzirom na bolju prilagođenost regresionog modela za kretanje migracije. Međutim, odstupanja između nizova javljaju se tek na nekoliko tačaka. U južnim i zapadnim regionima reziduali usko prate procenjene vrednosti. Kada nizovi me|usobno odstupaju u tim regionima, to je samo zbog toga što reziduali preuveličavaju trend koji je očigledan u nizu kretanja izbeglica; ovaj obrazac je uočljiv u zapadnom regionu na početku Faze 2. U severnom i istočnom regionu, nizovi se jače razlikuju. No čak i u tim regionima, vrhovi sredinom aprila u Fazi 2 pokazuju jasnu sličnost kod kretanja izbeglica i nizova reziduala. U severnom i istočnom regionu tokom Faze 1 i na prelazu u Fazu 2, nizovi su međusobno protivrečni.

 Naši zaključci su sledeći:

 

·        Na osnovu analize ovih podataka, nema dokaza koji bi podržavali teoriju da su bombardovanja koje je izvršio NATO ili aktivnost OVK povezani sa obrasicma ubistava na Kosovu.

 

·        Postoje neki dokazi za vezu između aktivnosti OVK-a i migracionih obrazaca u severnom i istočnom regionu, posebno tokom Faze 1.

 

·        Veza između aktivnosti OVK-a i kretanja migracije ne objašnjava u potpunosti obrazac migracije, posebno kada je reč o zapadnom i južnom regionu.

 

 

Slika 19: Koeficijenti regresije

 

 

Varijable reagovanja

 

Eksplanatorne varijable

Ubistva tokom vremena

Ubistva tokom vremena i po regionu

Kretanje izbeglica tokom vremena

Kretanje izbeglica tokom vremena i po regionu

Region 2

 

* -52,3

(20,4)

 

-721,4

(665,3)

Region 3

 

**-57,0

(21,3)

 

**3.017,8

(1048,9)

Region 4

 

-34,4

(25,2)

 

-193,9

(862,5)

OVK

(ubistva)

-1,1

(5,2)

1,6

(4,1)

*-634,9

(318,9)

-184,2

(130,8)

OVK

(bitka)

34,7

(32,1)

13,3

(12,2)

2.728,6

(1.030,5)

**1.879,3

(583,2)

Pomak-OVK (ubistva)

0,2

(4,4)

3,3

(3,4)

491,9

(384,4)

277,9

(167,1)

Pomak-OVK (bitka)

21,2

(17,7)

11,6

(11,9)

**2.794,3

(827,7)

***2138,4

(633,7)

NATO

10,9

(11,1)

11,4

(6,7)

327,6

(390,3)

565,8

(379,7)

Pomak-NATO

-4,8

(6,9)

-2,5

(4,1)

-28,0

(325,5)

29,2

(234,0)

Konstanta

83,9

(51,1)

**62,7

(19,9)

122,3

(3.933,2)

-484,8

(608,8)

R2

0,3

0,1

0,7

0,5

 

 

Slika 20: Procena ukupnog broja ubistava i reziduala prema regiji tokom vremena

 

Sever

 

 

 

526

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

-89

 

 

 

24. mart 6. april  24. april 11. maj 22. jun

 

Istok

 

 

 

195

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

-96

 

 

 

24. mart 6. april  24. april 11. maj 22. jun

 

Jug

 

 

 

266

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

-301

 

 

 

24. mart 6. april  24. april 11. maj 22. jun

 

Zapad

 

 

 

732

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

-129

 

 

 

24. mart 6. april  24. april 11. maj 22. jun

 

 

5.             Diskusija

U ovom dodatku su predstavljene glavne metode modeliranja koje smo primenjivali. U ovom završnom odeljku, objašnjava se metoda analize osetljivosti izveštaja o datumu smrti, te se daje sažetak zaključaka za ovaj dodatak.

5.1.       Analiza osetljivosti izveštaja o datumu smrti

Kada su zapisi o pojedincima sravnjivani sa drugim pojedincima i grupama, to je rezultiralo nagomilavanjem datuma. Izbor "najboljeg" datuma opisan je u Dodatku 1.

 

Slika 21: Procena kretanja izbeglica i ostataka prema regionu tokom vremena

 

Sever

 

 

 

8718

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

-7285

 

 

 

24. marta 6. aprila 24. aprila 11. maja 25. maja

 

Istok

 

 

 

5042

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

-3954

 

 

 

24. marta 6. aprila 24. aprila 11. maja 25. maja

 

Jug

 

 

 

24.103

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

-5521

 

 

 

24. marta 6. aprila 24. aprila 11. maja 25. maja

 

Zapad

 

 

 

20.673

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

-7577

 

 

 

24. marta 6. aprila 24. aprila 11. maja 25. maja

 

Slika 22: Procena broja ubistava tokom vremena sa alternativno dodeljenim datumima

 

 

Faza 1

Faza 2

Faza 3

 

1495

 

 

 

 

 

 

 

 

Originalni datumi

0

 

 

 

 

 

 

 

 

 

1495

 

 

 

 

 

 

 

 

Raniji datumi

0

 

 

 

 

 

 

 

 

 

1495

 

 

 

 

 

 

 

 

Docniji datumi

0

 

 

 

 

 24. marta 6. aprila 24. aprila 11. maja 22. juna

 

Čak i ako je izbor "najboljeg" datuma bio odgovarajući, ipak poneki "najbolji" datumi mogu biti pogrešni. Vreme je centralna dimenzija ovde testiranih hipoteza. Stoga je korisno razmotriti da li je suštinska interpretacija rezultata robustna prema različitim pretpostavkama o kvalitetu informacija o datumima,

 Za analizu osetljivosti odabrani su verovatni "raniji" i "docniji" datumi kao alternative svakom zapisu. Datumi su akumulirani iz svih grupnih i pojedinačnih zapisa koji su se podudarali sa svakim pojedinačnim zapisom, kako u procesu samosravnjivanja tako i u intersistemskom sravnjivanju. Za zapise koji su sadržavali tri ili više datuma u svojoj distribuciji uzimani su datumi na 25. i 75. odstotku kao "raniji" odnosno "docniji" datumi. Za zapise sa dva datuma uzimana su ova dva datuma kao raniji odnosno docniji datum. Razlika između ranijih i docnijih datuma definisala je raspon.

 Zapisima sa 1 ili 0 datuma dodeljen je raspon pomoću hotdecking procedure; kao i ranije, imputovani zapisi sravnjivani su prema geografskoj lokaciji. Docniji i raniji datumi za ove zapise bili su povećani ili smanjeni za polovinu imputovanog raspona; vrednosti su zaokružene na sledeći ceo broj. Na taj način su svi zapisi promenjeni barem za jedan dan jer smo pokušavali da što više pojačamo dejstvo ovog testa.

 Rezultat toga je distribucija ubistava tokom vremena koja je prikazana na Slici 22. Promena datuma ne utiče na oblik krivih. Pomeranjem ubistava na ranije datume ispunjava se period krajem marta i početkom aprila dok se istovremeno oduzima kvantitet vrhu sredinom aprila. Pomeranje ubistava na docnije datume pomiče ih sa vrhova u Fazi 1 na vrhove u Fazi 2 i Fazi 3.

 Najvažniji nalaz ove analize jeste da čak i ovo značajno restrukturiranje načina postupanja sa podacima ne menja osnovne karakteristike obrasca tokom vremena. Oba promenjena niza imaju visoke vrhove u početku i sredini Faze 1. Oba niza pokazuju znatno opadanje tokom prelaza između faza od 5. do 8. aprila, a svaka ima svoj vrh u sredini Faze 2. Promenjeni niz se ne sla`e u vezi s tim kada je bio tačan momenat prelaza iz Faze 2 u Fazu 3: dva dana ranije (u docnijem i slučajnom nizu) ili dva dana docnije u ranijem nizu.

 Da su vrhovi i dolovi u obrascu ubistava tokom vremena stvoreni pomoću naročite tehnike za obradu datuma, onda bi jedna ili više promena pokazivala slučajni obrazac. Da su prijavljeni datumi bili široko raspršeni, rasponi bi bili dovoljno široki pa bi promene izgladile obrazac "početka i prestanka" koji je karakterističan za ubistva i kretanje izbeglica na Kosovu od marta do juna 1999. Činjenica da se to izglađivanje nije dogodilo jeste dokaz da je procedura procene robustna prema nepreciznim izveštajima o datumu ubistava.

5.2.       Sažetak zaključaka modeliranja

Ovaj dodatak započeli smo dilemom kako da se procene neopažena (ili barem neprijavljena) ubistva u cilju procene ukupnog broja smrtnih slučajeva. Modeliranje predstavljeno u Dodatku 2 uverava nas da je u periodu od 20. marta do 22. juna 1999. verovatno ubijeno nešto preko 10.000 kosovskh Albanaca. Najveća direktna procena se mo`e uporediti sa ovom "najboljom" procenom modela, a različiti modeli daju slične procene. Verujemo da smo pravilno izložili argumentaciju u vezi sa ukupnim brojem ubistava i obrascem ubistava u navedenom periodu. Na toj osnovi doneli smo zaključke izložene u glavnom delu izveštaja.

 


Dodatak 3: Dodatni izvori za aktivnosti OVK i NATO-a

 

Albanska grupa za ljudska prava

 

Albanski mediji

 

Beogradski centar za ljudska prava

 

Centar za mir i toleranciju

 

Daily Telegraph

 

Danas

 

Egipatska nacionalna zajednica na Kosovu

 

Posmatračka misija Evropske zajednice

 

Evropski centar za prava Roma

 

Ministarstvo odbrane Savezne Republike Jugoslavije (SRJ)

 

Organi civilne zaštite SRJ

 

Ministarstvo inostranih poslova SRJ

 

Ministarstvo informisanja SRJ

 

SRJ, Ed memoar o korišćenju nehumanog oružja u agresiji Organizacije severnoatlantskog pakta protiv Savezne Republike Jugoslavije, Beograd, 15. maj 1999.

 

Fond za humanitarna prava

 

The Guardian

 

Odbor za ljudska prava Sandžaka

 

Informativna služba Crkve i Narodne skupštine (Kosovo)

 

Me|unarodni komitet Crvenog krsta

 

Međunarodni krivični sud za bivšu Jugoslaviju

 

Koha Ditore

 

Kosovapress

 

Kosovski mediji

 

Verifikaciona misija za Kosovo

 

Lokalni crkveni odbori (Kosovo)

 

Los Angeles Times

 

A`urirani prikaz operacije “Združena sila” NATO-a

 

Institut "Otvoreno društvo"

 

Organizacija za evropsku bezbednost i saradnju

 

Organizacija porodica nestalih

 

Orthodoxy Press

 

Politika

 

Izveštaj vladike Artemija "Spisak ubijenih i otetih Srba", Ministarstvo unutrašnjih poslova Republike Srbije

 

RTS TV Beograd

 

Srpski mediji

 

Srpska pravoslavna crkva

 

NewsBits Kongresa srpskog jedinstva

 

SVEDOK - beogradski nedeljnik

 

Tanjug

 

Visoki komesarijat Ujedinjenih nacija za izbeglice

 

V.I.P. Daily News Report

 


Bibliografija

American Bar Association Central and East European Law Initiative and the American Association for the Advancement of Science. 2000. Political Killings in Kosova/Kosovo, March-June 1999. Washington DC: American Bar Association Central and East Euroepan Law Initiative.

 

Anderson, Margo i Stephen E. Fienberg. 2001a. Who Counts? Census-Taking in Contemporary America. Revidirano izdanje u mekom povezu. New York: Russel Sage Foundation.

 

Anderson, Margo i Stephen E. Fienberg. 2001b. Counting and estimation: Methodology for Improving the Quality of Censuses. The U.S. 2000 Census Adjustment Decision. Izlaganje održano na International Conference on Quality in Official Statistics, Stockholm, Švedska, 14.-15. maj, 2001.

 

Asher, Jana i Patrick Ball. 2001. Understanding Human Rights Violation Data through the Analysis of Circuits. Predat za objavljivanje u Proceedings of the American Statistical Association (Government Statistics Section). 

 

Asher, Jana i Stephen E. Fieberg. 2001. Statistical Variations on an Administrative Records Census. Predat za objavljivanje u Proceedings of the American Statistical Association (Government Statistics Section).

 

Ball, Patrick. 2000a. Policy or Panic: The Flight of Ethnic Albanians from Kosovo, March-May 1999. Washington D.C.: American Association for the Advancement of Science.

 

Ball, Patrick. 2000b. The Guatemalan Commission for Historical Clarification: Intersample Analysis. Poglavlje 11 u Making the Case: Investigating Large Scale Human Rights Violations using Information Systems and Data Analysis, urednici Patrick Ball, Herbert Spirer i Louise Spirer. Washington, DC: American Association for the Advancement of Science.

 

Belin, Thomas R. i Donald B. Rubin. 1995. A Method for Calibrating False-Match Rates in Record Linkage. Journal of the American Statistical Association.

 

Bishop, Yvonne M.M., Stephen E. Fienberg i Paul H. Holland. 1975. Discrete Multivariate Analysis: Theory and Practice. Cambridge, MA: MIT Press. 

 

Converse, N. i F. Scheuren. 2001. Workarounds in Survey Data Handling. Predat za objavljivanje u New Journal of Data.

 

Cressie, Noel i Paul W. Holland. 1983. Characterizing the Manifest Probabilities of Latent Trait Models. Psychometrika 48: 129-141.

 

Cormack, R. 1992. Interval Estimates for Mark-Recapture Studies of Closed Population. Biometrics 48: 567-576.

 

Cowan, Charles Douglas. 1984. The effects of misclassifications on estimates from capture-recapture studies. Doktorska disertacija, George Washington University.

 

Darroch, John N., Stephen E. Fienberg, Gary Glonek, FV. Gary i Brian W. Junker. 1993. A Three-Sample Multiple-Recapture Approach to Census Population Estimation with Heterogeneous Catchability. Journal of the American Statistical Association 88: 1137-1148.

 

Fienberg, Stephen E. 1972. The multiple recapture census for closed populations and incomplete 2k contingency tables. Biometrika 59: 591-603.

 

Fienberg, Stephen E. 1980. The Analysis of Cross-Classified Categorical Data. Drugo izdanje. Cambridge, MA: MIT Press.

 

Fienberg, Stephen E., Matthew S. Johnson i Brian W. Junker. 1999. Classical multilevel and Bayesian approaches to population size estimation using multiple lists. Journal of the Royal Statistical Society, Series A 162: 383-405.

 

Fienberg, Stephen E. i Michael M. Meyer. 1983. Loglinear models and categorical data analysis with psychometric and econometric applications. Journal of Econometrics 22: 191-214.

 

Ford, B. 1983. Hot Deck Imputation. Pogl. 14. u sv. 2, deo 4, Incomplete Data in Sample Surveys, uredili William G. Madow, Harold Nisselson i Ingram Olkin. New York: Academic Press.

 

Hogan, Howard. 1993. The 1990 Post-Enumeration Survey: Operations and Results. Journal of the American Statistical Association 88: 1047-1060.

 

Holland, Paul W. 1990. On the sampling theory foundations of item response theory models. Psychometrika 55: 577-601.

 

Human Rights Watch. 2001. Under Orders: War Crimes in Kosovo. New York: Human Rights Watch.

 

Independent International Commission on Kosovo. 2000. The Kosovo Report: Conflict*International Response*Lessons Learned. New York: Oxford University Press.

 

International Working Group for Disease Monitoring and Forecasting. 1995a. Capture-recapture and multiple-record systems estimation, I: History and theoretical development. American Journal of Epidemiology 141: 1047-1058.

 

International Working Group for Disease Monitoring and Forecasting. 1995b. Capture-recapture and multiple-record systems estimation, II: Applications in human diseases. American Journal of Epidemiology 141: 1059-1088.

 

Marks, E. S., W. Seltzer i K. J. Krótki. 1974. Population Growth Estimation: A Handbook of Vital Statistics Measurement. New York: The Population Council.

 

Oh, H. i F. Scheuren. 1983. Weighting Adjustment for Unit Nonresponse. Pogl. 13 u sv. 2, deo 4, Incomplete Data in Sample Surveys, uredili William G. Madow, Harold Nisselson i Ingram Olkin. New York: Academic Press.

 

Organization for Security and Cooperation in Europe. 1999. Kosovo/Kosova As Seen As Told: An Analysis of the Human Rights Findings of the OSCE Kosovo Verification Mission October 1998 to June 1999. Varšava, Poljska: OSCE Office for Democratic Institutions and Human Rights.

 

Peterson C. G. J. 1896. The yearly immigration of young plaice into the Limfjord from the German Sea. Report of the Danish Biological Station to the Ministry of Fisheries 6: 1-48.

 

Physicians for Human Rights. 1999. War Crimes in Kosovo: A Population-Based Assessment of Human Rights Violations of Kosovar Albanians by Serb Forces. Boston: Physicians for Human Rights.

 

Record Linkage Techniques. 1985. Record Linkage Techniques - 1985 Proceedings of the Workshop on Exact Matching Methodologies. Washington, DC: U.S. Internal Revenue Service, Statistics of Income Division.

 

Record Linkage Techniques. 1997. Record Linkage Techniques - 1997 Proceedings of An International Workshop and Exposition. Washington DC: Ernst and Young, LLP.

 

Rubin, Donald B. 1987. Multiple imputation for nonresponse in surveys. New York: Wiley.

 

Scheuren, F. 1985. Methodologic issues in linkage of multiple data bases. Record Linkage Techniques - 1985 Proceedings of the Workshop on Exact Matching Methodologies. Washington, DC: U.S. Internal Revenue Service, Statistics of Income Division.

 

Sekar, C. C. i Deming, W. E. 1949. On a Method of Estimating Birth and Death Rates and the Extent of Registration. Journal of the American Statistical Association. 44:101-115.

 

Spiegel, Paul B. i Peter Salama. 2000. War and Mortality in Kosovo, 1998-1999: An Epidemiological Testimony. Lancet 355: 2206-2211.

 

Splus, Insightful Corporation. 2001. "Generalizing the Linear Model". Pogl. 12 u S-PLUS for Windows Guide to Statistics, Volume 1. Seattle, WA: Insightful Corp.

 

Stata Corporation. 2001. Section on generalized linear models in Stata 7 Reference Manual. Vol 1 A-G. College Station, TX: Stata Corporation.

 


Izjave zahvalnosti

Ovog izveštaja ne bi bilo bez saradnje mnogih pojedinaca i organizacija. On se zasniva prvenstveno na podacima koje je obezbedila Srednjo- i istočnoevropska pravna inicijativa Američke advokatske komore (ABA/CEELI), Američko udruženje za naučni napredak (AAAS), Centar za mir kroz pravdu, Odbor za odbranu ljudskih prava i sloboda, Human Rights Watch, Organizacija za evropsku bezbednost i saradnju, te Međunarodni krivični sud za bivšu Jugoslaviju. Veoma smo zahvalni ovim organizacijama što su bile spremne da međusobno podele rezultate svoga rada. Bez ovog saradničkog duha, ovaj projekat ne bi bio moguć.

 Scott Carlson, direktor Programa za srednju i istočnu Evropu pri ABA/CEELI, 1999. godine okupio je organizacije za ljudska prava kako bi podelili informacije u vezi sa Kosovom i iskoristili njihova prethodna iskustva u dokumentovanju kršenja ljudskih prava. ABA/CEELI i AAAS su 2000. objavili izveštaj pod naslovom Politička ubistva na Kosovu/Kosova, mart-jun 1999.

 U aprilu 1999, Patrick Ball i Fritz Scheuren iz AAAS-a, zajedno sa Fronom Nazijem iz Instituta za istočno-zapadni menadžment i Instituta za političke i pravne studije započeli su istraživanje o statističkim obrascima kretanja izbeglica sa Kosova. Ovaj rad objavljen je pod naslovom Politika ili panika: bekstvo etničkih Albanaca sa Kosova, mart-maj 1999. Među organizacijama i pojedincima koji su ulo`ili svoje vreme, obezbedili podatke i druge oblike pomoći ovim ranijim projektima su Lekari za ljudska prava, Centar za ljudska prava i Odsek za demografiju, University California-Berkley, Fred Abrahams, Vasian Cepa, Blerina Kashari, Julia Belanger, Andrea Lako, Eric Stover, dr. Sandra Eyster, Ilir Gocaj i mnogi drugi.

 Pored toga, brojni pojedinci velikodušno su doprineli ovom projektu svojim vremenom, energijom i stručnošću. Matt Zimmerman izradio je softversku aplikaciju za vršenje intersistemskog sravnjivanja. Takođe je dizajnirao prelom i pružio značajnu pomoć kod grafičkog dizajna i tehničkog uređivanja. Patricia Hawkins pomogla je pri početnim fazama programiranja. Sara Churchill i Maya Goldstein nadgledale su kodiranje podataka ABA-e i OEBS-a. Jason Sanders pomogao je kod kodiranja i administrativnih problema. Jeff Henigson je ponovo kodirao HRW podatke iz prvobitnih razgovora.

 Biro za demokratiju, ljudska prava i rad američkog State Departmenta i američke Agencije za međunarodni razvoj dao je podršku organizaciji ABA/CEELI. Podrška američke Vlade bila je od suštinske va`nosti za projekat, ali valja naglasiti da osoblje američke Vlade ni u jednom momentu nije pokušalo da se meša u naše nezavisno vođenje projekta ili da utiče na naše samostalno izveštavanje. ABA/CEELI strukturirala je svoje odnose sa američkom Vladom kao "saradnički sporazum" da bi u tom smislu osigurala svoju nezavisnost. Stoga ovaj izveštaj nije podnet američkoj Vladi na reviziju i svaka saglasnost sa stavovima američke Vlade potpuno je slučajna.

 Pored podrške preko podugovora sa ABA/CEELI, AAAS je dobio podršku od Instituta za gra|ansko društvo i Fondacije Johna D. i Catherine T. MacArthur.

 


Autori i urednici

Patrick Ball programirao je bazu podataka, vodio kontrolu kvaliteta i izradio statistički softver, napisao delove svakog odeljka u izveštaju i dao opšti orijentacioni okvir. Wendy Betts napisala je glavni deo izveštaja i koordinirala kodiranje podataka ABA/CEELI i OEBS-a. Fritz Scheuren pružio je statističko vođstvo i napisao Dodatak 1. Jana Dudukovic organizovala je radnike koji su obrađivali podatke, nadgledala proces sravnjivanja, kodirala podatke o OVK i doprinela Dodatku 1. Jana Asher programirala je statističke rutine i napisala Dodatak 2. Patrick Ball i Jana Asher razvili su procedure modeliranja. Svi autori zajednički su uredili izveštaj.

 


Odbor za stručnu recenziju

Mnogo je ljudi radilo na recenziji ovog izveštaja. Međunarodnim timom za recenziju predsedavala je dr Helge Brunborg (viši naučni saradnik, Statistics Norway), a tim su činili dr Ronald Lee (redovni profesor ekonomije i demografije, University of California-Berkeley); dr Francoise Seillier-Moiseiwitsch (vanredni profesor statistike, direktor Centra za bioinformatička istraživanja, University of Maryland-Baltimore County i predsednik Komiteta za ljudska prava, Američko udruženje za statistiku); dr Jean-Louis Bodin (bivši predsednik Međunarodnog instituta za statistiku); dr Carlo Malaguerra (generalni direktor Saveznog zavoda za statistiku [vajcarske - SFSO); dr Philippe Eichenberger (šef Odseka za statističke metode - SFSO); dr Beat Hulliger (zamenik šefa Odseka za statističke metode - SFSO). Recenzenti su dali opsežne komentare na dva preliminarna nacrta izveštaja.

 Sa nama su radili na manje formalnoj osnovi brojni dodatni recenzenti. Među njima su bili dr. David Banks (Ministarstvo transporta SAD), Herbert F. Spirer (vanredni profesor, Program za ljudska prava na Columbia University School of International and Public Affairs); Louise Spirer (samostalni istraživač) i dr Denise Albanese (Odsek za engleski jezik, George Mason University).

 Ovaj je izveštaj usavršen zahvaljujući otvorenim kritičkim sudovima koje su izrazili recenzenti i smo im stoga zahvalni. Naravno, autori su isključivo odgovorni za analize i mišljenja izražena u ovoj studiji.

 


Autorske organizacije

AAAS-ov Program za nauku i ljudska prava

 

Program za nauku i ljudska prava Američkog udruženja za naučni napredak (AAAS) nastoji da zaštiti ljudska prava naučnika i da unese naučne metode u rad na području ljudskih prava. U sklopu ovog programa razvijaju se i unapređuju metode za dokumentovanje i praćenje ljudskih prava, jača podrška ljudskim pravima među naučnicima i sprovode istraživanja o različitim pitanjima vezanim za ljudska prava. Rad Programa zasniva se na pretpostavci da je poštovanje ljudskih prava od bitne važnosti za naučna istra`ivanja i primenu nauke. Više informacija o Programu i njegovim aktivnostima naći ćete na stranici: http://shr.aaas.org.

 

Srednjo- i istočnoevropska pravna inicijativa Američke advokatske komore

 

Srednjo- i istočnoevropska pravna inicijativa je projekat u javnom sektoru Američke advokatske komore (ABA). Projekat ima za cilj unapređenje vladavine prava kroz podršku procesu pravne reforme koji se sprovodi u srednjoj i istočnoj Evropi i novim nezavisnim državama bivšeg Sovjetskog Saveza (NND). Kroz različite programe, CEELI pruža stručnu pravnu pomo} američkih i evropskih volontera koji pomažu demokratijama u nastajanju da modifikuju ili prestrukturiraju svoje zakone i pravne sisteme.

 ABA/CEELI Projekat za dokumentovanje ratnih zločina (War Crimes Documentation Project - WCDP) počeo je sa radom u maju 1999. uz finansiranje od strane Američke agencije za međunarodni razvoj i američkog State Departmenta. WDCP ima dva cilja: 1) pomoć naporima u istrazi ratnih zločina i krivičnom gonjenju počinilaca i 2) podizanje nivoa javne svesti o ratnim zločinima, njihovom krivičnom gonjenju i ulozi Međunarodnog krivičnog suda za bivšu Jugoslaviju (MKSJ) u ovom procesu. U vezi sa pitanjima ratnih zločina, ABA/CEELI blisko je sarađivao sa nekoliko drugih nevladinih organizacija, uključujući Koaliciju za međunarodnu pravdu (Coalition for International Justice - CIJ), Chicago-Kent College of Law, te Centar za mir kroz pravdu. Dalje informacije o ABA/CEELI i njegovim aktivnostima naćićete na stranici http://www.abanet.org/ceeli/.

 


Beleška o autorima

Dr Patrick Ball je zamenik direktora AAAS-ovog Programa za nauku i ljudska prava. Od 1991. projektovao je sisteme za upravljanje informacijama i sprovodio kvantitativnu analizu za opse`ne projekte o ljudskim pravima za komisije za utvrđivanje istine, nevladine organizacije, tribunale i misije Ujedinjenih nacija u El Salvadoru, Etiopiji, Gvatemali, Haitiju, Južnoj Africi, Kosovu i Šri Lanci.

Mr Wendy Betts je kodirektor ABA/CEELI Projekta za dokumentovanje ratnih zločina. Dala je svoj doprinos brojnim publikacijama o međunarodnim i unutarnjim sukobima i tranziciji posle sukoba.

Dr Fritz Scheuren je potpretsednik Odseka za statistiku u Nacionalnom centru za istraživanje javnog mnijenja, istraživačkog ogranka Univerziteta u Chicagu. Ima veliko iskustvo na području povezivanja zapisa, kako u istraživačkom tako i u administrativnom okruženju. Trenutno sve svoje vreme posvećuje problemima američkih Indijanaca.

 

Jana Dudukovic je nezavisni istraživač i studira pod mentorstvom Louise Spirer.

 

Mr Jana Asher ima veliko istraživačko iskustvo u procenama malih područja, administrativnim zapisima, povezivanju zapisa i proceni višestrukih sistema. Trenutno radi doktorat u oblasti statistike na Univerzitetu Carnegie Melon pod vođstvom prof. Stephena E. Fienberga.

 

 



[1] Podaci o kretanju izbeglica prvenstveno su zasnovani na evidenciji koju je vodila pogranična policija albanske Vlade. Dodatni administrativni arhivi Visokog komesarijata za izbeglice UN i albanske Vlade, kao i podaci iz pregleda nekoliko organizacija za ljudska prava upotpunili su analizu pogranične evidencije. Valja istaknuti da ova analiza ne uključuje podatke o raseljenim licima unutar zemlje, koja nisu nikad prešla granicu. Stoga ove procene ne pretstavljaju ukupan broj ljudi koji su napustili domove. Vidi Ball (2000). 

[2] Direktni rezultati prikazani su u Dodatku 2.

[3] U nastojanju da se osigura kvalitet, celokupno kodiranje podataka koje uključuje pore|enja izvora podataka nezavisno su izvršila dva lica; njihovi su rezultati upoređeni, a sve razlike pregledao je i uskladio jedan od autora studije.

[4] Celokupno statističko programiranje vezano za procenu rezultata nezavisno su izvršila dva analitičara, koji su koristili različite računare i različit softver, a njihovi rezultati bili su istovetni.

[5] Iako analiza ubistava pokriva period od 20. marta do 22. juna, analiza kretanja izbeglica završava se krajem maja, i to iz dva razloga. Kao prvo, evidenciji koju je vodila albanska pogranična policija završena je u to vreme. Kao drugo, priče govore da je bilo vrlo malo kretanja preko granice nakon tog vremena; to je kasnije potvrđeno istraživanjima koja su sprovedena među stanovnicima izbegličkih logora od sredine do kraja juna.

[6] Vidi Ball 2000. Tri faze odražavaju obrazac prema kojem su izbeglice napuštale svoje domove, a ne obrazac prelaska granice. Za bilo koji dan vredi da je nešto više od polovine izbeglica koji su prešli granicu napustilo svoje domove ranije toga dana. Međutim, ostale izbeglice koje su tog dana prešle granicu putovale su du`e. Analiza podataka objasniće uzroke kasnijeg prelaska.

[7] Period od marta do juna za svrhu ove analize sa`et je u dvodnevne intervale. Sa`imanje vremena do ovog nivoa pružilo je dovoljno podataka za svaki interval da se statistička analiza stabilizuje; vidi Dodatak 2. Vrednost procenjenog broja ubistava ili izbeglica projektovana za dati vremenski trenutak na vodoravnoj osi grafikona pretstavlja broj za dotični dvodnevni period. 

[8] Za puni opis ovog procesa vidi Dodatak 1.

[9] Za puni opis ove procedure vidi Dodatak 2.

[10] Vidi ABA/AAAS (2000), PHR (1999), Spiegel i Salama (2000).

[11] Postoji jedna vrednost koja predstavlja anomaliju u južnom regionu (Slika 5) krajem maja. Procena o više od 200 ubijenih ljudi u jednom dvodnevnom periodu rezultat je manje od 20 dokumentovanih ubistava. Naravno, ova vrednost takođe ima relativno visok nivo greške, kao što je pokazano u Dodatku 2, Slika 12. Kao što se iz slike vidi, većina vrednosti ima ni`i nivo greške koji ne umanjuje interpretaciju obrasca. Međutim, ova vrednost ima dovoljno široku marginu greške pa je moguće da se značajno ne razlikuje od nule.

[12] Za ovu analizu koristili smo samo broj prijavljenih ubistava, a ne procenjeni ukupni broj. Podaci nisu prikladni za procenu na opštinskom nivou. Vidi Odeljak 5.3 za analizu pri kojoj je korišćen procenjen broj ubistava na regionalnom nivou.

[13] Sažetak izvora naveden je u Dodatku 3.

[14] Jugoslovenska vlada bila je glavni zagovornik teze da su vazdušni udari NATO-a odgovorni za ubistva i kretanje izbeglica na Kosovu. Stoga, najjači test ove hipoteze je korišćenje podataka same jugoslovenske vlade o tome kada i gde su napadi izvedeni.

[15] Brifing Ministarstva odbrane Velike Britanije, zamenik načelnika štaba odbrane, Sir John Day; dostupno na Internet stranici: http://www.kosovo.mod.uk/brief040499.htm od 3. januara 2001.

[16] Vidi Dodatak 2 za detaljniju raspravu, uključujući analizu regresije.

[17] Za detaljniju raspravu vidi Dodatak 2, Sliku 21. Ostale tačke gde procene i ostaci odstupaju javljaju se kada je kretanje blizu nule te stoga nisu značajne.

[18] ABC News preneo je izjavu jugoslovenske vlade u kojoj se navodi "[u] čast najvećeg hrišćanskog praznika, Uskrsa, sve aktivnosti vojske i policije na Kosovu usmerene protiv terorističke organizacije Oslobodilačke vojske Kosova (OVK) prekinuće se 6. aprila u 20 časova [15 h po istočnom vremenu]". Pravoslavni Uskrs bio je u nedelju, 11. aprila 1999. Vidi http://abcnews.go.com/sections/world/DailyNews/kosovo_bombing990406.html od 3. januara 2002.

[19] Bili su dostupni podaci o dodatnih 18.000 anonimnih smrtnih slučajeva, ali nisu uvršteni usled nedostatka vremena.

[20] Engleski termini "last name" i "surname" korišćeni su u značenju "prezimena".

[21] Rezultati analize osetljivosti navedeni su u Dodatku 2. Zaključili smo da je suštinska interpretacija podataka robusna u odnosu na preostalu nepreciznost u datumima nastalu usled pogreške u saopštavanju ili nedostajućih podataka.

[22] Ekshumacioni podaci pružili su osnovni rani referentni okvir za probleme sravnjivanja na koje ćemo docnije naići. U početku smo smatrali da su imena u ekshumacionim podacima jedinstvena. Na kraju, iako se to pokazalo netačnim, ekshumacioni podaci još uvek su bili najbolji registar za identifikaciju žrtava po imenu. 

[23] Procenti ukupno ne iznose 100% zbog zaokruživanja.

[24] Vidi www.reliefweb.int/hcic/ od 10. oktobra 2001. Valja primetiti da lista HCIC-a uključuje opštinu Mališevo /Malishevë/ koja nije postojala tokom prve tre četvrtine 1999. Tokom konflikta, Mališevo je bilo deo druge četiri opštine.

[25] Vidi NIMA GEOnet Names Server (GNS) na Internet-stranici http://gnpswww.nima.mil/geonames/GNS/index.jsp od 3. januara 2002.

[26] Interesantno je da smo našli više od 50 lokacija na listi NIMA-e za koje su geografska širina i dužina bile 25 ili više kilometara udaljene od njihove pozicije na više karata. U takvom slučaju, našom proverom kvadrata na mreži kojom su upoređivane pozicije geografske širine i dužine u odnosu na mrežne koordinate na kartama HCIC-a, odbačene koordinate NIMA-e.

[27] Koristili smo Haversineovu formulu za računanje udaljenosti; vidi, npr. http://mathforum.org/dr.math/problems/longandlat.html.

[28] I udaljenije lokacije povremeno su tretirane kao iste; to se dešavalo kad su veoma udaljena mesta nosila ista imena te su ih mo`da pobrkali ili svedoci ili kodifikatori podataka. Vidi Odeljak 5.4. za detalje.

[29] Jedan recenzent je primetio da se neka imena mogu dati licima obaju polova. Budući da je pol igrao relativno malu ulogu u našem principu utvrđivanja podudarnosti, to pravilo uređivanja nije moglo značajno da utiče na sravnjivanje.

[30] Za neke od resursa koje smo koristili, vidi http://www.kabalarians.com/male/serb-m.htm i http://toybo.flick.com/onomastikon/Europe-Eastern/Former-Yugoslavia/Serbia/Surnames.htm.

[31] Logično, isto tako mala frakcija anonimnih smrtnih slučajeva bili bi Srbi. Ovi brojevi su premali da bi uticali na interpretaciju naših procena. Stoga smo ignorisali njihovo dejstvo.

[32] Kao što je već pomenuto, u Dodatku 2 ispituje se robusnost u odnosu na poznate slabe tačke izveštavanja o datumima.

[33] U ovom krugu nisu proveravani duplikati u ekshumacionih podataka jer se pretpostavljalo da su zapisi jedinstveni. U Odeljku 5 opisujemo kako je ova pretpostavka docnije izmenjena jer je utvr|eno da su neka imena bila dvostruko zabeležena.

[34] Jedan od autora ove studije koorganizovao je dve konferencije o povezivanju arhivskih zapisa (1985. i 1997. godine) koje daju pristup ovoj bogatoj literaturi.

[35] Vidi Scheuren (npr. 1985) za dalje informacije o statističkim svojstvima metoda višestrukog svrstavanja u blokove.

[36] Upotreba termina "krug" u Asher i Ball (2001) je različita, ali su analitički problemi slični.

[37] Vidi Dodatak 2 za upotrebu ove informacije u analizi osetljivosti.

[38] Pojedinačne odluke kodifikatora sačuvane su za analizu osetljivosti.

[39] Kao što je drugde rečeno, kada su greške bile neizbežne, izabrali smo da grešimo tako da broj ubistava bude manji.

[40] Aplikacija za sravnjivanje bila je klijent HTML-a kojem su kodifikatori pristupali preko internetskih “browsera”. Sama aplikacija napisana je u PHP-u i MySQL-u na lokalnoj mreži. Podaci su obrađivani pomoću Pythona i SQL-a, a statistike i grafikoni pravljeni su pomoću programa Stata. Grafikoni su uređeni u Adobe Illustratoru i tekstualnom programu za pripremu za štampanje pomoću LATEX2e.

[41] Dodatni datumi korišćeni su za procenu preciznosti datuma. Vidi Dodatak 2.

[42] Kao što je ranije pomenuto, bili su dostupni zapisi o dodatnih 18.000 grupnih smrtnih slučajeva, ali usled nedostatka resursa nisu obrađeni.

[43] Ispustiti zapis znači dodati ga krugu podudarnih zapisa u samosravnjivanju. Na taj način, informacije sadržane u "ispuštenom" zapisu još su dostupne u "zadržanom" zapisu.

[44] "Hot decking" (npr. Ford 1983) procedurom unose se nedostajuće informacije u neki zapis tako da se pronađe drugi zapis – "donatorski" zapis koji sadrži takve informacije, a koji je u drugim aspektima istovetan ili gotovo istovetan. Ovde smo za izbor donatora koristili geografsku blizinu. Da bismo smanjili Monte Carlo grešku koju izaziva imputovanje informacija, najpre smo izradili potencijalne "donatorske" grupe od po 60 zapisa (u 85% sela za koja je utvrđeno da su bila poprišta jednog ili više ubistava našli smo 60 ili više valjanih dostupnih zapisa u krugu od 10 km).

[45] I ovde su u svrhu smanjivanja pogreške usled imputovanja podataka datumi tri puta imputovani u zapise, pri čemu je svakom tako nastalom zapisu pripisana težina od 0.33. Motivacija za ovu upotrebu višestrukog imputovanja je izložena u Oh i Scheuren (1983). Nismo koristili višestruko imputovanje u smislu u kojem ga opisuje Rubin (1987). Posebno, naš cilj nije bio da izračunamo varijante. Preostala nesigurnost koja nastaje usled procesa imputovanja je zacelo mala (vidi, npr. Converse i Scheuren 2001). Ipak, postoji izvesna mogućnost preostale pristrasnosti, pa se činilo opravdanim preduzeti analize osetljivosti (Dodatak 2). Stoga smo takođe opisali sva testiranja signifikantnosti i intervale pouzdanosti izračunate u Dodatku 2, te smo ih uključili u izveštaj kao "nominalne".

[46] Kod uobičajenih grešaka u pisanju imena i prezimena, lista je uređena tako da su zapisi sa uobičajenim varijantama bili smešteni jedan pored drugog.

[47] Žrtve sa imputovanim datumima neproporcionalno su prikazane u ćelijama sa manje podudarnih zapisa. Zapisi koji su imali više podudarnih parova imali su i više mogućnosti da dobiju informaciju o datumu, dok su zapisi sa manje podudarnosti imali manje mogućnosti za dobijanje takve informacije. Zbog načina na koji su imputacije izvedene, neki su zapisi dobili razlomačke vrednosti koje su zbrojene na slici. Rezultati su zaokruženi na najbliži ceo broj. Na primer, "da-da-ne-ne" ćelija tako je zaokružena sa 176,66 na 177. Ukupan iznos odražava zaokruženu brojnost.

[48] Za proveru kvaliteta procesa procene koji je zahtevala ova studija, softverske rutine za sve procedure procene o kojima je raspravljano u Dodatku 1, nezavisno su izradili Jana Asher, koja je koristila Splus 2000 i SAS Version 8, i Patrick Ball, koji je koristio Stata 7. Rezultati su uređeni, a tamo gde su se pojavile razlike, rutine su debagovane, sve dok nisu postignuti podudarni rezultati.

[49] Direktni intervali niži su nego što bi bili da smo imali vremena do obradimo 18.000 anonimnih žrtava navedenih u razgovorima koje je ABA provela izvan Kosova, a koje nismo mogli da upotrebimo. Da smo mogli da uključimo ove dodatne zapise, direktno primetljive donje granice bi se povećale, što bi ih približilo modelskoj proceni koju smo izabrali.

[50] Kada je ukupan zbir grupnih podataka bio manji od ukupnog zbira pojedinačnih podataka, relativna razlika je definisana kao nula.

[51] U loglinearnom modeliranju, procena standardnih grešaka pretpostavlja da podaci ne nedostaju, nema gomilanja izveštaja niti grešaka u sparivanju. Međutim, očekuje se da relativne dužine intervala pouzdanosti od procena alternativnih loglineranih modela budu robusne u pogledu malih smetnji koje uzrokuju ovi nedostaci u podacima. Ipak, kako je izračunato prema modelu, sami intervali pouzdanosti su prekratki. Po našem mišljenju, to ograničenje nije dovoljno da dovede do pogrešnog zaključka.

[52] Ovde je upotrebljena reč "nominalan" jer koeficijent pouzdanosti treba da bude ispravljen kod vršenja višestrukih poređenja. Bonferronijeve korekcije, iako uglavnom konzervativne, mogu da budu jedan od pristupa. Nadalje, često smo vizuelno i verbalno upoređivali dve procene ili dva niza procena bez opaski o eventualnim neizmerenim kovarijantama.

[53] U slučaju procene višestrukih sistema, broj ćelija u unakrsnoj klasifikacijskoj tabeli iznosi 2J-1, gde je J broj lista; x000 ćelija se smatra "strukturnom nulom" i stoga nije uključena u proračun stepeni slobode.

[54] Ovde je važna struktura podataka, a ne njihova sadržina. Stoga su regije označene brojevima. Severna regija je regija 1; istočna regija je regija 2; južna regija je označena brojem 3, a zapadna brojem 4.

[55] Termin "globalan" koristiće se u nastavku ovog Dodatka, a označavaće ukupan broj ubistava na Kosovu u periodu od marta do juna 1999.

56 Ako se u modeliranje uključi svih 16 šestodnevnih tačaka, rezultirajuće procene su "ravne" (istovetne) za šest poslednjih vremenskih tačaka.

 

57 10.356 je golbalna procena broja ubistava; nelogično je verovati da bi bilo koja procena za jednu prostorno-vremensku tačku bila ve}a od ovog broja.

58 Za daljnje informacije o rezultatima strategije nabrajanjem, nasuprot rezultatima istraživačke strategije prikupljanja podataka, vidi Asher i Ball (2001).