Metoda ponovnega vzorčenja

statistična metoda

Metoda ponovnega vzorčenja (angleško bootstraping) je statistična metoda, pri kateri statistični izračuni temeljijo na podlagi različnih vzorcev, ki so naključno izbrani iz danih dodatkov s ponovnim vzorčenjem. Tako dobimo različne ocene statističnih parametrov in iz njih lahko ocenimo parameter in interval zaupanja v oceno. Metodo se uporablja zlasti kadar ni znana teoretična porazdelitev podatkov.

Prvi jo je leta 1979 opisal Bradley Efron v članku Bootstrap Methods: Another Look at the Jackknife.

Postopek uredi

Pri bootstrapu po navadi empirična porazdelitvena funkcija   na vzorcu   nadomesti teoretično porazdelitveno funkcijo   dane naključne spremenljivke.

V najprerpostejšem primeru se ustvari B bootstrap-vzorcev  , tako da se vsakič (pri generiranju vsakega bootstrap vzorca) iz danega vzorca n-krat izbere vrednosti s ponavlajnjem (ista podatkovna točka je lahko izbrana večkrat). To ustreza ponovljenem vlečenju naključnih števil iz empirične porazporeditvene funkcije  .

Za vsak bootstrap-vzorec se izračuna vrednost   za statistični parameter T, katerega oceno se išče. Porazporeditev parametra   se na koncu aproksimira skozi empirično porazdelitev B ocen za  .

V zapletenejših modelih se namesto zgolj ponavljajočega vlečenja iz že obstoječih podatkov, lahko na podlagi ocen parametrov neznane porazdelitve tudi generira "lažne" podatke tako da tej ustrezajo porazdelitvi kateri ustrezajo ocene parametrov. Zlasti kadar statističnih preizkusov ni mogoče izvesti, ker na primer natančna porazdelitev parametra ni znana ali pa je vzorec premajhen za izpolnjevanje konvergenčnih kriterijev, se tako lahko oceni kvantile in p-vrednosti.

Zunanje povezave uredi

Literatura uredi

  • Bradley Efron (1979). »Bootstrap Methods: Another Look at the Jackknife«. The Annals of Statistics. 7 (1): 1–26. doi:10.1214/aos/1176344552.
  • B. Efron, R.J. Tibshirani: An introduction to the bootstrap, New York: Chapman & Hall, 1993.
  • J. Shao, D. Tu: The Jackknife and Bootstrap, Springer, 1995.