Zipf-Mandelbrotova porazdelitev

Zipf-Mandelbrotova porazdelitev
parametri (celo število)
(realno število)
(realno število)
interval
funkcija verjetnosti
(pdf)
zbirna funkcija verjetnosti
(cdf)
pričakovana vrednost
mediana
modus
varianca
simetrija
sploščenost
(eksces)
entropija
funkcija generiranja momentov
(mgf)
karakteristična funkcija

Zipf-Mandelbrotova porazdelitev (tudi Zipf-Mandelbrotov zakon ali Pareto-Zipfova porazdelitev) je diskretna verjetnostna porazdelitev.

Imenuje se po ameriškem jezikoslovcu in filologu Georgeu Kingsleyu Zipfu (1902–1950), francosko-ameriškem matematiku poljskega rodu Benoîtu Mandelbrotu (1924–2010) in italijanskem ekonomistu in sociologu Vilfredu Paretu (1848–1923). Zipf je predlagal enostavnejšo varianto, ki so jo imenovali Zipfov zakon. Pozneje je Mandelbrot problem posplošil in ga uporabil celo za idealni plin.

Funkcija verjetnosti je enaka kjer je:

  • ,

kadar je q = 0 in je s približno 1, se dobi Zipfov zakon.

To vrednost se ima lahko kot posplošitev harmoničnih števil (glej tudi harmonična vrsta). Ko se N približuje neskončnosti, postane to Hurwitzeva funkcija zeta . Za končne N pri q = 0 postane Zipf-Mandelbrotova porazdelitev enaka Zipfovemu zakonu. Za nekončne N pri q = 0 postane porazdelitev zeta.

Uporaba uredi

Zipf-Mandelbrotov zakon se uporablja v jezikoslovju (kvantitativna lingvistika). Opisuje porazdelitev besed (ne skupin besed, kot so fraze) v besedilih naravnih jezikov oziroma v besedilnih korpusih. Porazdelitev besed v poljubnem besedilu po pogostosti (frekvenci) pojavljanja se podreja potenčni porazdelitvi, ki je znana kot Zipfov zakon. Če prikažemo pogostost (frekvenco) pojavljanja (v padajočem redu) posameznih besed v zelo velikih besedilih, dobimo porazdelitev, ki je potenčna in ima eksponent zelo blizu vrednosti 1. Lahko jo zapišemo kot

.

Eksponent ima vrednost, ki je zelo blizu 1. Podoben zakon velja še na nekaterih drugih področjih (ekonomija, fizika, biologija, demografija, glasba, bibliografija). Iz tega sledi, da se določene besede v naravnih jezikih uporabljajo bolj pogosto kot druge.

Značilnosti uredi

Funkcija verjetnosti uredi

Funkcija verjetnosti je enaka  
kjer je

  • : .

Zbirna funkcija verjetnosti uredi

Zbirna funkcija verjetnosti je  .

Pričakovana vrednost uredi

Pričakovana vrednost je enaka  .

Modus uredi

Modus je enak  .

Glej tudi uredi

Zunanje povezave uredi