Aturan Sturges

Dari testwiki
Loncat ke navigasi Loncat ke pencarian

Templat:Orphan

Templat:Short description Aturan Sturges,[1] kaidah Sturges, atau rumus Sturges adalah metode untuk menentukan banyaknya kelas saat membuat histogram. Diberikan n data observasi, aturan Sturges menyatakan bahwa jumlah dari kelas histogramnya ialah k^=1+2log(n) kelas. Aturan ini dinamai dari Herbert Sturges.

Aturan ini digunakan secara luas pada perangkat lunak analisis data, termasuk Python[2] dan R, dimana aturan ini merupakan metode bawaan dalam pemilihan kelas.[3]

Penurunan rumus

Aturan Sturges berasal dari distribusi binomial yang digunakan sebagai hampiran diskrit dari distribusi normal.[4] Jika fungsi f yang akan didekati berdistribusi binomial, maka f(i)=(mi)pi(1p)mi dengan

  • m menyatakan banyaknya percobaan
  • p menyatakan peluang berhasil, dan
  • i menyatakan banyaknya percobaan yang berhasil dari m percobaan yang dilakukan.

Perhatikan bahwa i memiliki m+1 nilai, yaitu i{0,1,2,,m}. Jika i diartikan sebagai indeks kelas, maka diperoleh relasi k=m+1 atau m=k1. Dengan memilih nilai p=12, maka diperoleh f(i)=(mi)pi(1p)mi=(k1i)(12)i(12)k1i=(k1i)(12)k1=(k1i)2(k1) Berdasarkan persamaan di atas, maka suku 2(k1) dapat dipandang sebagai faktor penormalan dan aturan Sturges menyatakan bahwa sampelnya harus menghasilkan histogram dengan banyaknya sampel pada masing-masing kelas sesuai dengan koefisien binomial, yaitu kelas ke-i memiliki (k1i) data observasi. Oleh karena banyaknya sampelnya berjumlah tetap (yaitu sebanyak n), maka didapatkan n=x=0k1(k1x)=2k1 melalui rumus jumlah dari koefisien binomial. Akibatnya, diperoleh 2k1=nk1=2log(n)k=1+2log(n) Secara umum, hasil dari aturan Sturges bukanlah bilangan bulat, sehingga harus dilakukan pembulatan.

Referensi

Templat:Reflist