Metode linear kongruen

Dari testwiki
Loncat ke navigasi Loncat ke pencarian

Metode linear kongruen (Inggris: linear congruent method, dapat disingkat dengan LCM) merupakan algoritma yang menghasilkan barisan bilangan acak semu lewat persamaan linear bagian-demi-bagian. Metode ini juga dikenal dengan metode kongruen linear, pembangkit kongruensial linear dan generator kongruensial linear (Inggris: linear congruential generator, LCG). Metode ini termasuk algoritma yang tertua dan terkenal untuk membangkitkan bilangan acak semu.[1] Konsep metode ini relatif mudah dipahami, mudah diimplementasikan, dan memiliki waktu eksekusi yang cepat, khususnya untuk perangkat keras komputer yang mendukung aritmetika modular dengan pemotongan pada bit-bit penyimpanan. LCM memanfaatkan relasi rekursif linear:

Xn+1=(aXn+c)modm

dengan X sebagai barisan bilangan acak semu, dan konstanta bilangan bulat

m positif sebagai "modulus"
a dengan 0<a<m sebagai "pengali"
c dengan 0c<m sebagai "penambah"; dan
X0 dengan 0X0<m sebagai "benih", "nilai awal", atau "kondisi awal"

sebagai parameter khas untuk LCM. Jika c=0, metode ini umum disebut degan metode kongruensial multiplikatif (Inggris: multiplicative congruential generator, MCG) atau pembangkit Lehmer. Jika c0, metode ini disebut metode kongruensial campuran.[2] Ketika c0, relasi rekursif LCM sebenarnya adalah sebuah transformasi affine, bukan transformasi linear. Namun penggunaan istilah linear yang salah sudah sangat umum pada bidang ilmu komputer.[3]

Demonstrasi

Terdapat 50 soal pada sebuah sistem database ujian. Untuk setiap ujian, 5 soal akan dipilih secara acak dari database. Untuk mengusahakan tidak terjadi repetisi soal-soal yang telah dikerjakan, sistem memilih soal "baru" dengan menggunakan LCM; dengan konstanta a=11, c=7, m=50, dan X0=1. Berikut adalah lima bilangan acak (semu) pertama yang dihasilkan oleh LCM tersebut

  • X1=(11(1)+7)  mod  50=18
  • X2=(11(18)+7)  mod  50=5
  • X3=(11(5)+7)  mod  50=12
  • X4=(11(12)+7)  mod  50=39
  • X5=(11(39)+7)  mod  50=36

Lebih lanjut, barisan 20 bilangan acak pertama yang dibangkitkan adalah: 18, 5, 12, 39, 36, 3, 40, 47, 24, 21, 38, 25, 32, 9, 6, 23, 10, 17, 44, 42.

Pemilihan nilai konstanta pada a, c, dan m pada LCM ini sesuai untuk menghindari perulangan soal pada saat melakukan ujian. Saat melakukan ujian pertama kali, nilai X1 dan peserta akan mendapatkan soal bernomor {18, 5, 12, 39, 36}. Namun ujian yang kedua memiliki nilai awal X6 dan peserta akan mendapatkan soal bernomor {3, 40, 47, 24, 21}.

Sejarah

Metode pembangkit Lehmer dipublikasikan pada tahun 1951,[4] dan the Metode linear kongruen dipublikasikan pada tahun 1958 oleh W. E. Thomson and A. Rotenberg.[5][6]

Panjang periode

Dua LCM modulo 9 menunjukkan bagaimana parameter yang berbeda dapat menghasilkan periode yang berbeda. Setiap baris menunjukkan keadaan LCM sampai keluarannya berulang. Baris pertama menunjukkan LCM dengan m = 9, a = 2, c = 0, dan benih bernilai 1, yang menghasilkan periode sebesar 6. Baris kedua berisi LCM yang sama, tetapi dengan benih bernilai 3, yang menghasilkan periode 2. Menggunakan a = 4 dan c = 1 pada baris ketiga menghasilkan periode 9, untuk setiap benih di [0, 8].

Ciri dari LCM adalah akan terjadi pengulangan hasil setelah sekian kali pembangkitan. Dengan pemilihan parameter yang baik, periode pengulangan dapat diketahui dan dipilih agar lebih lama. Walaupun bukan satu-satunya kriteria, periode yang sangat singkat adalah kesalahan fatal bagi pembangkit bilangan acak semu.[7][8]

Walaupun LCM dapat menghasilkan bilangan acak semu yang lulus uji keacakan, kualitas bilangan yang dihasilkan sangat sensitif terhadap pemilihan parameter a dan m.[3][7][9][10][11][12] Sebagai contoh, a=1 dan c=1 menghasilkan bilangan modulo-m yang terurut, yang walau memiliki periode yang panjang, jelas tidak acak. Secara historis, pemilihan konstanta a yang buruk berujung pada implementasi LCM yang buruk. Contoh khusus kasus ini adalah RANDU, yang digunakan secara luas pada awal 1970-an dan berujung pada banyak hasil yang tidak kredibel.[13]

Terdapat tiga keluarga parameter yang umum digunakan:

m bilangan prima, c = 0

Templat:MainIni adalah konstruksi dasar dari pembangkit bilangan acak Lehmer. Periode LCM adalah m1 jika pengali a dipilih sebagai elemen primitif dari modulo m. Kondisi awal perlu dipilih antara 1 dan m1.

Kelemahan dari menggunakan modulus bilangan prima adalah operasi modulo memerlukan double-width productdan langkah operasi modulo yang eksplisit. Umumnya prima yang dekat dengan perpangkatan angka 2 ( prima Mersenne yang berbentuk 231−1 dan 261−1 populer), sehingga operasi modulo m=2ed dapat dihitung sebagai

(ax  mod  2e)+dax2e

Hal ini perlu diikuti oleh pengurangan nilai m jika hasilnya terlalu besar, namun banyaknya pengurangan terbatas oleh ad/m, yang dapat dibatasi dengan mudah menjadi 1 jika nilai d kecil.

Jika double-width product tidak tersedia, namun pengali dipilih secara seksama, metode Schrage[14] dapat digunakan. Untuk melakukannya:

  • Faktorkan m=qa+r, misal dengan q=m/a dan r=m  mod  a.
  • Hitung nilai ax  mod  m=a(x  mod  q)rx/q
  • Karena x  mod  q<qm/a, suku pertama tegas lebih kecil dari am/a=m. Jika a dipilih sehingga rd (sehingga r/q1), maka suku kedua juga akan lebih kecil dari m karena rx/qrx/q=x(r/q)x<m.

Dengan cara ini, untuk menghitung kedua suku cukup digunakan single-width product, dan selisih antara keduanya terletak di [1m,m1], sehingga dapat disederhanakan menjadi [0,m1] dengan satu kondisi penjumlahan.[15]

Kekurangan kedua dari metode ini adalah cukup canggung untuk mengonversi nilai 1x<m ke distribusi bit acak yang uniform. Jika sebuah prima yang dekat dengan perpangkatan 2 digunakan, bilangan acak (yang tidak pernah muncul) dapat diabaikan.

m perpangkatan 2, c = 0

Memilih m sebagai perpangkatan dari 2, umumnya m=232 atau m=264, menghasilkan LCM yang efisien karena hal ini memungkinan operasi modulo dihitung dengan memotong representasi biner bilangan. Faktanya, bit paling signifikan umumnya tidak dihitung sama sekali. Namun, parameter ini memiliki kekurangan.

Bentuk ini memiliki periode maksimum m/4, diperoleh ketika a3  mod  8 atau a5  mod  8. Kondisi awal X0 perlu bilangan ganjil, dan nilai tiga bit terkecil dari X berseling antara dua nilai sehingga tidak berguna. Dapat ditunjukkan bahwa bentuk ini setara dengan pembangkit dengan modulus m/4 dan c0.[12]

Isu yang lebih serius karena menggunakan modulus perpangkatan 2 adalah bit-bit rendah memiliki periode yang lebih kecil dibandingkan bit-bit tinggi. Bit terendah dari X tidak pernah berubah (karena selalu bilangan ganjil), dan dua bit selanjutnya berseling antara dua nilai (jika a5  mod  8, nilai bit 1 tidak pernah berubah dan nilai bit 2 berseling, sedangakan jika a3  mod  8 nilai bit 1 berseling dan nilai bit 2 selalu tetap).

c ≠ 0

Ketika c0, pemilihan parameter yang baik memungkinkan periode dapat sepanjang m, untuk semua kondisi awal. Hal ini terjadi, jika dan hanya jika:[12]

  1. m dan c koprima ,
  2. a1 dapat dibagi semua faktor prima dari m,
  3. a1 dapat dibagi 4 jika m dapat dibagi 4.

Tiga syarat ini dikenal sebagai Teorema Hull–Dobell.[16][17]

Bentuk ini dapat digunakan untuk sebarang m, namun hanya bekerja dengan baik untuk m yang memiliki banyak faktor prima yang berulang, seperti perpangkatan angka 2. Jika m bilangan bebas-kuadrat, hal ini mengakibatkan a1  mod  m, menjadikannya pembangkit bilangan acak yang sangat buruk. Pengali dengan periode maksimum hanya tersedia ketika m memiliki faktor prima yang berulang.

Walau teorema Hull–Dobell memberikan periode yang maksimum, hal tersebut belum cukup untuk membuktikan pembangkit yang baik. Sebagai contoh, a1 yang lebih sulit dibagi oleh faktor-faktor prima m lebih disukai. Karena itu, jika m adalah perpangkatan angka 2, maka a1 perlu dapat dibagi 4 namun tidak dapat dibagi 8, misal a5  mod  8.[12]

Tentu, kebanyakan pengali menghasilkan barisan yang gagal untuk suatu uji keacakan, dan memilih pengali yang memenuhi semua kriteria uji cukup sulit. Uji spektral adalah salah satu uji keacakan terpenting.

Perhatikan bahwa modulus berupa perpangkatan angka 2 memiliki permasalahan yang sama dengan kasus c=0: k bit terendah menghasilkan pembangkit dengan modulus 2k dan karenanya memiliki periode 2k; hanya bit paling signifikan yang memiliki periode penuh. Jika sebuah bilangan acak semu kurang dari r yang diperlukan, menghitung rX/m memberikan hasil yang lebih baik ketimbang X  mod  r. Sayangnya pada kebanyakan bahasa pemrograman, bentuk terakhir lebih banyak digunakan karena lebih mudah ditulis

Pembangkit LCM sendiri tidak sensitif terhadap pemilihan c, selama nilainya koprima terhadap modulus (misal, jika m merupakan perpangkatan angka 2, maka c perlu bernilai ganjil), sehingga nilai c=1 umum dipilih.

Barisan yang dihasilkan dari pemilihan c yang lain dapat ditulis sebagai fungsi sederhana dari barisan ketika c=1.[12] Secara spesifik, jika Y adalah barisan yang didefinisikan dengan Y0=0 dan Yn+1=aYn+1  mod  m, maka barisan Xn+1=aXn+c  mod  m dapat ditulis sebagai fungsi affine dari Y:

Xn=(X0(a1)+c)Yn+X0=(X1X0)Yn+X0(modm).

Secara umum, dua barisan X dan Z yang memiliki pengali dan modulus yang sama memiliki hubungan:

XnX0X1X0=Yn=an1a1=ZnZ0Z1Z0(modm).

Parameter yang umum digunakan

Tabel berikut berisi daftar parameter LCM yang umum digunakan, termasuk fungsi rand() yang umum dimiliki oleh banyak kompilator. Tabel ini hanya menunjukkan parameter yang populer, bukan sebagai parameter implementasi yang baik. Tabel dengan parameter yang bagus tersedia.[3][18]

Sumber modulus

m

pengali

aTemplat:Ns

penambah

c

bit keluaran pada rand() atau Random(L)
Numerical Recipes 2³² 1664525 1013904223
Borland C/C++ 2³² 22695477 1 bit 30..16 pada rand(), 30..0 in lrand()
glibc (digunakan oleh GCC)[19] 2³¹ 1103515245 12345 bit 30..0
ANSI C: Watcom, Digital Mars, CodeWarrior, IBM VisualAge C/C++ [20]C90, C99, C11: Saran dalam ISO/IEC 9899,[21] C18 2³¹ 1103515245 12345 bit 30..16
Borland Delphi, Virtual Pascal 2³² 134775813 1 bit 63..32 dari seed × L
Turbo Pascal 2³² 134775813 (8088405₁₆) 1
Microsoft Visual/Quick C/C++ 2³² 214013 (343FD₁₆) 2531011 (269EC3₁₆) bit 30..16
Microsoft Visual Basic (versi 6 dan sebelumnya)[22] Templat:Math 1140671485 (43FD43FD₁₆) 12820163 (C39EC3₁₆)
RtlUniform dari Native API[23] 2³¹ − 1 2147483629 (7FFFFFED₁₆) 2147483587 (7FFFFFC3₁₆)
Apple CarbonLib, minstd_rand0 milik C++11[24] 2³¹ − 1 16807 0 lihat MINSTD
C++11's minstd_rand[24] 2³¹ − 1 48271 0 lihat MINSTD
MMIX oleh Donald Knuth 2⁶⁴ 6364136223846793005 1442695040888963407
Newlib, Musl 2⁶⁴ 6364136223846793005 1 bit 63..32
VMS's MTH$RANDOM,[25] versi lawas dari glibc 2³² 69069 (10DCD₁₆) 1
Java's java.utilTemplat:Not a typoRandom, POSIX [ln]rand48, glibc [ln]rand48[_r] 2⁴⁸ 25214903917 (5DEECE66D₁₆) 11 bit 47..16
random0[26][27][28][29][30] 134456 = 2³7⁵ 8121 28411 Xn134456
POSIX[31] [jm]rand48, glibc [mj]rand48[_r] 2⁴⁸ 25214903917 (5DEECE66D₁₆) 11 bit 47..15
POSIX [de]rand48, glibc [de]rand48[_r] 2⁴⁸ 25214903917 (5DEECE66D₁₆) 11 bit 47..0
cc65[32] 2²³ 65793 (10101₁₆) 4282663 (415927₁₆) bit 22..8
cc65 2³² 16843009 (1010101₁₆) 826366247 (31415927₁₆) bit 31..16
Pernah umum digunakan: RANDU [13] 2³¹ 65539 0

Seperti terlihat di atas, LCM tidak selalu menggunakan semua bit bilangan yang dihasilkan. Sebagai contoh, implementasi Java beroperasi dengan 48-bit pada setiap iterasi, tetapi hanya menghasilkan nilai dari 32 bit pertama. Hal ini disebabkan karena bit dengan order yang lebih tinggi memiliki periode yang lebih lama dibandingkan dengan bit dengan order rendah. LCM yang menggunakan teknik pemotongan bit ini menghasilkan nilai yang secara statistik lebih baik jika dibandingkan dengan yang tidak. Hal ini terlihat pada implementasi kode yang menggunakan operasi modulo untuk memperkecil jangkauan hasil; tanpa pemotongan, modulo 2 dari bilangan acak yang dihasilkan akan menghasilkan hasil 0 dan 1 yang periodik.

Kelebihan dan kekurangan

Hyperplane dari LCM pada ruang dimensi tiga. Struktur geometris yang dibentuk LCM adalah hal yang diukur oleh uji spektral.

Metode LCM cepat dan hanya memerlukan memori yang kecil (satu bilangan modulo-m, umumnya 32 atau 64 bit) untuk penyimpanan sementara bilangan yang dihasilkan. Hal ini yang membuat LCM berguna untuk menyimulasikan beberapa keadaan independen. LCM tidak ditujukan, dan jangan digunakan, untuk aplikasi dalam bidang kriptografi; pembangkit bilangan acak semu (Inggris: pseudo random number generator, PRNG) yang aman secara kriptografi diperlukan untuk hal tersebut.

Walau LCM memiliki beberapa kelemahan spesifik, kebanyakan kelemahannya diakibatkan dari pemilihan parameter yang terlalu kecil. LCM dengan parameter yang cukup besar dapat lulus dari tes statistik yang ketat; LCM modulo-2 yang menghasilkan 32 bit bilangan lulus SmallCrush oleh TestU01,Templat:Citation needed dan LCM 96-bit lulus dari tes BigCrush yang jauh lebih sulit.[33]

Untuk contoh yang spesifik, pembangkit bilangan acak semu (PNRG) dengan keluaran 32 bit, memiliki ekspektasi (lewat teorema Birthday) mulai mengulangi keluaran yang pernah dihasilkan setelah melakukan m216 keluaran. Setiap PNRG dengan keluaran tanpa pemotongan bit, tidak akan berulang sampai periode maksimumnya tercapai; sebuah cacat statistik yang mudah dideteksi. Dengan alasan serupa, PNRG perlu memiliki periode yang lebih panjang daripada akar dari banyak keluaran yang diinginkan. Mempertimbangkan kecepatan komputer modern, periode sebesar 264 dibutuhkan untuk aplikasi kurang penting (secara kriptografi), dan periode yang lebih besar untuk aplikasi yang penting.

Satu kecacatan spesifik LCM adalah, jika digunakan untuk memilih titik pada ruang dimensi n, titik tersebut akan terletak (maksimal) pada n!mn hyperplane, berdasarkan teorema Marsaglia (yang dikembangkan oleh George Marsaglia).[34] Hal ini disebabkan oleh serial correlation antar nilai yang berurutan pada barisan Xn. Pengali yang dipilih dengan lalai umumnya menghasilkan sedikit bidang, dengan jarak antar bidang yang besar, yang dapat menyebabkan masalah. Uji spektral, yang merupakan tes kualitas LCM yang sederhana, mengukur jarak antar bidang dan memungkinkan untuk memilih nilai pengali yang baik.

Jarak antar bidang bergantung pada modulus dan pengali LCM. Modulus yang cukup besar dapat memperkecil jarak ini sehingga kurang dari bilangan double precision. Pemilihan pengali menjadi kurang penting ketika modulus yang dipakai besar. Namun masih penting untuk menghitung indeks spektral dan memastikan tidak memilh pengali yang buruk, walau secara statistik hampir mustahil mendapatkan pengali yang buruk ketika nilai modulus lebih besar dari 264.

Salah satu kecacatan lain yang spesifik pada LCM adalah periode bit-rendah yang pendek ketika m dipilih sebagai bilangan perpangkatan 2. Hal ini dapat dihindari dengan menggunakan modulus yang lebih besar daripada banyak keluaran yang diinginkan, dan menggunakan bit-bit tinggi dari hasil yang dikeluarkan.

Walaupun demikian, LCM dapat menjadi pilihan yang bagus untuk beberapa aplikasi. Sebagai contoh, pada sistem tertanam, banyak memori yang tersedia sangat terbatas. Pada lingkungan yang serupa, seperti pada konsol permainan, mengambil beberapa bit-tinggi dari LCM mungkin sudah cukup. Keacakan nilai bit-bit rendah dari LCM dengan modulus berupa perpangkatan 2 tidak disarankan untuk digunakan. Hal ini disebabkan karena periode yang sangat pendek. Sebagai contoh, LCM dengan modulus berupa perpangkatan 2, dan dengan hasil yang tidak mengalami pemotongan bit, akan menghasilkan bilangan genap dan bilangan ganjil yang berselang-seling.

LCM perlu dievaluasi secara mendalam untuk penggunaan pada aplikasi non-kriptografis yang memerlukan kualitas keacakan tinggi. Untuk simulasi Monte Carlo dibutuhkan LCM dengan nilai modulus yang (jauh) lebih besar daripada pangkat tiga dari banyak keluaran yang dibutuhkan. Hal ini mengartikan, sebagai contoh, LCM 32 bit (yang baik) dapat digunakan untuk menghasilkan sekitar 1000 bilangan acak, dan LCM 64 dapat digunakan untuk menghasilkan 221 (sedikit diatas dua juta) bilangan. Karena keadaan tersebut, LCM secara praktis tidak cocok untuk simulasi Monte Carlo skala besar.

Implementasi

Berikut salah satu implementasi LCM dalam bahasa pemrograman Python:

def lcg(modulus, a, c, seed):
    """Linear congruential generator."""
    while True:
        seed = (a * seed + c) % modulus
        yield seed

Seperti semua pembangkit bilangan acak semu lainnya, LCM perlu menyimpan dan mengubah keadaan bilangan acak yang dihasilkan. Komputer dengan banyak utas yang mengakses keadaan ini dapat menyebabkan race condition. Implementasi dengan setiap utas memiliki inisialisasi nilai awal yang unik diperlukan agar tidak ada utas dengan barisan bilangan acak yang sama.

Turunan LCM

Terdapat beberapa pembangkit dengan bentuk yang didasarkan pada LCM, sehingga teknik yang digunakan untuk menganalisis LCM juga dapat dipakai untuk mereka.

Salah satu metode untuk menghasilkan periode yang lebih panjang adalah dengan menjumlahkan beberapa LCM, dengan periode yang berbeda dan memiliki faktor bersama yang besar. Pembangkit Wichmann-Hill adalah salah satu contoh metode ini. Metode ini dapat ditunjukkan ekuivalen dengan sebuah LCM dengan modulus sebagai hasil perkalian modulus LCM komponen-komponennya.

Referensi

Templat:Reflist

  1. Templat:Cite web
  2. Templat:Cite book
  3. 3,0 3,1 3,2 Templat:Cite journal
  4. Templat:Cite journal
  5. Templat:Cite journal
  6. Templat:Cite journal
  7. 7,0 7,1 Templat:Cite web
  8. Templat:Cite conference
  9. Templat:Cite journal
  10. Templat:Cite journal
  11. Templat:Cite journal
  12. 12,0 12,1 12,2 12,3 12,4 Templat:Cite book
  13. 13,0 13,1 Templat:Cite book
  14. Templat:Cite web
  15. Templat:Cite web
  16. Templat:Cite journal
  17. Templat:Cite book
  18. Templat:Cite journal
  19. Implementation in glibc-2.26 release. Templat:Webarchive See the code after the test for "TYPE_0"; the GNU C library's rand() in stdlib.h uses a simple (single state) linear congruential generator only in case that the state is declared as 8 bytes. If the state is larger (an array), the generator becomes an additive feedback generator (initialized using minstd_rand0 Templat:Webarchive) and the period increases. See the simplified code that reproduces the random sequence from this library.
  20. Templat:Cite book
  21. Templat:Cite web
  22. Templat:Cite web
  23. In spite of documentation on MSDN, RtlUniform uses LCG, and not Lehmer's algorithm, implementations before Windows Vista are flawed, because the result of multiplication is cut to 32 bits, before modulo is applied
  24. 24,0 24,1 Templat:Cite web
  25. GNU Scientific Library: Other random number generators
  26. Stephen J. Chapman. "Example 6.4 – Random Number Generator". "MATLAB Programming for Engineers". 2015. pp. 253–256.
  27. Stephen J. Chapman. "Example 6.4 – Random Number Generator". "MATLAB Programming with Applications for Engineers". 2012. pp. 292–295.
  28. S. J. Chapman. random0. 2004.
  29. Stephen J. Chapman. "Introduction to Fortran 90/95". 1998. pp. 322–324.
  30. Wu-ting Tsai. "'Module': A Major Feature of the Modern Fortran" Templat:Webarchive. pp. 6–7.
  31. The Open Group Base Specifications Issue 7 IEEE Std 1003.1, 2013 Edition
  32. Templat:Cite web
  33. Templat:Cite techreport
  34. Templat:Cite journal