Mengenal Ilmu Statistik Lebih Dekat
Statistika [atau perangkaan] yaitu sains dan aplikasi dalam membangunkan pengetahuan insan melalui penggunaan data empirikal. Statistika berasaskan teori statistika yaitu salah satu daripada cabang matematika. Dalam teori statistika, kerawakan dan ketidakpastian dimodelkan berasaskan teori kebarangkalian. Statistika termasuk perancangan, meringkaskan, dan memahami pemerhatian yang tidak menentu. Tujuan statistika yaitu menghasilkan maklumat "terbaik" daripada data yang ada, sesetengah orang menggolongkan statistika sebagai cabang teori keputusan.
Asal bidang statistika
Perkataan statistika berasal dari perkataan Latin moden frasa statisticum collegium [syarahan mengenai keadaan semasa], yang mana perkataan bahasa Itali perkataan statista, yang bererti "negarawan" atau "ahli politik".
Masih hangat dari ingatan kita perihal hasil survey fenomenal pada tahun 2002 dari seorang dosen filsafat Universitas Gadjah Mada [Iip Wijayanto] yang menyebutkan bahwa 97,05% Mahasiswi di Yogyakarta sudah kehilangan kewanitaannya. Lepas dari kebenaran informasi tersebut, yang perlu kita kritisi adalah:
Statistika ialah ilmu yang membahas perihal pengumpulan, penyusunan, analisa, interpretasi dan penyajian data. Tujuan penggunaan Statistika yaitu untuk memprediksi dan mencegah suatu keabnormalan proses, bukan hanya sekedar inspeksi dan deteksi terhadap keabnormalan proses. Secara umum, Ilmu statistik ada 2 jenis yaitu :
DATA
Dalam melaksanakan suatu observasi dibutuhkan data-data yang accountable. Data yang baik apabila diolah maka akan menghasilkan informasi yang mempunyai kegunaan atau bermanfaat. Makara yang dimaksud dengan data yaitu sekumpulan fakta, angka atau segala sesuatu yang sanggup mendapatkan amanah kebenarannya sehingga sanggup digunakan sebagai rujukan dalam mengambil keputusan.
JENIS DATA
Data variable : disebut juga data continues atau measurement. Data ini berasal dari hasil pengukuran dan nilainya berada dalam suatu interval atau jangkaun tertentu, pola : Hasil pengukuran berat tubuh dari 46 Inspector di PQA, hasill pengukuran panjang Frame Main DV28EC selama 1 bulan, dll.
Data attribute : disebut juga data diskrit atau data non continues. Umumnya data ini merupakan hasil perhitungan dan berupa bilangan bulat, contoh: Jenis suku bangsa Inspector PQA, jenis kelamin [pria/ wanita], jumlah karyawan yang tidak masuk per hari, dll.
Alasan Perlunya Pengumpulan Data
Perlu diketahui bahwa data merupakan sebuah langkah awal dalam suatu analisa untuk mengambil keputusan. Jika data yang kita kumpulkan tidak sistematis, akurat dan kasatmata maka keputusan yang dihasilkan tentunya tidak akan akurat dan tidak sanggup dipertanggungjawabkan kebenarnnya. Dengan kata lain data yang dikumpulkan akan terbuang sia-sia. Makara perlu dipikirkan terlebih dahulu point-point perihal apa saja yang akan dikumpulkan sebelum kita memulai aktifitas pengumpulan data, misalnya: Jenis defect, waktu, biaya, dll.
Dalam suatu penelitian atau observasi terhadap suatu object ekosistem yang jumlah populasinya besar. Metode sampling akan dipilih dengan mempertimbangkan keterbatasan waktu, biaya dan kepraktisan. Sampling secara statistik memungkinkan kita mengumpulkan informasi perihal suatu populasi tanpa kita harus meneliti secara keseluruhan.
Salah satu kelebihan kita menggunakan sampling secara statistik yakni kita sanggup menentukan tingkat akurasi dan ketepatan pengujian kita sebelum disebarkan. Dalam penerapannya untuk membedakan antara populasi dan sample, para mahir statistik menunjukkan simbol yang berbeda dan perhitungan yang sedikit berbeda.
Sebelum kita membahas lebih jauh lagi, ada beberapa terminology yang perlu diketahui terlebih dahulu, yakni:
1. Populasi
Seluruh item yang membentuk suatu kelompok yang menarik untuk diteliti dan populasi ini harus ditentukan sebelum kita menetapkan untuk mengambil sampling, pola : semua supplier part stamping untuk TEI, part stamping yang digunakan pada drive model DW224EV, dll.
2. Kerangka sampling
Sebuah daftar , data base atau pengenal khusus lainnya perihal item-item yang akan diikutsertakan menjadi sample, pola : Bill Of Material yang meliputi semua stamping part pada drive model DW224EV, Data di SAP yang menyimpan list semua supplier stamping part untuk TEI, dll.
3. Unit sampling
Item sesungguhnya yang diikutkan dalam sampling, contoh: Sebuah Screw, dll.
4. Bias
Merupakan perbedaan antara data yang kita kumpulkan dalam sample dengan “kondisi sebenarnya” dari populasi. Hal ini sanggup mempengaruhi hasil interprestasi kita terhadap hasil statistik yang dihasilkan [D.Manggala, 2005].
Jenis-Jenis Sampling
Menurut Augustine A.Stagliano dalam bukunya Rath and Strong’s Six sigma Advance Tool Pocket Guide [2004] disebutkan bahwa sampling diklasifikasikan menjadi beberapa jenis :
Ditinjau dari segi jenisnya, sampling dikategorikan menjadi 2, yakni:
Sampel Judgmental
Contoh: PT. Livatech bermaksud mengadakan customer satisfication survey. Dari 20 customer yang ada hanya diambil sample 5 customer yang utama saja dengan pertimbangan kelima customer tersebut ordernya diatas 100.000 Part/ bulan.
Sampel Statistical
Metode Sampling
Sekurangnya ada 3 metode sampling, yakni:
1. Systematic sampling : Dalam pengambilan sampel, metode ini menekankan pengambilan yang teratur dengan interval frekuensi yang jelas, contohnya : setiap pengambilan sampel dilakukan diawal shift, pengambilan sampel setiap kelipatan 100 Pcs, dll.
2. Random sampling : Pengambilan sampel ini dilakukan secara acak dan umumnya dibantu dengan statistical software [MINITAB]. Metode ini dipandang cukup kondusif dari bias.
3. Stratified sampling : Ciri khas dari metode sampling ini yaitu adanya penggolongan sebuah group yang sangat besar menjadi sub-group dan dalam sub-group ini gres dilakukan pengambilan sampel secara sistematik maupun random.
Pengukuran Central Tendency
Untuk mengukur Central Tendency [diterjemahkan secara bebas = ukuran letak] biasanya menggunakan indikator-indikator mean [rata-rata], median [nilai tengah] dan modus [nilai yang sering muncul].
Mean [rata-rata] ialah jumlah semua observasi dibagi dengan banyaknya jumlah data. Nilai mean sangat dipengaruhi oleh nilai-nilai yang ekstrim.
Median ialah Nilai tengah dari sederetan data yang sudah terurut mulai dari nilai terkecil sampai terbesar [diranking]. Median tidak dipengaruhi oleh nilai-nilai yang ekstrim. Jika banyaknya data ganjil maka median sama dengan nilai data yang sempurna berada ditengah-tengah. Namun jikalau banyaknya data genap maka median sama dengan rata-rata dari dua nilai yang berada ditengah. Hal inilah yang sanggup dikatakan bahwa median sama dengan 50th percentile atau kuartile kedua [Q2]. Sebagai informasi pelengkap saja bahwa median umumnya digunakan pada distribusi yang miring [skew] sedang distribusi yang seimbang umumnya menggunakan mean.
Modus yaitu nilai yang paling sering muncul.
Pengukuran Variasi
Pengertian variasi dalam konteks ini diterjemahkan sebagai ukuran penyebaran.
Parameter-paremeter yang umum digunakan yaitu :
- Range [jangkauan] ialah perbedaan antara nilai terbesar dengan nilai terkecil.
- Variance ialah rata-rata kuadrat jarak dari tiap-tiap titik ke rata-rata.
- Standar deviasi merupakan akar dari variance.
Dengan sedikit klarifikasi diatas tentunya kita akan mengetahui bahwa dengan rata-rata saja tidak cukup untuk menciptakan suatu kesimpulan dari data yang kita analisa. Kita perlu mengukur variasi tentunya. Untuk lebih jelasnya, perhatikan pola berikut ini :
Ada 3 buah perusahaan multinasional di Batam sedang disurvey, sampling dilakukan dengan mengambil 5 orang karyawan tiap-tiap perusahaan dengan hasil berikut [dalam Juta Rupiah]. Tujuan dari survey ini yaitu untuk menunjukan apakah bisa dikatakan honor karyawan di Batam itu “rata-rata sama Rp3.000.000,00”?
Dengan melihat data diatas belum sanggup dikatakan bahwa dua group yang mempunyai mean dan median sama itu dikategorikan sama secara statistik.
1. Discrete distributions [untuk non continuous data].
2. Continuous distributions.
Bentuk-bentuk Distribusi
Secara umum, bentuk-bentuk ditribusi yaitu sebagai berikut:
- Simetris, bila rata-rata = median atau angka skewness = 0
- Right Skewed [Positif], bila rata-rata > median
- Left Skewed [Negatif], bila rata-rata <>
Untuk mempercepat dan membantu kita dalam mengetahui persebaran data, penggunaan histogram merupakan suatu langkah yang cepat untuk mengetahui bentuk distribusi suatu data.
Discrete Distributions
Jenis discrete distributions yang umum sering digunakan antara lain:
1. Binomial distributions - Untuk lebih gampang dalam pemahaman, mungkin akan lebih gampang diterima jikalau menggunakan sebuah pola : Anda seorang pemain Futsal yang sedang melatih kemampuan untuk menendang bola ke gawang dari luar tempat Keeper. Anda melaksanakan 6 tendangan setiap set dengan posisi serong kiri-serong kanan dan depan, masing-masing 2 bola [total 6 bola setiap set]. Dan dari sekian kali set, setelah dirata-rata anda mendapatkan 3 Gol dari 6 kali tendangan. Dalam hal ini nilai kemungkinan GOL yaitu 0,5. Dari data ini kita sanggup mengitung kemungkinan akan GOL jikalau menendang 300 kali.
2. Poisson distributions - Banyak analisis dilakukan untuk jumlah suatu kejadian per area of opportunity dimana area per opportunity sanggup berupa waktu, ruang maupun area. Misalnya : Anda sedang mengantri di Bank dan masih menunggu usang sekali untuk dilayani. Mungkin anda menghitung dalam hati berapa pelanggan yang tiba setiap satu menit. Dalam satu menit pertama ada sepuluh orang yang tiba berbarengan, menit ketiga ada dua orang, menit ke sepuluh ada tujug orang datang. Jika anda setiap hari menghitung laju kedatangan pelanggan per menit, dalam sebulan anda akan mempunyai rata-rata laju kedatangan pelanggan per menit. Disini anda sanggup dikatakan punya distribusi yang disebut dengan Poisson disitribution. Distribusi ini sangat penting dalam analisis operasi terutama dalam analisis produktivitas sistem atau peralatan yang menggunakan teori antrian atau Queue theory. [D.Manggala, 2005]
Continuous Distributions
Distribusi yang umum digunakan pada jenis Continous distribution, antara lain:
1. Normal Distributions Banyak kejadian yang muncul secara acak [random] menghasilkan data dengan distribusi bell shaped. Kurva yang menghubungkan puncak-puncak batang disebut Kurva Peluang Normal yang digunakan untuk meng-estimasi Distribusi Normal dari kejadian-kejadian yang muncul secara acak [random]. Dalam kasus-kasus yang umum terjadi, perkiraan yang digunakan dalam analisis yaitu bahwa data yang kita dapatkan terdistribusi dengan normal dan simetris. Hal ini berarti bahwa kita perlu terlebih dahulu menguji bisa tidaknya suatu group dikatakan terdistribusi secara normal. Dan jikalau anda menggunakan statistical software [MINITAB], hidangan pilihan untuk menguji kenormalan distribusi telah tersedia dan juga sanggup melihat bentuk dari kurvanya [simetris ataukah miring].
2. Exponential Distribution
Secara sederhana distribusi eksponensial sanggup dijelaskan sebagai suatu distribusi dari data-data yang menggambarkan periode [waktu] ataupun ruang diantara dua kejadian. Contoh yang paling umum dalam penerapan distribusi eksponensial ini yaitu dalam mengukur periode kerusakan sebuah mesin [MTBF = Mean Time Between Failure]
Mengenal Confidence Interval
Sebagaimana telah disebutkan pada klarifikasi diawal bahwa kita mengambil suatu kesimpulan menurut analisis yang dilakukan hanya atas dasar sampel yang diambil. Kenyataan yang terjadi bahwa [misal: rata-rata] rata-rata sampel itu ternyata tidak sama persis dengan rata-rata populasi. Dengan kata lain tentunya dalam hal ini terdapat perbedaan rata-rata antara sampel satu dengan sampel lainnya dalam satu populasi yang sama [populasi yang diambil].
Perbedaan hasil statistik antara satu sampel dengan sampel lainnya inilah yang disebut dengan “sampling error”. Jika kita memperbesar ukuran sample maka akan menghasilkan “sampling error” yang lebih kecil. Para mahir statistik mengeluarkan konsep estimasi interval dimana nilai karakteristik suatu populasi diperkirakan dengan suatu tingkat kepastian akan berada didalam suatu interval. Interval ini disebut dengan Confidence Interval Estimated. Ini merupakan suatu konsep yang sangat penting dalam analisis statistik.
Pada umumnya, analisis six sigma menggunakan Confidence Interval Estimated sebesar 95%, hal ini berarti bahwa : jikalau semua sampel diseleksi dalam ukuran “n”, maka 95% dari sampel itu akan memasukan parameter populasi dalam interval hasil estimasi. Untuk menciptakan estimasi interval, anda mesti mengetahui statistik dari sampel yang anda gunakan untuk menganalisis karakteristik populasi dan distribusi samplingnya.
Confidence interval = Titik estimasi sampel + Margin of error
Mengenal Hypothesis Test
Seringkali kita dihadapkan pada keharusan untuk membandingkan 2 buah group data atau lebih, hal ini tentunya membutuhkan suatu analisis. Disinilah konsep Hypothesis test diperlukan. Sebelum masuk pada pembahasan lebih jauh, terlebih dahulu perlu diperkenalkan perihal Type I Error dan Type II Error. Agar lebih jelas, perhatikan pola berikut ini. Masih hangat dalam ingatan kita perihal masalah Roy Marteen tersangka Narkoba. Tentunya hipotesis awal beliau dianggap “tidak bersalah” dan hipotesis alternatifnya tentu saja beliau “bersalah”.
Ho = Roy Marteen tidak bersalah
Ha = Roy Marteen bersalah Test hipotesis ini bertujuan menunjukan apakah keputusan yang kita ambil benar-benar sesuai dengan kenyataan yang sebenar-benarnya. Oleh alasannya yaitu itu kondisi antara keputusan yang kita ambil dengan kenyataan yang bergotong-royong sanggup digambarkan sebagai berikut :
Dari Matriks diatas sanggup dilihat bahwa ada 2 kemungkinan hakim melaksanakan kesalahan : Kesalahan tipe I : Memenjarakan orang yang tidak bersalah Kesalahan tipe II: membebaskan orang yang bersalah
Kemungkinan melaksanakan kesalahan tipe I didefinisikan sebagai alpha [siginificance level], dimana 0 Kurang dari atau sama dengan alpha dan alfa kurang dari atau sama dengan 1. Kemungkinan melaksanakan kesalahan tipe II didefinisikan sebaga Betta, dimana 0 kurang dari atau sama denga betta dan betta kurang dari atau sama dengan 1.
Pada umumnya, kuputusan kritis berasal dari kesalahan tipe I.
Secara Umum, hypothesis sanggup dinyatakan dalam persamaan berikut :
Untuk menguji rata-rata dengan test hypothesis biasanya dilakukan dengan t-test, dengan langkah sederhana berikut:
Catatan : Distribusi t merupakan pooled distribution dari standard deviasi dua sampel yang berbeda. Untuk keterangan lebih lengkap silahkan membaca buku-buku perihal statistik. Untuk pola sederhana, perhatikan masalah berikut ini : Sebuah perusahaan ingin melaksanakan pengujian statistik untuk menunjukan apakah terdapat perbedaan penggajian antara pegawai laki-laki dan wanita. Hal ini dilakukan untuk menepis informasi adanya diskriminasi terhadap pegawai wanita, yaitu pegawai perempuan diberikan honor yang lebih rendah dari pegawai laki-laki [pada golongan dan masa kerja yang sama].
Oleh alasannya yaitu itu departement Sumber Daya Manusia Mengumpulkan data honor pegawai dan membandingkan honor pegawai laki-laki dan perempuan setelah dikelompokan pada golongan dan masa kerja yang sama. Dalam melaksanakan pengujian, hypothesisnya adalah:
Ho = Gaji pegawai laki-laki dan perempuan yaitu sama
Ha = Gaji pegawai laki-laki tidak sama dengan pegawai wanita
Langkah berikutnya yaitu menentukan confidence interval, yakni dipilih 95% [alpha = 0,05] kemudian dilakukan pengujian dengan MINITAB yang menghasilkan p value sebesar 0,34 atau untuk two-sided test menjadi 0,68 Karena p lebih besar dari alpha [jauh lebih besar dari alpha] maka sanggup dikatakan bahwa kita tidak mempunyai bukti untuk menolak hipotesis awal yakni bahwa honor pegawai laki-laki dan perempuan yaitu sama. Dengan kata lain sanggup disimpulkan bahwa dengan data yang ada kita perpendapat tidak ada perbedaan antara honor pegawai laki-laki dan perempuan [D. Manggala, 2005].
Pengujian Perbedaan antara Dua proporsi
Untuk pengujian proporsi, persamaan yang umum digunakan adalah
Langkah pengujiannya hampir sama dengan t-test untuk rata-rata, yaitu:
Pengujian Perbedaan Variances antara 2 group yang berbeda
Kembali ke konsep awal bahwa untuk mengetahui apakah variasi antara 2 group yang akan diuji secara statistik sanggup dianggap sama atau tidak, dibutuhkan suatu pengujian untuk menguji variance yang dikenal dengan F-test. Dan mengulang pembahasan sebelumnya bahwa jikalau variance kedua group yang diuji secara statistik bisa dianggap sama maka sanggup menggunakann “pooled-variance t-test” tetapi jikalau tidak bisa dianggap sama maka digunakan “separate-variance t-test”. Persamaan umum pengujian variances yang sering dipakai:
Lagi, sebagai pengingat saja. Asumsi yang digunakan yaitu bahwa data yang diuji terdistribusi secara normal. Namun untuk “mengatakan”itu perlu dilakukan pengujian terlebih dahulu. Pengujian yang perlu dilakukan yakni test “kenormalan” terhadap data-data kita sebelum F-test. Pengujian tersebut sudah tersedia di MINITAB. Langkah pengujian dua F-test untuk variances yaitu sebagai berikut:
Sebagai pola saja kita mempunyai 4 group data, kita sanggup mengujinya apakah keempat group tersebut mempunyai rata-rata yang sama ataukah tidak, Ingat hanya dalam sekali pengujian. Secara sederhana sanggup ditampilkan dengan hipotesis berikut:
Ho = Semua rata-rata dari populasi yaitu sama
Ha = Tidak semua rata-rata dari populasi yaitu sama Jika kita bermaksud menguji hanya satu variable maka hidangan yang kita pilih yaitu one-way ANOVA tetapi jikalau ada dua variable yang akan diuji maka menggunakan two-way ANOVA.
Dan mengingat pembahasan ANOVA sangat panjang, alangkah baiknya jikalau diperdalam dengan membaca buku-buku Statistika.
Demikian klarifikasi sederhana perihal statistika, jikalau tertarik dengan soal-soal perihal statistika yang pernah diujikan pada Ujian Nasional atau SBMPTN silahkan cek disini untuk data tunggal atau disini untuk data berkelompok.
Data disadur dari aneka macam sumber, bila Anda merasa pemilik sebagian atau keseluruhan konten diatas dan keberatan ditampilkan. Anda sanggup menghubungi Admin Blog, dan Admin Blog akan dengan bahagia hati menanggapi ajakan Anda. Terima kasih | Admin Blog.
Pernah dengar PT.Inalaum, coba simak video perkenalan dari PT.INALUM ini siapa tahu Anda nanti bisa berkarya disana;
Sumber http://www.defantri.com
Asal bidang statistika
Perkataan statistika berasal dari perkataan Latin moden frasa statisticum collegium [syarahan mengenai keadaan semasa], yang mana perkataan bahasa Itali perkataan statista, yang bererti "negarawan" atau "ahli politik".
Masih hangat dari ingatan kita perihal hasil survey fenomenal pada tahun 2002 dari seorang dosen filsafat Universitas Gadjah Mada [Iip Wijayanto] yang menyebutkan bahwa 97,05% Mahasiswi di Yogyakarta sudah kehilangan kewanitaannya. Lepas dari kebenaran informasi tersebut, yang perlu kita kritisi adalah:
- Bagaimanakah sampling dilakukan [metode sampling]?
- Berapa besar samplenya?
- Berapa standar deviasi dari datanya?
- Berapa % Error-marginnya?, dan masih banyak lagi pertanyaan-pertanyaan fundamental yang perlu dikemukakan untuk memastikan kesimpulan dari penelitian tersebut sanggup diterima.
Statistika ialah ilmu yang membahas perihal pengumpulan, penyusunan, analisa, interpretasi dan penyajian data. Tujuan penggunaan Statistika yaitu untuk memprediksi dan mencegah suatu keabnormalan proses, bukan hanya sekedar inspeksi dan deteksi terhadap keabnormalan proses. Secara umum, Ilmu statistik ada 2 jenis yaitu :
- Statistik Deskriptif [Memberikan informasi perihal kinerja dari sebuah proses].
- Statistik Inferensial [Memberikan informasi perihal prediksi yang berafiliasi dengan kinerja sebuah proses atau Peluang].
DATA
Dalam melaksanakan suatu observasi dibutuhkan data-data yang accountable. Data yang baik apabila diolah maka akan menghasilkan informasi yang mempunyai kegunaan atau bermanfaat. Makara yang dimaksud dengan data yaitu sekumpulan fakta, angka atau segala sesuatu yang sanggup mendapatkan amanah kebenarannya sehingga sanggup digunakan sebagai rujukan dalam mengambil keputusan.
JENIS DATA
Data variable : disebut juga data continues atau measurement. Data ini berasal dari hasil pengukuran dan nilainya berada dalam suatu interval atau jangkaun tertentu, pola : Hasil pengukuran berat tubuh dari 46 Inspector di PQA, hasill pengukuran panjang Frame Main DV28EC selama 1 bulan, dll.
Data attribute : disebut juga data diskrit atau data non continues. Umumnya data ini merupakan hasil perhitungan dan berupa bilangan bulat, contoh: Jenis suku bangsa Inspector PQA, jenis kelamin [pria/ wanita], jumlah karyawan yang tidak masuk per hari, dll.
Alasan Perlunya Pengumpulan Data
- Untuk mengumpulkan fakta-fakta perihal suatu problem atau kesempatan yang sanggup dikuantifikasi.
- Untuk memberikan fakta-fakta ini dalam bahasa yang sama.
- Untuk menetapkan informasi fundamental perihal sebuah proses.
- Untuk mengukur jumlah dan arah perubahan-perubahan yang terjadi.
- Untuk membandingkan citra proses sebelumnya dan sesudahnya
- Untuk memfasilitasi analisa laba [Cost Benefit Analysis] dari solusi yang diusulkan.
- Untuk mengkuantifikasi dampak dari sebuah solusi.
POPULASI DAN SAMPELPopulasi ialah keseluruhan object yang ingin kita ukur dan analisa. Sedang sample ialah sebagian [kecil] dari populasi dimana kita benar-benar melaksanakan pengukuran dan dengan ini kita sanggup menarik kesimpulan.
Dalam suatu penelitian atau observasi terhadap suatu object ekosistem yang jumlah populasinya besar. Metode sampling akan dipilih dengan mempertimbangkan keterbatasan waktu, biaya dan kepraktisan. Sampling secara statistik memungkinkan kita mengumpulkan informasi perihal suatu populasi tanpa kita harus meneliti secara keseluruhan.
Salah satu kelebihan kita menggunakan sampling secara statistik yakni kita sanggup menentukan tingkat akurasi dan ketepatan pengujian kita sebelum disebarkan. Dalam penerapannya untuk membedakan antara populasi dan sample, para mahir statistik menunjukkan simbol yang berbeda dan perhitungan yang sedikit berbeda.
Sebelum kita membahas lebih jauh lagi, ada beberapa terminology yang perlu diketahui terlebih dahulu, yakni:
1. Populasi
Seluruh item yang membentuk suatu kelompok yang menarik untuk diteliti dan populasi ini harus ditentukan sebelum kita menetapkan untuk mengambil sampling, pola : semua supplier part stamping untuk TEI, part stamping yang digunakan pada drive model DW224EV, dll.
2. Kerangka sampling
Sebuah daftar , data base atau pengenal khusus lainnya perihal item-item yang akan diikutsertakan menjadi sample, pola : Bill Of Material yang meliputi semua stamping part pada drive model DW224EV, Data di SAP yang menyimpan list semua supplier stamping part untuk TEI, dll.
3. Unit sampling
Item sesungguhnya yang diikutkan dalam sampling, contoh: Sebuah Screw, dll.
4. Bias
Merupakan perbedaan antara data yang kita kumpulkan dalam sample dengan “kondisi sebenarnya” dari populasi. Hal ini sanggup mempengaruhi hasil interprestasi kita terhadap hasil statistik yang dihasilkan [D.Manggala, 2005].
Jenis-Jenis Sampling
Menurut Augustine A.Stagliano dalam bukunya Rath and Strong’s Six sigma Advance Tool Pocket Guide [2004] disebutkan bahwa sampling diklasifikasikan menjadi beberapa jenis :
Ditinjau dari segi jenisnya, sampling dikategorikan menjadi 2, yakni:
Sampel Judgmental
- Sampel dipilih menurut pengetahuan dan pengalaman.
- Hanya sebagian kecil dari populasi yang diikutsertakan dalam proses seleksi.
- Sampel dianggap mewakili populasi.
Contoh: PT. Livatech bermaksud mengadakan customer satisfication survey. Dari 20 customer yang ada hanya diambil sample 5 customer yang utama saja dengan pertimbangan kelima customer tersebut ordernya diatas 100.000 Part/ bulan.
Sampel Statistical
- Sampel dipilih secara acak.
- Seluruh populasi diikutsertakan dalam proses seleksi.
- Sampel mewakili seluruh populasi. Contoh : PQA mengambil sampel Shaft PU [L] DV28EC dari 10 box yang ada dengan masing-masing box diambil 50 Pcs secara acak.
Metode Sampling
Sekurangnya ada 3 metode sampling, yakni:
1. Systematic sampling : Dalam pengambilan sampel, metode ini menekankan pengambilan yang teratur dengan interval frekuensi yang jelas, contohnya : setiap pengambilan sampel dilakukan diawal shift, pengambilan sampel setiap kelipatan 100 Pcs, dll.
2. Random sampling : Pengambilan sampel ini dilakukan secara acak dan umumnya dibantu dengan statistical software [MINITAB]. Metode ini dipandang cukup kondusif dari bias.
3. Stratified sampling : Ciri khas dari metode sampling ini yaitu adanya penggolongan sebuah group yang sangat besar menjadi sub-group dan dalam sub-group ini gres dilakukan pengambilan sampel secara sistematik maupun random.
Pengukuran Central Tendency
Untuk mengukur Central Tendency [diterjemahkan secara bebas = ukuran letak] biasanya menggunakan indikator-indikator mean [rata-rata], median [nilai tengah] dan modus [nilai yang sering muncul].
Mean [rata-rata] ialah jumlah semua observasi dibagi dengan banyaknya jumlah data. Nilai mean sangat dipengaruhi oleh nilai-nilai yang ekstrim.
Median ialah Nilai tengah dari sederetan data yang sudah terurut mulai dari nilai terkecil sampai terbesar [diranking]. Median tidak dipengaruhi oleh nilai-nilai yang ekstrim. Jika banyaknya data ganjil maka median sama dengan nilai data yang sempurna berada ditengah-tengah. Namun jikalau banyaknya data genap maka median sama dengan rata-rata dari dua nilai yang berada ditengah. Hal inilah yang sanggup dikatakan bahwa median sama dengan 50th percentile atau kuartile kedua [Q2]. Sebagai informasi pelengkap saja bahwa median umumnya digunakan pada distribusi yang miring [skew] sedang distribusi yang seimbang umumnya menggunakan mean.
Modus yaitu nilai yang paling sering muncul.
Pengukuran Variasi
Pengertian variasi dalam konteks ini diterjemahkan sebagai ukuran penyebaran.
Parameter-paremeter yang umum digunakan yaitu :
- Range [jangkauan] ialah perbedaan antara nilai terbesar dengan nilai terkecil.
- Variance ialah rata-rata kuadrat jarak dari tiap-tiap titik ke rata-rata.
- Standar deviasi merupakan akar dari variance.
Ada 3 buah perusahaan multinasional di Batam sedang disurvey, sampling dilakukan dengan mengambil 5 orang karyawan tiap-tiap perusahaan dengan hasil berikut [dalam Juta Rupiah]. Tujuan dari survey ini yaitu untuk menunjukan apakah bisa dikatakan honor karyawan di Batam itu “rata-rata sama Rp3.000.000,00”?
Jenis Distribusi
Pada pembahasan dimuka telah disinggung perihal penjabaran data bahwa sanggup dikategorikan dalam data attribute dan data variable [continuous data] sehingga distribusi data-pun secara umum dibagi menjadi 2, yakni:1. Discrete distributions [untuk non continuous data].
2. Continuous distributions.
Bentuk-bentuk Distribusi
Secara umum, bentuk-bentuk ditribusi yaitu sebagai berikut:
- Simetris, bila rata-rata = median atau angka skewness = 0
- Right Skewed [Positif], bila rata-rata > median
- Left Skewed [Negatif], bila rata-rata <>
Discrete Distributions
Jenis discrete distributions yang umum sering digunakan antara lain:
1. Binomial distributions - Untuk lebih gampang dalam pemahaman, mungkin akan lebih gampang diterima jikalau menggunakan sebuah pola : Anda seorang pemain Futsal yang sedang melatih kemampuan untuk menendang bola ke gawang dari luar tempat Keeper. Anda melaksanakan 6 tendangan setiap set dengan posisi serong kiri-serong kanan dan depan, masing-masing 2 bola [total 6 bola setiap set]. Dan dari sekian kali set, setelah dirata-rata anda mendapatkan 3 Gol dari 6 kali tendangan. Dalam hal ini nilai kemungkinan GOL yaitu 0,5. Dari data ini kita sanggup mengitung kemungkinan akan GOL jikalau menendang 300 kali.
2. Poisson distributions - Banyak analisis dilakukan untuk jumlah suatu kejadian per area of opportunity dimana area per opportunity sanggup berupa waktu, ruang maupun area. Misalnya : Anda sedang mengantri di Bank dan masih menunggu usang sekali untuk dilayani. Mungkin anda menghitung dalam hati berapa pelanggan yang tiba setiap satu menit. Dalam satu menit pertama ada sepuluh orang yang tiba berbarengan, menit ketiga ada dua orang, menit ke sepuluh ada tujug orang datang. Jika anda setiap hari menghitung laju kedatangan pelanggan per menit, dalam sebulan anda akan mempunyai rata-rata laju kedatangan pelanggan per menit. Disini anda sanggup dikatakan punya distribusi yang disebut dengan Poisson disitribution. Distribusi ini sangat penting dalam analisis operasi terutama dalam analisis produktivitas sistem atau peralatan yang menggunakan teori antrian atau Queue theory. [D.Manggala, 2005]
Continuous Distributions
Distribusi yang umum digunakan pada jenis Continous distribution, antara lain:
1. Normal Distributions Banyak kejadian yang muncul secara acak [random] menghasilkan data dengan distribusi bell shaped. Kurva yang menghubungkan puncak-puncak batang disebut Kurva Peluang Normal yang digunakan untuk meng-estimasi Distribusi Normal dari kejadian-kejadian yang muncul secara acak [random]. Dalam kasus-kasus yang umum terjadi, perkiraan yang digunakan dalam analisis yaitu bahwa data yang kita dapatkan terdistribusi dengan normal dan simetris. Hal ini berarti bahwa kita perlu terlebih dahulu menguji bisa tidaknya suatu group dikatakan terdistribusi secara normal. Dan jikalau anda menggunakan statistical software [MINITAB], hidangan pilihan untuk menguji kenormalan distribusi telah tersedia dan juga sanggup melihat bentuk dari kurvanya [simetris ataukah miring].
Secara sederhana distribusi eksponensial sanggup dijelaskan sebagai suatu distribusi dari data-data yang menggambarkan periode [waktu] ataupun ruang diantara dua kejadian. Contoh yang paling umum dalam penerapan distribusi eksponensial ini yaitu dalam mengukur periode kerusakan sebuah mesin [MTBF = Mean Time Between Failure]
Mengenal Confidence Interval
Sebagaimana telah disebutkan pada klarifikasi diawal bahwa kita mengambil suatu kesimpulan menurut analisis yang dilakukan hanya atas dasar sampel yang diambil. Kenyataan yang terjadi bahwa [misal: rata-rata] rata-rata sampel itu ternyata tidak sama persis dengan rata-rata populasi. Dengan kata lain tentunya dalam hal ini terdapat perbedaan rata-rata antara sampel satu dengan sampel lainnya dalam satu populasi yang sama [populasi yang diambil].
Perbedaan hasil statistik antara satu sampel dengan sampel lainnya inilah yang disebut dengan “sampling error”. Jika kita memperbesar ukuran sample maka akan menghasilkan “sampling error” yang lebih kecil. Para mahir statistik mengeluarkan konsep estimasi interval dimana nilai karakteristik suatu populasi diperkirakan dengan suatu tingkat kepastian akan berada didalam suatu interval. Interval ini disebut dengan Confidence Interval Estimated. Ini merupakan suatu konsep yang sangat penting dalam analisis statistik.
Pada umumnya, analisis six sigma menggunakan Confidence Interval Estimated sebesar 95%, hal ini berarti bahwa : jikalau semua sampel diseleksi dalam ukuran “n”, maka 95% dari sampel itu akan memasukan parameter populasi dalam interval hasil estimasi. Untuk menciptakan estimasi interval, anda mesti mengetahui statistik dari sampel yang anda gunakan untuk menganalisis karakteristik populasi dan distribusi samplingnya.
Confidence interval = Titik estimasi sampel + Margin of error
Seringkali kita dihadapkan pada keharusan untuk membandingkan 2 buah group data atau lebih, hal ini tentunya membutuhkan suatu analisis. Disinilah konsep Hypothesis test diperlukan. Sebelum masuk pada pembahasan lebih jauh, terlebih dahulu perlu diperkenalkan perihal Type I Error dan Type II Error. Agar lebih jelas, perhatikan pola berikut ini. Masih hangat dalam ingatan kita perihal masalah Roy Marteen tersangka Narkoba. Tentunya hipotesis awal beliau dianggap “tidak bersalah” dan hipotesis alternatifnya tentu saja beliau “bersalah”.
Ho = Roy Marteen tidak bersalah
Ha = Roy Marteen bersalah Test hipotesis ini bertujuan menunjukan apakah keputusan yang kita ambil benar-benar sesuai dengan kenyataan yang sebenar-benarnya. Oleh alasannya yaitu itu kondisi antara keputusan yang kita ambil dengan kenyataan yang bergotong-royong sanggup digambarkan sebagai berikut :
Dari Matriks diatas sanggup dilihat bahwa ada 2 kemungkinan hakim melaksanakan kesalahan : Kesalahan tipe I : Memenjarakan orang yang tidak bersalah Kesalahan tipe II: membebaskan orang yang bersalah
Kemungkinan melaksanakan kesalahan tipe I didefinisikan sebagai alpha [siginificance level], dimana 0 Kurang dari atau sama dengan alpha dan alfa kurang dari atau sama dengan 1. Kemungkinan melaksanakan kesalahan tipe II didefinisikan sebaga Betta, dimana 0 kurang dari atau sama denga betta dan betta kurang dari atau sama dengan 1.
Pada umumnya, kuputusan kritis berasal dari kesalahan tipe I.
Pengujian Perbedaan Rata-Rata dari Dua Distribusi Kontinyu
Secara Umum, hypothesis sanggup dinyatakan dalam persamaan berikut :
Untuk menguji rata-rata dengan test hypothesis biasanya dilakukan dengan t-test, dengan langkah sederhana berikut:
- Definisikan parameter yang diujikan dalam Ho dan Ha
- Pilih confidence interval yang diinginkan, contohnya 95% atau 99% atau 99,9% [alpha =0,05 atau 0,01 atau 0,001]
- Tentukan besar sampel dan lakukan t-test pada data tersebut dengan statistical software [MINITAB] atau software lainnya.
- Jika nilai p kurang dari nilai alpha kita sanggup merejectkan Ho dan menentukan Ha dengan tingkat keyakinan sebesar [1-p]*100% [karena kita melaksanakan two-tail test. Dan jangan lupa harga harga nilai p yang didapat dikalikan dengan 2 sebelum dibandingkan dengan nilai alpha.
- Jika nilai p lebih dari atau sama dengan alpha maka bisa dikatakan bahwa kita tidak punya bukti yang berpengaruh untuk merejectkan Ho
Catatan : Distribusi t merupakan pooled distribution dari standard deviasi dua sampel yang berbeda. Untuk keterangan lebih lengkap silahkan membaca buku-buku perihal statistik. Untuk pola sederhana, perhatikan masalah berikut ini : Sebuah perusahaan ingin melaksanakan pengujian statistik untuk menunjukan apakah terdapat perbedaan penggajian antara pegawai laki-laki dan wanita. Hal ini dilakukan untuk menepis informasi adanya diskriminasi terhadap pegawai wanita, yaitu pegawai perempuan diberikan honor yang lebih rendah dari pegawai laki-laki [pada golongan dan masa kerja yang sama].
Oleh alasannya yaitu itu departement Sumber Daya Manusia Mengumpulkan data honor pegawai dan membandingkan honor pegawai laki-laki dan perempuan setelah dikelompokan pada golongan dan masa kerja yang sama. Dalam melaksanakan pengujian, hypothesisnya adalah:
Ho = Gaji pegawai laki-laki dan perempuan yaitu sama
Ha = Gaji pegawai laki-laki tidak sama dengan pegawai wanita
Langkah berikutnya yaitu menentukan confidence interval, yakni dipilih 95% [alpha = 0,05] kemudian dilakukan pengujian dengan MINITAB yang menghasilkan p value sebesar 0,34 atau untuk two-sided test menjadi 0,68 Karena p lebih besar dari alpha [jauh lebih besar dari alpha] maka sanggup dikatakan bahwa kita tidak mempunyai bukti untuk menolak hipotesis awal yakni bahwa honor pegawai laki-laki dan perempuan yaitu sama. Dengan kata lain sanggup disimpulkan bahwa dengan data yang ada kita perpendapat tidak ada perbedaan antara honor pegawai laki-laki dan perempuan [D. Manggala, 2005].
Pengujian Perbedaan antara Dua proporsi
Untuk pengujian proporsi, persamaan yang umum digunakan adalah
Langkah pengujiannya hampir sama dengan t-test untuk rata-rata, yaitu:
- Definisikan parameter yang diuji dalam Ho dan Ha
- Pilih confidence interval yang diinginkan, contohnya 95% atau 99% atau 99,9% [alpha =0,05 atau 0,01 atau 0,001].
- Tentukan besar sampel dan lakukan Z-test pada data yang sudah kita siapkan dengan MINITAB atupun software lainnya.
- Jika nilai p kurang dari nilai alpha kita sanggup merejectkan Ho dan menentukan Ha dengan tingkat keyakinan sebesar [1-p]*100% [karena kita melaksanakan two-tail test. Dan jangan lupa harga harga nilai p yang didapat dikalikan dengan 2 sebelum dibandingkan dengan nilai alpha.
- Jika nilai p lebih dari atau sama dengan alpha maka bisa dikatakan bahwa kita tidak punya bukti yang berpengaruh untuk merejectkan Ho.
Pengujian Perbedaan Rata-Rata antara 2 group dengan Variance yang berbeda
Pengujian hipotesis untuk rata-rata, pada umumnya menggunakan perkiraan bahwa variasi dari 2 group yang diuji yaitu sama. Jika perkiraan tadi tidak bisa kita gunakan maka kita harus melaksanakan test yang pada statistical software MINITAB disebut dengan “Separate-Variance t-test” [Untuk Lebih lengkapnya silahkan pelajari perihal MINITAB].Pengujian Perbedaan Variances antara 2 group yang berbeda
Kembali ke konsep awal bahwa untuk mengetahui apakah variasi antara 2 group yang akan diuji secara statistik sanggup dianggap sama atau tidak, dibutuhkan suatu pengujian untuk menguji variance yang dikenal dengan F-test. Dan mengulang pembahasan sebelumnya bahwa jikalau variance kedua group yang diuji secara statistik bisa dianggap sama maka sanggup menggunakann “pooled-variance t-test” tetapi jikalau tidak bisa dianggap sama maka digunakan “separate-variance t-test”. Persamaan umum pengujian variances yang sering dipakai:
- Definisikan parameter yang diuji dalam Ho dan Ha
- Pilih confidence interval yang diinginkan, contohnya 95% atau 99% atau 99,9% [alpha =0,05 atau 0,01 atau 0,001].
- Tentukan besar sampel dan lakukan Z-test pada data yang sudah kita siapkan dengan MINITAB atupun software lainnya.
- Jika nilai p kurang dari nilai alpha kita sanggup merejectkan Ho dan menentukan Ha dengan tingkat keyakinan sebesar [1-p]*100% [karena kita melaksanakan two-tail test. Dan jangan lupa harga harga nilai p yang didapat dikalikan dengan 2 sebelum dibandingkan dengan nilai alpha.
- Jika nilai p lebih dari atau sama dengan alpha maka bisa dikatakan bahwa kita tidak punya bukti yang berpengaruh untuk merejectkan Ho.
Analysis of Variances [ANOVA]
Jika diperhatikan sejauh ini klarifikasi hanya menyentuh pada 2 group data saja. Lantas bagaimanakah kaidah pengujian untuk yang lebih dari 2 group data, contohnya : 4 group atau bahkan 10 group. Untuk menjawab “tuntutan” ini maka digunakanlah kaidah ANOVA.Sebagai pola saja kita mempunyai 4 group data, kita sanggup mengujinya apakah keempat group tersebut mempunyai rata-rata yang sama ataukah tidak, Ingat hanya dalam sekali pengujian. Secara sederhana sanggup ditampilkan dengan hipotesis berikut:
Ho = Semua rata-rata dari populasi yaitu sama
Ha = Tidak semua rata-rata dari populasi yaitu sama Jika kita bermaksud menguji hanya satu variable maka hidangan yang kita pilih yaitu one-way ANOVA tetapi jikalau ada dua variable yang akan diuji maka menggunakan two-way ANOVA.
Dan mengingat pembahasan ANOVA sangat panjang, alangkah baiknya jikalau diperdalam dengan membaca buku-buku Statistika.
Demikian klarifikasi sederhana perihal statistika, jikalau tertarik dengan soal-soal perihal statistika yang pernah diujikan pada Ujian Nasional atau SBMPTN silahkan cek disini untuk data tunggal atau disini untuk data berkelompok.
Data disadur dari aneka macam sumber, bila Anda merasa pemilik sebagian atau keseluruhan konten diatas dan keberatan ditampilkan. Anda sanggup menghubungi Admin Blog, dan Admin Blog akan dengan bahagia hati menanggapi ajakan Anda. Terima kasih | Admin Blog.
Pernah dengar PT.Inalaum, coba simak video perkenalan dari PT.INALUM ini siapa tahu Anda nanti bisa berkarya disana;
0 Response to "Mengenal Ilmu Statistik Lebih Dekat"
Posting Komentar