• TAJUK 6 STATISTIK ASAS


  •   
  • FileName: statistik_asas.pdf [read-online]
    • Abstract: 2. menjelaskan dan melukis kekerapan, histogram dan carta pai; ... (Jadual 6.3) yang mempunyai lima (5) kelas kekerapan digunakan untuk melukis carta pai. ...

Download the ebook

STATISTIK ASAS TAJUK 6
TAJUK 6 STATISTIK ASAS
PENGENALAN
Pengukuran melibatkan pengumpulan data yang banyak daripada ujian/inventori yang
digunakan. Statistik dapat membantu kita untuk merumuskan data yang banyak ini kepada
bentuk lain yang mudah kita faham, seperti grafik atau angka rumusan. Kita pernah mengira
purata (angka rumusan) bagi angka-angka yang banyak untuk mencari nilai tengah angka-
angka ini. Kita juga pernah mencari angka terkecil dan angka terbesar dan juga julat antara
kedua-dua angka ini, untuk mencari perbezaan terbesar antara angka-angka tersebut. Purata
dan julat bagi angka-angka ini adalah maklumat yang boleh membantu kita memahami taburan
angka-angka tersebut, iaitu seperti angka terkecil, angka tengah, angka terbesar dan julatnya.
Tajuk ini akan membincangkan beberapa kaedah asas statistik (basic statistical methods)
yang diperlukan untuk menganalisis skor/data daripada ujian/inventori.
OBJEKTIF
Di akhir tajuk ini, anda seharusnya dapat:
1. menjelaskan pengertian dan penggunaan statistik;
2. menjelaskan dan melukis kekerapan, histogram dan carta pai;
3. melukis poligon dan ogif serta menjelaskan dan mengira persentil.
4. menjelaskan dan mengira ukuran memusat dan serakan serta skor piawai; dan
5. menjelaskan dan mengira pekali korelasi dan regresi linear mudah.
PETA MINDA
110 OUM
TAJUK 6 STATISTIK ASAS
6.1 PENGERTIAN DAN PENGGUNAAN STATISTIK
Statistik mempunyai pelbagai kepentingan dalam pelbagai organisasi. Biasanya
sekumpulan pegawai penyelidik akan dilantik untuk menganalisis data yang
ada berdasarkan kelayakan dan kepakaran mereka. Sebagai seorang guru,
apakah skil dan kemahiran yang anda perlukan untuk mendapatkan statistik
yang tepat dan boleh dipercayai?
Statistik digunakan dalam pelbagai bidang yang dengan sendirinya memberikan pengertian
yang tertentu. Kepada orang ramai, statistik bermaksud “angka” yang direkodkan mengikut
kategori tertentu”. Contohnya, statistik kemalangan jalan raya memberikan kita maklumat
tentang kemalangan jalan raya, yang pecahkan kepada beberapa kategori, seperti maut, cedera
parah, cedera ringan dan sebagainya. Jabatan Kaji Cuaca, misalnya, memberikan statistik
hujan/ramalan hujan setiap bulan. Pihak sekolah pula memberikan statistik pencapaian pelajar,
misalnya, bilangan pelajar yang mendapat gred tertentu dalam peperiksaan SPM. Kepada
mereka yang menjalankan kajian pula, statistik merupakan kaedah yang boleh digunakan
untuk menganalisis data kajian. Kepada ahli-ahli statistik, statistik merupakan satu bidang
matematik yang dapat menghasilkan teori dan kaedah untuk menganalisis data.
Kesimpulannya, statistik bererti satu set teori dan kaedah yang boleh digunakan untuk
memahami data.
Dalam bidang pendidikan, statistik boleh diguna untuk menyampaikan maklumat dalam
pelbagai situasi. Seperti contoh yang diberikan lebih awal, statistik boleh diguna untuk
menunjukkan taburan pelajar mengikut pencapaian. Maklumat ini boleh dibentang dengan
menggunakan jadual atau grafik seperti histogram/carta pai. Seterusnya, jika seseorang
penyelidik ingin melihat hubungan antara dua pembolehubah, contohnya antara lama masa
belajar dengan pencapaian, kaedah statistik korelasi boleh gunakan untuk mengira kekuatan
hubungan ini. Statistik juga boleh digunakan untuk menguji hipotesis tertentu, misalnya
menguji sama ada wujud hubungan antara lama masa belajar dengan pencapaian. Selain
menguji hubungan, kaedah statistik boleh digunakan untuk menguji perbezaan antara dua
min atau lebih, iaitu dengan menggunakan ujian-t atau ANOVA.
Rajah 6.1 : Kegunaan statistik
OUM 111
STATISTIK ASAS TAJUK 6
Seterusnya, penyelidik memerlukan pengetahuan statistik untuk mereka bentuk (design)
sesuatu penyelidikan, seperti mereka bentuk eksperimen, dan menentukan kaedah analisis
data yang sesuai untuk sesuatu reka bentuk. Pengetahuan statistik juga dapat digunakan
oleh guru untuk memahami kajian-kajian yang ditulis dalam bentuk empirikal. Dalam bidang
pengukuran pula, kaedah statistik digunakan untuk mengira indeks kebolehpercayaan, indeks
kesahan atau indek kesahan ramalan. Terdapat dua jenis statistik yang digunakan dalam
bidang pendidikan, iaitu statistik deskriptif yang digunakan untuk menjelaskan sesuatu ukuran
(seperti min dan sisihan piawai); dan statistik inferensi yang digunakan untuk menguji
hipotesis. Sebahagian daripada statistik-statistik ini dibincangkan dalam bahagian-bahagian
berikut.
Rajah 6.2 : Statistik yang digunakan dalam pendidikan
6.2 KEKERAPAN, HISTOGRAM DAN CARTA PAI
Selepas data mentah dikumpul ia perlu dirumuskan dalam bentuk yang mudah difaham,
misalnya dalam bentuk jadual atau grafik. Salah satu kaedah merumuskan data ialah
menyediakan jadual taburan data asal dengan menggunakan kekerapan dan peratus, dan
juga melukis histogram taburannya. Jadual kekerapan dan histogram boleh disedia dengan
menggunakan data asal atau data yang dikumpulkan ke dalam beberapa kelas. Sebagai
contoh, kita gunakan taburan markah ujian mingguan bagi 50 orang pelajar yang markah
penuhnya ialah 10. Markah asal diberikan dalam Jadual 6.1.
Jadual 6.1: Markah Ujian 50 Orang Pelajar
2 5 4 1 6 3 7 5 4 7
5 6 2 7 8 6 4 2 9 5
3 5 6 4 0 7 8 5 3 6
8 4 9 6 5 4 7 1 5 10
5 7 3 5 6 2 8 4 3 6
Latihan 6.1
Susunkan data dalam Jadual 6.1 daripada yang terkecil kepada yang terbesar.
112 OUM
TAJUK 6 STATISTIK ASAS
6.2.1 Taburan Kekerapan
Seterusnya, kekerapan markah ini (bilangan pelajar yang mendapat markah tertentu) dan
peratus pelajar yang mendapat markah tersebut ditunjukkan dalam Jadual 6.2. Kekerapan
boleh dikira dengan mudah daripada markah yang disusun (lihat jawapan Latihan 6.1).
Kekerapan ini dimasukkan dalam jadual (Jadual 6.2). Peratusnya dikira dengan membahagikan
setiap kekerapan dengan 50 dan didarabkan dengan 100. Sebagai langkah semakan, kita
perlu menjumlahkan lajur “Kekerapan”, yang sepatutnya berjumlah 50 (jumlah pelajar); dan
menjumlahkan lajur “Peratus”, yang sepatutnya berjumlah 100 (jumlah %). Peratus kekerapan
boleh diguna untuk menjelaskan bilangan pelajar yang mendapat markah tertentu, selain
memberikan kekerapan, misalnya, seramai 10 orang pelajar (20%) telah mendapat 5 markah.
Jadual 6.2 : Taburan Kekerapan Markah Ujian
6.2.2 Histogram
Histogram ialah rajah berbentuk kotak yang dilukis dengan paksi-Y menunjukkan
kekerapan dan paksi-X menunjukkan markah yang diperoleh pelajar.
Taburan kekerapan ini juga boleh dibentang dalam bentuk grafik, misalnya histogram.
Histogram bagi taburan markah ujian mingguan di atas ditunjukkan dalam Rajah 6.3. Dalam
rajah ini, “tinggi” sesuatu kotak itu menunjukkan kekerapan/bilangan pelajar yang mendapat
“markah” tertentu, misalnya bilangan pelajar yang mendapat 5 markah ialah 10.
OUM 113
STATISTIK ASAS TAJUK 6
Rajah 6.3 : Histogram taburan kekerapan markah ujian
Satu lagi cara memaparkan taburan markah ialah dengan mengumpulkan beberapa markah
yang sama julatnya kepada beberapa kelas. Jadual 6.3 menunjukkan taburan kekerapan 50
markah ujian yang dikumpulkan kepada lima (5) kelas [kelas pertama (0-2) mengandungi tiga
(3) markah, iaitu 0, 1 dan 2, disebabkan ada 11 markah asal (iaitu, 0 hingga 10)]. Dalam
taburan ini, “jeda kelas” menunjukkan markah-markah yang dimasukkan dalam kelas tersebut.
Taburan kekerapan berkelas ini adalah sesuai bagi data yang banyak dan mempunyai julat
yang besar. Biasanya bilangan kelas adalah di antara tujuh (7) hingga 10 kelas. Justeru,
pengunaan kekerapan berkelas dapat mengurangkan bilangan markah/skor yang dimasukkan
ke dalam jadual kekerapan.
Jadual 6.3 : Taburan Kekerapan Berkelas Markah Ujian
Dalam contoh ini, taburan kekerapan markah asal (Jadual 6.2) terdiri daripada 11 markah,
sementara taburan kekerapan berkelas hanya terdiri daripada lima (5) kelas. Bagaimanapun,
“penjimatan” ini menyebabkan maklumat asal yang lebih terperinci tidak dapat
ditunjukkan.Seterusnya, taburan kekerapan berkelas markah ujian mingguan ini juga boleh
dibentang dalam bentuk histogram, iaiitu seperti yang ditunjukkan dalam Rajah 6.4.
114 OUM
TAJUK 6 STATISTIK ASAS
Rajah 6.4 : Histogram taburan kekerapan berkelas markah ujian
Latihan 6.2
Apakah maklumat yang hilang apabila kita mengira min dengan menggunakan
taburan kekerapan berkelas?
6.2.3 Carta Pai
Carta pai ialah satu grafik yang menggambarkan saiz kekerapan bagi sesuatu
set data yang berkadaran dengan luas sektornya.
Biasanya bilangan kelas kekerapan bagi set data ini adalah kecil untuk memudahkan kita
melukis carta ini. Dalam contoh berikut, taburan kekerapan berkelas markah ujian mingguan
(Jadual 6.3) yang mempunyai lima (5) kelas kekerapan digunakan untuk melukis carta pai.
Carta ini boleh dilukis dengan menggunakan perisian komputer tertentu dengan hanya
memasukkan kekerapan. Untuk melukis sendiri carta ini, kita memerlukan maklumat tentang
jeda kelas kekerapan, kekerapan dan darjah sudut carta pai. Jadual 6.4 menunjukkan jeda
kelas, kekerapan dan darjah sudut bagi markah ujian mingguan.
OUM 115
STATISTIK ASAS TAJUK 6
Jadual 6.4 : Taburan Kekerapan Berkelas dan Darjah Sudut
Untuk mendapatkan darjah sudut carta pai, kita perlu mengiranya seperti berikut. Dalam contoh
ini, kekerapan yang digunakan ialah 7, iaitu kekerapan bagi kelas berjeda 0-2.
Darjah sudut = Kekerapan x 360o (360o ialah jumlah sudut di pusat bagi satu bulatan).
Jumlah Pelajar
= 7 x 360o = 2520o = 50.4o
50 50
Rajah 6.5 menunjukkan carta pai bagi kekerapan seperti yang diberikan dalam Jadual 6.4.
Luas setiap bahagian carta pai ini menggambarkan kekerapan bagi kelas tertentu, yang setiap
satunya dilukis mengikut luas sudut bagi kekerapan tersebut. Contohnya, kekerapan bagi
kelas berjeda (5-6) markah ialah 18 (yang terbesar) dan sudut bagi kelas ini ialah 129.6o,,
yang memberikan luas yang terbesar.
Nota: Angka dalam kotak adalah jeda kelas kekerapan
Rajah 6.5 : Carta pai markah ujian
6.3 POLIGON DAN OGIF
Terdapat dua (2) lagi grafik yang boleh diguna untuk menjelaskan taburan kekerapan, iaitu
poligon dan ogif.
116 OUM
TAJUK 6 STATISTIK ASAS
Poligon agak mudah dilukis, iaitu dengan menyambung titik-titik tengah bahagian
atas kotak kekerapan dengan garis-garis lurus.
Rajah 6.6 menunjukkan graf poligon bagi taburan kekerapan markah ujian mingguan. Ia dilukis
berasaskan histrogram dalam Rajah 6.3. Graf ini dapat menunjukkan bentuk taburan kekerapan
dengan lebih jelas.
Bagi data yang besar, yang dibahagikan kepada banyak kelas, graf ini hampir menyerupai
taburan ukuran populasi sebenar. Di sini populasi bermaksud semua subjek/pelajar sasaran
dari mana ukuran itu diambil. Data yang kita cerap/peroleh daripada sekumpulan pelajar
hanyalah data sampel sahaja. Semakin besar sampel yang kita cerap, semakin dekat ukuran
daripada sampel itu menghampiri ukuran daripada populasi.
Latihan 6.3
Berikan satu contoh populasi, sampel dan ukurannya. Bilakah taburan ukuran
sampel akan meyerupai taburan ukuran populasi?
Rajah 6.6 : Poligon taburan kekerapan markah ujian
Untuk melukis ogif (ogive), iaitu graf garis yang menghubungkan peratus
kekerapan terkumpul (cumulative frequency percentage), kita perlu mencari
peratus kekerapan terkumpul tersebut.
Peratus kekerapan terkumpul boleh dicari dengan menjumlahkan peratus kekerapan daripada
ukuran terrendah hingga tertinggi. Jadual 6.5 menunjukkan kekerapan markah ujian mingguan
bersama peratus kekerapan dan peratus kekerapan terkumpulnya. Peratus kekerapan
terkumpul yang terakhir ialah 100%, iaitu peratus bagi semua kekerapan.
OUM 117
STATISTIK ASAS TAJUK 6
Jadual 6.5 : Peratus Kekerapan Terkumpul Markah Ujian
Rajah 6.7 menunjukkan ogif peratus kekerapan terkumpul yang dilukis dengan paksi-X
menunjukkan markah ujian dan paksi-Y menunjukkan peratus kekerapan terkumpul. Peratus
ini dilukis pada sempadan sebelah kanan markah, misalnya, bagi markah 4, titik 38% ditanda
pada sempadan kanan markah 4, iaitu pada sempadan markah 4 dan markah 5.
Rajah 6.7 : Peratus kekerapan terkumpul markah ujian
Graf ogif ini penting untuk kita mencari dua (2) ukuran, iaitu (a) mencari markah/skor bagi
persentil (percentile), dan (b) mencari persentil bagi markah tertentu. Contoh mencari markah
dan persentil diberikan di bawah. Persentil di sini bermaksud markah yang mana di bawahnya
terdapat markah yang lebih rendah sebanyak peratus tersebut.
(a) Mencari markah bagi persentil tertentu.
Contohnya, cari markah bagi persentil ke 72 (P72). Untuk mencari markah ini, kita perlu
melukis garis pertama (mendatar) mulai pada nilai 72 peratus di paksi-Y hingga ke ogif.
118 OUM
TAJUK 6 STATISTIK ASAS
Kemudian kita lukis garis kedua (menegak) dari titik pertemuan garis pertama dengan
ogif ke paksi-X (lihat Rajah 6.6). Markah yang bertemu dengan garis kedua adalah markah
bagi P72. Dalam contoh ini P72 = 6.2. Ini bermakna terdapat terdapat 72% pelajar yang
mendapat markah lebih rendah daripada 6.2.
(b) Mencari persentil bagi markah tertentu.
Contohnya, cari persentil bagi markah 8.5. Untuk mencari persentil ini, kita perlu melukis
garis pertama (menegak) mulai pada nilai 8.5 di paksi-X hingga ke ogif. Kemudian kita
lukis garis kedua (mendatar) dari titik pertemuan garis pertama dengan ogif ke paksi-Y
(lihat Rajah 6.8). Peratus yang bertemu dengan garis kedua adalah persentil yang dicari.
Dalam contoh ini 8.5 = P91. Ini bermakna seseorang pelajar yang mendapat markah 8.5
berpencapaian lebih baik daripada 91% pelajar lain.
Latihan 6.4
Dengan menggunakan Rajah 6.8, sila cari P80 dan berapa peratus pelajar yang
mendapat markah rendah daripada 5?
Rajah 6.8 : Kaedah mencari markah dan persentil
6.4 UKURAN MEMUSAT DAN UKURAN SERAKAN
Kita telah melihat bentuk taburan kekerapan, dengan menggunakan markah ujian mingguan
sebagai contoh. Bentuk taburan kekerapan ini boleh digambar dengan menggunakan
histogram atau poligon (Rajah 6.6). Markah ini hanyalah merupakan markah sampel 50 orang
pelajar daripada populasi tertentu, misalnya semua pelajar tahun 5 dalam sesuatu daerah.
Sekiranya kita dapat mengumpul markah daripada populasi, kita akan dapat melihat bentuk
taburan markah/skor populasi bagi ujian mingguan tersebut. Contoh taburan skor populasi
ditunjukkan dalam Rajah 6.6. Dua (2) unsur penting bagi data daripada sampel atau populasi
ialah (a) ukuran memusat dan (b) ukuran serakan.
OUM 119
STATISTIK ASAS TAJUK 6
Ukuran memusat ialah ukuran yang menggambarkan skor tengah bagi sesuatu
set data. Ukuran memusat ini termasuklah mod, median dan min. Ukuran kedua
bagi sesuatu set data/skor ialah ukuran serakan, iaitu ukuran yang
menggambarkan darjah serakan bagi sesuatu set data/skor. Ukuran serakan
taburan termasuklah julat, varians dan sisihan piawai.
Rajah 6.9 menunjukkan taburan data/ukuran daripada satu populasi tertentu. Min bagi data/
skor daripada sesutu populasi ialah µ dan sisihan piawainya ialah σ.
Rajah 6.9 : Taburan data/skor populasi
6.4.1 Pengiraan Ukuran Memusat
Seperti yang dijelaskan, terdapat tiga (3) ukuran memusat yang biasa digunakan, iaitu mod,
median dan min seperti dalam rajah 6.10. Kita akan menentukan/mengira mod, median dan
min dengan menggunakan markah ujian mingguan sebagai contoh.
Rajah 6.10 : Pengiraan ukuran memusat
120 OUM
TAJUK 6 STATISTIK ASAS
(a) Pengiraan Mod
Mod ialah skor yang mempunyai kekerapan paling tinggi, misalnya markah
yang pelajar paling ramai memperolehnya.
Mod mudah ditentukan sekiranya kita telah menyediakan taburan kekerapan skor/markah
asal terlebih dahulu. Bagi markah ujian bulanan (lihat Jadual 6.2), mod bagi set markah
ini ialah 5, iaitu markah yang mempunyai kekerapan paling tinggi (iaitu 10).
(b) Pengiraan Median
Median ialah skor tengah sesuatu set data/skor, misalnya markah tengah bagi
set markah ujian mingguan.
Sekiranya sesuatu set data mempunyai dua (2) angka tengah, media data ini ialah purata
kedua-dua data tengah tersebut. Median mudah ditentukan sekiranya kita telah menyusun
data daripada yang terrendah hingga tertinggi atau sebaliknya. Bagi markah ujian
mingguan, daripada jadual markah yang telah disusun (lihat jawapan Latihan 6.1), median
bagi set markah ini ialah 5, iaitu purata dua (2) markah tengah (markah ke-25 = 5 dan
markah ke-26 = 5).
(c) Pengiraan Min
Min ialah purata sesuatu set data/skor, misalnya markah purata bagi set markah
ujian mingguan. Min mudah dikira, sekiranya bilangan data adalah kecil, tetapi
agak susah dikira bagi data yang banyak.
Bagaimanapun, kita boleh menggunakan komputer untuk mengira min bagi data yang
banyak. Untuk kita mengira sendiri min, kita perlu menjumlahkan semua skor/markah
dan kemudian dibahagikan dengan bilangan markah/ pelajar. Dalam bentuk simbol
matematik, min dikira seperti berikut:
n
x = ∑ x i /n ,
i=1
di mana Σ ialah tanda jumlah xi ialah markah bagi pelajar ke-i (i = 1, 2, ... , n) dan n ialah
bilangan pelajar. Dalam contoh markah ujian mingguan (lihat Jadual 6.1), min boleh
dikira seperti berikut:
n
x = ∑ xi /n, (2+5+4+ ............ +3+6)/50 = 253/50 = 5.06
i=1
Jadi, bagi data ini, didapati ukuran memusatnya adalah hampir sama, iaitu mod ialah 5,
median ialah 5 dan min ialah 5.06.
OUM 121
STATISTIK ASAS TAJUK 6
Latihan 6.5
Cari mod, median dan min bagi markah ujian berikut:
8 4 9 6 5 4 7 1 5 10
6.4.2 Pengiraan Ukuran Serakan
Seperti yang dijelaskan, terdapat tiga (3) ukuran serakan yang biasa digunakan, iaitu julat,
varians dan sisihan piawai. Kita akan menentukan/mengira julat, varians dan sisihan piawai
ini dengan menggunakan markah ujian mingguan sebagai contoh.
Rajah 6.11 : Pengiraan ukuran serakan
(a) Pengiraan Julat
Julat ialah perbezaan skor yang terrtinggi dengan terrendah, misalnya
perbezaan markah tertinggi dengan markah terrendah pelajar.
Julat mudah ditentukan sekiranya sekiranya kita telah menyusun data daripada yang
terrendah hingga tertinggi atau sebaliknya. Bagi markah ujian mingguan, daripada jadual
markah yang telah disusun (lihat jawapan Latihan 6.1), julat bagi set markah ini ialah 10
[iaitu 10 (markah tertinggi) – 0 (markah terrendah].
122 OUM
TAJUK 6 STATISTIK ASAS
(b) Pengiraan Varians dan Sisihan Piawai
Varians (variance) ialah ukuran serakan yang mengambil kira semua data yang
ada, berbeza daripada julat yang bergantung kepada dua (2) ukuran sahaja,
iaitu yang terrendah dan terrtinggi.
Varians agak sukar dikira sebab ia melibatkan jumlah kuasa-dua (sum of squares) bagi
semua ukuran, iaitu kita perlu menjumlahkan kuasa-dua perbezaan setiap ukuran daripada
min keseluruhan ukuran. Rumus untuk mengira varians ialah:
n
Varians (s2) ∑ [( x − x)
i=1
i
2
]/(n -1),di mana x ialah min keseluruhan data.
Untuk memudahkan pengiraan varians dalam contoh ini, kita hanya menggunakan 10
markah pertama daripada 50 markah ujian mingguan. Min bagi 10 markah ini dan kuasa-
dua perbezaan markah daripada min ditunjukkan dalam Jadual 6.6. Varians bagi data ini
boleh dikira seperti berikut:
n
s2 = ∑ [( xi − x )2 ]/(n -1) = 36.4/(10-1) = 36.4/9 = 4.04
i=1
Sisihan piawai (standard deviation) adalah juga ukuran serakan dan ia amatlah berkait
dengan varians, iaitu sisihan piawai adalah punca-ganda-dua varians:
Sisihan piawai (s) = √s2
Jadual 6. 6: Jumlah Kuasa-dua Perbezaan Markah daripada Min
Pengiraan sisihan piawai bagi contoh varians di atas ialah s =√s2 = √(4.04) = 2.01. Varians/
sisihan piawai boleh diguna untuk menunjukkan berapa besar perbezaan antara ukuran.
Sekiranya semua ukuran mempunyai nilai yang sama (semua pelajar mendapat markah
yang sama), varians/sisihan piawai bagi ukuran ini ialah sifar, iaitu tiada langsung serakan.
Selain itu, berbanding dengan varians, sisihan piawai lebih mudah kita fahami, disebabkan
bagi data yang banyak, ia mempunyai hubungan langsung dengan ukuran, iaitu dengan
OUM 123
STATISTIK ASAS TAJUK 6
anggaran ukuran tertinggi, terendah dan julat seperti berikut:
(a) Anggaran ukuran tertinggi=min+(3 x sisihan piawai)=4.4+(3x2.01)=4.4+6.03=10.43.
(b) Anggaran ukuran terrendah=min–(3 x sisihan piawai) =4.4-(3x2.01)=4.4-6.03=-1.63.
(c) Anggaran julat=Ukuran tertinggi–ukuran terrendah=6 x sisihan piawai = 6x2.01=12.06.
Latihan 6.6
Min markah peperiksaan yang diambil oleh 1,000 orang calon ialah 50 dengan
varians 16. Anggarkan markah terrendah dan tertinggi serta julat markah bagi
calon-calon ini.
6.5 SKOR PIAWAI
Biasanya markah ujian/peperiksaan atau ukuran daripada inventori diberi tidak berasaskan
kepada markah/skor penuh yang sama. Dengan demikian, kita akan menghadapi masalah
apabila kita ingin membuat interpretasi/menilai markah/skor tersebut. Satu kaedah telah
digunakan untuk menyeragamkan markah/skor supaya markah/skor ini mempunyai min dan
sisihan piawai yang sama. Kaedah ini menghasilkan skor piawai, iaitu skor yang mempunyai
min dan sisihan piawai yang tertentu. Skor piawai yang asas ialah skor-z (z-score), yang
boleh dikira dengan menggunakan rumus di bawah:
Skor-z = Skor Mentah - Min
Sisihan Piawai
Skor-z ini mempunyai min sifar dan sisihan piawai 1 (µ=0, ó=1). Sebagai contoh, skor-z bagi
markah 6 dalam Jadual 6.6 boleh dikira seperti berikut:
Skor-z = Skor Mentah - Min = 6-4.4 = 1.6_ = 0.79.
Sisihan Piawai 2.01 2.01
Rajah 6.12 menunjukkan taburan skor piawai yang mempunyai min 100 dan sisihan piawai
15. Rajah ini juga menunjukkan taburan skor adalah di antara skor tertinggi 145 (min + 3 x
sisihan piawai) dan skor terrendah 55 (min – 3 x sisihan piawai). Persentil bagi markah-
markah daripada 55 hingga 145 ditunjukkan di bawahnya. Kebanyakan markah peperiksaan
menggunakan skor piawai yang mempunyai min 100 dan sisihan piawai 15 dan bagi ujian
pencapaian, menggunakan skor piawai yang mempunyai min 10 dan sisihan piawai 3.
124 OUM
TAJUK 6 STATISTIK ASAS
Rajah 6.12 : Taburan skor piawai dan persentil
Secara amnya, skor piawai lain dengan pelbagai min (µ) dan sisihan piawai (σ) boleh dikira
menggunakan skor-z seperti rumus berikut:
Skor piawai (SP) = σ z + µ.
Sebagai contoh, jika kita ingin menukar skor mentah seorang pelajar dalam satu ujian
pencapaian kepada skor piawai dengan min 10 dan sisihan piawai 3, kita perlu mengira terlebih
dahulu skor-z bagi markah mentah pelajar tersebut. Contohnya, kita ingin menukar markah
mentah 5 daripada Jadual 6.6 kepada skor piawai (µ=10, σ=3).
Skor-z = Skor Mentah - Min = 5-4.4 = 0.6_ = 0.29.
Sisihan Piawai 2.01 2.01
SP = ó z + µ = (3)(0.29) + 10 = 0.87 + 10 = 10.87.
Ini bermakna markah mentah 5 seperti dalam Jadual 6.6 (µ=4.4, σ=2.01) menjadi 0.29, apabila
diubah kepada skor piawai z (µ=0, σ=1); dan menjadi 10.87, apabila diubah kepada skor
piawai (µ=10, σ=3). Apa yang tekal ialah ketiga-tiga skor ini melebihi setiap min bagi skor
masing-masing.
6.6 KORELASI LINEAR
Analisis korelasi linear (linear correlation analysis) adalah satu kaedah statistik
untuk menilai kekuatan hubungan linear antara dua (2) pemboleh ubah.
Hubungan linear di sini bermaksud graf hubungannya adalah berbentuk garis
lurus. Sebaliknya, jika hubungan ini tidak linear (mungkin kuadratik/logarisma
dsb), maka analisis korelasi linear ini tidak boleh digunakan.
OUM 125
STATISTIK ASAS TAJUK 6
Jadi, sebelum kita meneruskan penganalisisan data, eloklah kita melihat graf hubungan antara
dua (2) pemboleh ubah ini dengan melukis skatergram (scattergram). Seterusnya, analisis
korelasi linear akan memberikan pekali korelasi antara dua (2) pemboleh ubah. Pekali ini
mempunyai nilai antara -1 hingga +1. Pekali korelasi yang positif menunjukkan hubungan
secara langsung, iaitu apabila skor pemboleh ubah pertama meningkat, skor pemboleh ubah
kedua juga turut meningkat, dan sebaliknya (seperti lama belajar dengan pencapaian). Bagi
pekali korelasi yang negatif, hubungan antara pemboleh ubah adalah secara songsang, iaitu
apabila skor pemboleh ubah pertama meningkat, skor pemboleh ubah kedua akan menurun,
dan sebaliknya (seperti lama menonton TV dengan pencapaian).
Bagaimanapun, dari segi kekuatan hubungan, kita perlu melihat nilai mutlak bagi sesuatu
nilai pekali korelasi itu (misalnya, nilai mutlak bagi -0.85 ialah +0.85). Secara am, interpretasi
terhadap pekali korelasi adalah agak subjektif, bergantung pada sesuatu bidang ilmu. Sebagai
contoh, dalam bidang sains sosial, pekali korelasi -0.3 atau +0.3 dianggapkan sudah agak
tinggi, memandangkan terdapat banyak faktor yang mempengaruhi sesuatu pemboleh ubah.
Sebagai panduan, Jadual 6.7 menunjukkan kekuatan hubungan antara pemboleh ubah
berdasarkan nilai mutlak pekali korelasi antaranya.
Jadual 6.7: Kekuatan Hubungan Mengikut Nilai Mutlak Pekali Korelasi
Nilai Mutlak Kekuatan Hubungan
< 0.20 Amat lemah
0.21– 0.40 Lemah
0.41– 0.60 Sederhana kuat
0.61– 0.80 Kuat
0.81– 1.00 Sangat kuat
Sebagai contoh pengiraan pekali korelasi, kita akan melihat hubungan antara markah uji-uji-
semula, yang boleh digunakan untuk mencari indeks kebolehpercayaan ujian. Data daripada
Jadual 6.6 akan digunakan semula, iaitu sebagai markah Ujian 1, sementara markah Ujian 2
(uji semula) ditambah pada Jadual 6.8. Skatergram bagi markah Ujian 1 dan Ujian 2 ditunjukkah
dalam Rajah 6.13 Daripada rajah ini, kita boleh andaikan hubungan antara markah Ujian 1
dan Ujian 2 adalah linear.
126 OUM
TAJUK 6 STATISTIK ASAS
Rajah 6.13 : Skatergram markah ujian 1 dan ujian 2
Analisis seterusnya ialah mengira pekali korelasi linear antara markah Ujian 1 dan Ujian 2
dengan menggunakan kaedah analisis korelasi Pearson. Rumus untuk mengira pekali ini
ialah seperti berikut dan angka-angka yang perlu dikira telah dimasukkan ke dalam Jadual
6.8.
Jadual 6.8 : Analisis Korelasi Linear bagi Markah Uji-Uji-Semula
Ujian 1 Ujian 2 _ _ _ _ _ _
(xi) (yi) (xi-x) (xi-x)2 (yi-y) (yi-y)2 (xi-x)(yi-y)
2 1 -2.4 5.76 -3.6 12.96 8.64
5 4 0.6 0.36 -0.6 0.36 -0.36
4 5 -0.4 0.16 0.4 0.16 -0.16
1 2 -3.4 11.56 -2.6 6.76 8.84
6 6 1.6 2.56 1.4 1.96 2.24
3 4 -1.4 1.96 -0.6 0.36 0.84
7 6 2.6 6.76 1.4 1.96 3.64
5 6 0.6 .36 1.4 1.96 0.84
4 4 -0.4 0.16 -0.6 0.36 0.24
7 8 2.6 6.76 3.4 11.56 8.84
Min = 4.4 Min = 4.6 ∑=0 ∑=36.4 ∑=0 ∑=38.4 ∑=33.6
OUM 127
STATISTIK ASAS TAJUK 6
n
Pekali korelasi linear Pearson ∑ [(x - x)(y - y)]/(n -1)(s
i=1
i i x )(sy )] ,
di mana x dan y ialah masing-masing min markah Ujian 1 dan Ujian 2, sementara sx dan sy
ialah masing-masing sisihan piawai markah Ujian 1 dan Ujian 2.
Tiga (3) pengiraan berikut perlu dibuat untuk mencari pekali korelasi. Pekali korelasi yang
diperoleh ialah 0.9, yang menunjukkan hubungan kuat antara markah Ujian 1 dan Ujian 2,
yang juga menjadi indeks kebolehpercayaan bagi ujian tersebut. Justeru, kita boleh
memutuskan bahawa ujian ini mempunyai kebolehpercayaan yang tinggi.
(a) Sisihan piawai (sx) = 2.01 (telah dikira melalui Jadual 6.6)
n
(b) Sisihan piawai (sy) = ∑ [(y - y) ]/(n-1) =
i=1
i
2
(38.4/9) = 4.26 = 2.06
n
(c) Pekali korelasi (rxy) = ∑ [(x - x)(y - y)]/[(n -1)(s
i=1
i i x )(sy )] ,
= [33.6]/[(9)(2.01)(2.06)] = [33.6]/[37.26] = 0.90
6.7 REGRESI LINEAR MUDAH
Sebagai kesinambungan kepada korelasi linear, kita akan meneroka sedikit tentang regresi
linear mudah. Bagi dua pemboleh ubah yang mempunyai hubungan, analisis regresi ini akan
menghasilkan persamaan yang menghubungkan pemboleh-pemboleh ubah tersebut.
Persamaan ini boleh digunakan untuk tujuan meramal nilai pemboleh ubah ke-2, apabila
diberi nilai pemboleh ubah pertama. Seperti yang kita ketahui, dalam pengukuran dan penilaian,
kaedah regresi boleh diguna untuk menentukan kesahan ramalan. Seterusnya, perkataan
“linear” dalam frasa “regresi linear mudah” bermaksud hubungan antara dua pemboleh ubah
itu adalah linear, sementara perkataan “mudah” bermaksud hanya terdapat satu pemboleh
ubah peramal dalam persamaan ini.
Ringkasannya, regresi linear mudah ialah satu model regresi yang
menghubungkan satu pemboleh ubah bersandar (dependent variable) dengan
satu pemboleh ubah peramal (predictor variable) secara linear.
128 OUM
TAJUK 6 STATISTIK ASAS
Sebagai contoh pengiraan pekali regresi, kita akan gunakan markah Ujian 1 dan Ujian 2 yang
diberikan dalam Jadual 6.8. Di sini, kita mengandaikan markah Ujian 1 sebagai permal kepada
markah Ujian 2. Sebagaimana juga analisis korelasi, kita perlu melukis skatergram sebelum
melakukan analisis regresi. Seterusnya, bagi mengira pekali regresi, kita boleh gunakan model
persamaan regresi berikut:
Y = bX + a,
di mana Y ialah pemboleh ubah ke-2 (yang diramal), X ialah pemboleh ubah pertama
(peramal), b ialah pekali regresi, dan a ialah angkatap persamaan ini. Nilai a dan b boleh
dikira dengan menggunakan rumus berikut:
b = r(sy/sx) = (0.90)(2.06/2.01) = (0.90)(1.02) = 0.91
a = y – b x = (4.6) – (0.91)(4.4) = 4.6 – 4.00 = 0.60
Y = 0.91X + 0.60
Y = bX + a = 0.91X + 0.60. Oleh itu, persamaan yang menghubungkan markah Ujian 2 (Y)
dengan markah Ujian 1 (X) ialah:
Y = 0.91X + 0.60
Jika kita ingin meramal markah pelajar dalam Ujian 2, sekiranya pelajar ini mendapat 7 markah
dalam Ujian 1, kita gantikan X dengan 7 dalam persamaan di atas, iaitu:
Y = 0.91X + 0.60 = (0.91)(7) + 0.60 = 6.37 + 0.60 = 6.97 (markah Ujian 2 sebenar ialah
6 dan 8).
RUMUSAN
Tajuk ini telah menjelaskan beberapa kaedah asas statistik yang boleh digunakan dalam bidang
pengukuran dan penilaian. Penjelasan awal dibuat tentang pengertian dan penggunaan statistik
dalam pendidikan, termasuk dalam bidang pengukuran dan penilaian. Bahagian seterusnya
menjelaskan tentang penggunaan angka dan grafik untuk menggambarkan taburan data,
iaitu penggunaan kekerapan, histogram dan carta pai.
Dua lagi grafik yang penting untuk menjelaskan taburan data dijelaskan juga, iaitu poligon dan
ogif. Poligon dilukis bersama histogram untuk menunjukkan taburan data menggunakan graf
garis. Ogif pula digunakan untuk mencari persentil sesuatu skor dan sebaliknya. Seterusnya,
analisis asas diguna untuk menentukan ukuran memusat dan serakan serta skor piawai.
Ukuran ini termasuk mod, median, min, julat, varians, sisihan piawai dan skor piawai. Akhirnya,
konsep serta pengiraan pekali korelasi dan regresi turut diperkenalkan.
OUM 129
STATISTIK ASAS TAJUK 6
GLOSARI
Carta Pai ialah satu grafik yang menggambarkan saiz kekerapan bagi
sesuatu set data yang berkadaran dengan luas sektornya.
Histogram ialah rajah berbentuk kotak yang dilukis dengan paksi-Y
menunjukkan kekerapan dan paksi-X menunjukkan skor atau
kelas skor.
Korelasi Linear ialah hubungan antara dua pemboleh ubah yang grafnya
berbentuk garis lurus.
Persentil ialah markah yang mana di bawahnya terdapat markah yang
lebih rendah sebanyak peratus tersebut.
Regresi Linear Mudah ialah satu model regresi yang menghubungkan satu pemboleh
ubah bersandar dengan satu pemboleh ubah peramal secara
linear.
Skor Piawai ialah skor yang mempunyai min dan sisihan piawai yang tertentu.
Statistik ialah satu set teori dan kaedah yang boleh digunakan untuk
memahami data.
Ukuran Memusat ialah ukuran yang menggambarkan skor tengah bagi sesuatu
set data, iaitu seperti mod, median dan min.
Ukuran Serakan ialah ukuran yang menggambarkan darjah serakan bagi sesuatu
set data, iaitu seperti julat, varians dan sisihan piawai.
UJIAN 1
(1) Jelaskan pengertian statistik.
(2) Bagaimanakah anda mengira buka sudut carta pai di pusat bulatan?
(3) Pekali korelasi antara dua pemboleh ubah ialah -0.85. Jelaskan hubungan dan kekuatan
hubungan ini.
UJIAN 2
Markah ujian bagi 10 orang pelajar adalah seperti berikut:
5 7 3 5 6 2 8 5 3 6
(a) Cari mod, median dan min bagi markah-markah ini.
130 OUM
TAJUK 6 STATISTIK ASAS
(b) Cari julat, varians dan sisihan piawainya.
(c) Tukarkan markah 7 kepada skor-z.
RUJUKAN
Buana: Pengajar Jurusan Sejarah Universitas Negeri Makassar. Ujian Nasional: Penilaian
atau Evaluasi?
Garfield, J. (1992). Assessment and Teaching Statistics. JSE.
Hanna, G.S. & Dettmer, P.A. (2004). Assessment for Effective Teaching: Using Context-
Adaptive Planning. Boston:Pearson-Allan & Allyn and Bacon.
Mehrens, W.A. & Lehmann, I.J. (1991). Measurement and evaluation in education and
psychology (4th ed.). Chicago: Holt, Rinehart and Winston.
Nitko, A.J. (2004). Educational Assessment of Students. Upper Saddle River, N.J.: Pearson-
Merill Prentice Hall.
Sarle. W. S. (1997). Disseminations Of The International Statistical Applications Institute,
Volume 1, Edition 4, 1995, Wichita: Acg Press, Pp. 61-66.
Van Dalen., D.P. (1979). Understanding Educational Research. (4th ed.) McGraw-Hill. Inc.
OUM 131


Use: 0.0086