ÖLÇME ARAÇLARININ NİTELİKLERİ

Ölçme aracında bulunması gereken özellikler üç tanedir:

Güvenirlik
Geçerlilik
Kullanışlılık
GÜVENİRLİK

Güvenirlik herhangi bir ölçme aracının ölçtüğü özellikleri ne derece duyarlılıkla ölçebildiği, yani ölçme sonuçlarının hatadan ne derece arınmış olduğudur. Başka bir değişle ölçme sonuçlarının hatasız olmasıdır.

Güvenirlikte iki özellikten söz edilebilir.

Tutarlılık-kararlılık
Duyarlılık

Güvenirlik bir aracın aynı gruba iki ya da üç kez uygulandığında gruptaki her öğrenci tüm uygulamalarda aynı puanı almasıdır. Eğer iki ölçüm arasında fark yok ya da az ise o testin güvenirliği yüksek, bu fark çok ise güvenirliği düşüktür. Ölçme araçlarının tümü için bu özellik geçerlidir. Ağırlığımızı ölçtüğümüz bir tartı aracı her ölçme sonucunda aynı sonucu verirse güvenilir demektir. Güvenirlik bir test veya ölçme aracının ölçtüğü şeyi ne kadar doğru ölçtüğü ile ilgilidir. Başka bir deyişle, ölçme hatası az olan test güvenilir, ölçme hatası fazla olan test güvenilmez sayılır. Bir terazi düşünün: ağırlığınızı ilk tartışta 55 kg. gösteriyor; hemen arkasından 54.5 kg. gene hemen arkasından 56 kg. gösteriyor. Bu aracın ölçtüğü şeyi yüzde yüz doğru ölçmediği, tekrarlanan ölçme sonuçlarının birbirini tutmamasından bellidir. Aynı şekilde bir test ilk uygulanışında zeka bölümünüzü 110, ikinci uygulanışında 115, üçüncü uygulanışında 105 gösterse, sonuçları bu tutarsızlığı testin yeterince güvenilir olmadığını göstermeğe yeter. Sonuçlar arasındaki farklar büyükse ölçme hatası yüksek, küçükse, ölçme hatası, düşük demektir. Ölçme hatası uzunluk, ağırlık, hacim, ısı, basınç vb. gibi fiziksel değişkenlerin ölçümünde son derece az bilgi, beceri, anlayış ve kişilik özellikleri gibi ruhsal değişkenlerin ölçümünde oldukça yüksektir. Ölçme araçlarında sağlanan duyarlık ilerledikçe, ölçme hatası azalır; fakat hiçbir zaman tümüyle ortadan kalkmaz. Hatasız ölçme yoktur.

Aracın güvenilir olması, aynı şartlar altında hep aynı sonucu vermesi demektir. Buna kararlılıkta denir. Bir test, aynı sınıfa değişik zamanlarda uyguladığımız zaman, aynı veya çok yakın sonuçlar alıyorsak bu test güvenilir demektir. Her seferinde değişik sonuçlar alıyorsak, o takdirde test güvenilir değildir.

Bir ölçme aracı olarak “testin güvenirliliği, ölçtüğü nesne ya da özelliği, her uygulanışında, aynı duyarlılıkla ölçmesi demektir. Ölçme aracının duyarlı olması ölçme hatasının en az ya da hiç olmamasıdır. Örneğin altın bakkal terazisi ile değil kuyumcu terazisi ile tartıldığında daha duyarlı sonuçlar verir.Ölçmede Hata Kavramı

Hata bir özelliğin ölçülmesiyle elde edilen ölçüm sonucu ile özelliğin gerçek sonucu arasındaki farktır. Örneğin manifaturacıların kullandığı tahta metreyi düşünelim. 1 metre 100 cm’dir. Ancak aşrı kullanılmaktan tahta metrenin uçlarının aşındığını düşünelim. Eğer aşınma yaklaşık 1 cm ise bu yapılacak ölçümlerde hata olacağını ifade eder. Çünkü 100 cm yerine 99 cm bulacağız. Bu durumda eğer ölçtüğümüz kumaş 10 metre ise her metrede 1 cm hata olacağı için ölçüm sonucumuz 9,90 cm çıkacaktır. Bu 10 cmlik fark ölçmedeki hata miktarıdır. Aynı şekilde eğitim alanında yapılan tüm ölçmelerde de kullandığımız tüm ölçme araçlarında mutlaka hata olacaktır.

Ölçmede 3 tür hata vardır. Bunlar: sabit, sistematik ve tesadüfî hatalardır.

Sabit Hata: Bir ölçmeden başka bir ölçmeye miktar olarak değişmeyen hatalardır. Bozulan terazinin her ölçümde 500 gr eksik tartması gibi. Bu durumda, ölçülen her değişken için hata miktarı tekrar edecek, ancak sabit kalacaktır. Aynı şekilde bir sınavda öğretmenin tüm öğrencilere 10 puan fazla veya eksik vermesi.

Sistematik Hata: hata miktarı, herkes için aynı olmayıp farklılık göstermektedir. Önceden belirlenen kurala göre sistematik şekilde puanlamada bir farklılık olduğu durumlarda sistematik hata söz konusudur. Örneğin hiç devamsızlığı olmayanlara 10 puan fazla vermek, bir öğretmenin yazılı kâğıtlarını okurken yazı güzelliğine 20 puan fazla vermesi, kız veya erkeklere fazla puan verilmesi. Kısaca, ölçülen büyüklüğe, ölçmeciye, ölçme koşullarına göre miktarı değişen hatadır.

Tesadüfi (rastlantısal) Hata: Tesadüfi hata, ölçme sonuçlarını tesadüfi olarak etkileyen herhangi bir faktörlerden kaynaklanabilir. Örneğin, her insanın ruh halinin iyi olması performansını etkileyebilir. Eğer ruh hali ölçümde performansı etkiliyorsa, bu durum bazı çocuklar için gözlenen puanları yükseltebilir, bazılarınınkini ise suni olarak düşürebilir. Tesadüfi hata hakkında bilinmesi gereken en önemli noktalardan biri, bütün ölçümler üzerinde sürekli bir etkisi olmadığıdır. Bu nedenle, tesadüfi hata ölçme sonuçlarının değişkenliğini artırırken, ortalama üzerinde fazla etki yaratmaz. Tesadüfi hata, yukarıda sözü edilen kaynaklardan herhangi biri veya birkaçından kaynaklanabilir. Ölçmeyi yapan kişinin, değişik kaynaklardan gelebilecek hataları önleme konusundaki çabalan, ölçme sonuçlarının güvenirliğini artırabilir. Başka bir deyişle, ölçme sonuçlarına rastgele karışabilecek hataları önleme gayretleri, ölçme sonuçlarının güvenirliğini artırma çabalarıyla örtüşür. Bu hatanın kaynağı bilinmez. Örneğin öğretmenin puanlama sırasında hesaplamaları yanlış yapması gibi.

Hata türleri ve güvenirlik geçerlilik ilişkisi

Hata Çeşidi Geçerlilik Güvenirlik Kontrol
Sabit Etkilenir Etkilenmez Edilir
Sistematik Etkilenir Etkilenmez Edilir
Tesadüfi Etkilenir Etkilenir EdilmezHata kaynakları ise:

Ölçmeci: ölçen kişinin yaşı, sağlığı, yorgunluğu, ruh hali gibi özellikleri hataya neden olabilir.
Ölçme aracı: tutarlı olmaması, bozuk olması veya test bağlamında düşünüldüğünde soruların iyi hazırlanmamış olması vb.
Ölçülen özellik: ölçülen özelliğin niteliğindeki değişmeler, tamamının ölçülemeyişi, net olarak tanımlanamaması gibi özellikler etkiler. Örneğin öğrencilerin bilişsel özellikleri sürekli değişim gösterdiği gibi tam olarak da hiçbir zaman tanımlanamaz.


Güvenirlik Kestirme Yöntemleri

Güvenirlik Kuramı işlenirken güvenirliği tam olarak hesaplamanın mümkün olmadığını, bunun yerine güvenirliği kestirmek zorunda olduğumuza değinmiştik. Burada, başlıca güvenirlik kestirme yöntemleri tanıtılacak ve bu yöntemlerin güçlü ve zayıf noktalarına değinilecektir. Bu yöntemler:

I.Test-Tekrar Yöntemi: Testin, aynı denekler üzerinde, belli bir zaman dilimi içerisinde ve belli koşullar sağlanarak tekrar uygulanması işlemidir. Bu yaklaşım, iki uygulama arasında geçen zaman içerisinde ölçülen özelikte önemli değişikliğin olmadığı sayıltısına dayanır. Bu sayıltının karşılanabilmesi için iki ölçüm arsında geçen süre önemlidir. Biliyoruz ki, bir şeyi iki defa ölçersek, iki gözlem arasındaki korelasyon, kısmen iki ölçme zamanı arasında geçen süreden etkilenebilir. Yani, süre ne kadar kısalırsa korelasyon o kadar yüksek; süre ne kadar uzarsa korelasyon da o kadar düşük çıkabilir. Bunun nedeni iki gözlemin geçen zamanla bağlantılı olmasıdır-süre kısaldıkça hatalara katkıda bulunan daha çok benzer etkenler olabilir. Bu nedenle, iki uygulama arasında geçen süre, ne hatırlanacak kadar kısa ne de testle ölçülen özelikler bakımından öğrencilerin değişebileceği kadar uzun tutulmalıdır. Genellikle, testin tekrarı için 10 ile 20 günlük bir sürenin yeterli olacağı düşünülür.

II. Eşdeğer Formlar Yöntemi: Eşdeğer formlar yöntemi uygulanış biçimiyle test-tekrar yöntemiyle aynıdır ancak, güvenirlik konusunda aynı yapıyı ölçtüğü düşünülen iki eşdeğer form arasındaki uyuma dayanır. Eşdeğer formlar yöntemi, aynı testin tekrar uygulanmasının mümkün olmadığı durumlarda kullanılır. Bunu yapmanın bir yolu, aynı yapıda birçok soru üretmek ve bu sorulan rasgele iki parçaya ayırarak eşdeğer formlar oluşturmak ve aynı gruba iki farklı zamanda uygulamaktır. Bu iki eşdeğer form arasındaki korelasyon güvenirliğin tahmini olarak kullanılır. Bu yöntemde önemli sorunlardan birisi, aynı yapıda çok sayıda madde üretilmesi gereğidir ve bu her zaman kolay olmayabilir. İkinci temel sorun ise, eşdeğer formlar yöntemi, formların ölçülen özellikler bakımından eşdeğer veya eşit olduğu sayıltısına dayanır. Bu sayıltının karşılanması amacıyla formlar çok sayıda madde arasından random örnekleme yoluyla seçilerek oluşturulmaya çalışılsa da, bu işlem sayıltının karşılanması için yeterli olmayabilir. Eşdeğerliğin kanıtlanması için başka istatistikler işlemlere gereksinim duyulur ki, bu işlemler burada değinilmeyecek kadar karmaşık ve zahmetlidir. Eşdeğer formlar yöntemi bir yönüyle aşağıda açıklanan test-yarı yöntemine de benzetilebilir. En önemli farkları, eşdeğer formlar yönteminde formlar eşdeğer olarak yapılandırılır ve iki form birbirinden bağımsız olarak uygulanır. Ayrıca, eşdeğer formlar, öntest ve sontest kullanılan deneysel araştırma modellerinin iç geçerliğini artırmada önemli bir avantaj sağlayabilir.

III. Test-Yarı Yöntemi: Test-yarı yöntemi, test bir defa uygulandığında güvenirlik kestirme yöntemlerinden biridir. Bu yöntemde, eldeki test bir defa uygulanır ve rastgele iki eşit yarıya ayrılmış testin her bir yarısı için öğrencilerin toplam puanları hesaplanır. Her bir alt test için hesaplanan puanlar arsındaki ilişki iki alt test arasındaki tutarlılığı verir. Bu şekilde hesaplanan tutarlılık katsayısını toplam testin güvenirliği gibi yorumlamak doğru olmaz. O nedenle, iki yan arasındaki tutarlılığın toplam teste genellenmesi gerekir. İki yarı arasındaki tutarlılığı toplam testin güvenirliği için genellerken alt testlerin varyanslarının eşit olup olmamam durumuna göre hareket edilmesi gerekir. Burada, toplam testin rastgele iki eşit yarıya ayrılmasının nedeni, her bir yarının diğeriyle aynı amaca hizmet etme olasılığını artırmaktır.

IV.İç Tutarlılık Katsayısı: İç tutarlılık katsayısı, test bir defa denendikten sonra deneme sonuçlarına dayanarak maddeler arasındaki uyumun düzeyine ilişkin bilgi vermeyi amaçlar. Genellikle tek boyutlu yapılar için hesaplanması uygun düşer. Çünkü temel amaç, diğerleriyle daha çok uyum gösteren maddelerden oluşan bir test geliştirmekse, ortak amaçlara hizmet eden maddelerin bir arada olması testin kendi içinde tutarlı olmasını sağlar. Eğer test kendi içinde tutarlıysa, o testle güvenilir ölçümler elde edilebilir. Bir testin iç tutarlılık katsayısını kestirme, testin madde istatistiklerinin hesaplanıp hesaplanmadığına bağlı olarak değişebilir. Eğer, madde istatistikleri belli olan test için iç tutarlılık katsayısı hesaplanacaksa KR-20, ham puanlardan hareketle iç tutarlılık katsayısı hesaplanacaksa KR-21 olarak bilinen bağıntılardan yararlanılır.

Bir testin güvenirliğini artırmak için öğretmen nelere dikkat etmeli, hangi önlemleri almalıdır?

Bir testteki (sınavdaki) soru sayısı arttıkça sınavın güvenirliği de artar. Çünkü soru sayısı arttıkça ölçme hatası azalır. Soru sayısının ne kadar artırılması gerektiğini etkiyen başka faktörler vardır ve öğretmen bunları da göz önünde bulundurmak zorundadır. Mümkün olduğu kadar az sorulu sınavlardan ziyade daha çok sayıda soruların bulunduğu sınavları tercih ediniz.
Sorular öğrencilerin düzeylerine uygun hazırlanmalıdır. Sınav soruları öğrencilerin seviyesinin üzerinde hazırlanmışsa güvenirlik azalır. Böyle bir sınavda bilmeden, gelişigüzel cevaplamalar otaya çıkar ki, bu durum güvenirliği düşürür. Sorular seviyenin altında hazırlanmışsa da güvenirlik düşer. Oldukça ağır bir maddeyi elimizdeki küçük bir ağırlıkla ölçmemiz nasıl mümkün değilse, seviyenin altında testle üst seviyeyi ölçmek de mümkün olmaz. Öğrencilerinizi doğru ve yeterince tanıyınız. Soruları onların düzeylerini dikkate alarak, aynı zamanda ayırt edici olmasına özen göstererek hazırlayınız.
Sınav süresinin gereğinden daha kısa ya da uzun olması da güvenirliği düşürür. Sürenin çok kısa olması durumunda erişilemeyen sorular bulunacaktır. Gereğinden uzun olması durumunda ortaya çıkacak olumsuz sonuçları sizler biliyorsunuz. Sınav süresini sınıfınızdaki zayıf öğrencilerin durumlarını da göz önüne alarak ideal bir miktarda tespit ediniz.
Sorular açık, anlaşılır biçimde yazılmış ve kesin, belli cevaplar isteyen türden olmalıdır. Soruları açık ve anlaşılır şekilde ifade etmemek, onları anlama yönünden güçleştirir. Öğrenciler arasında, sorudan ne istendiği konusunda değişik anlayışların ortaya çıkmasına yol açar. Sorularınızı açık ve anlaşılır sorunuz. Ne istendiğini anlatacak kadar kısa ve yalın kaleme alınız.
Öğrencilerin sınavlar konusundaki fikirleri ve önyargıları da güvenirliği etkiler. Sınavları kendilerini değerlendirmenin bir aracı, yanlış ve eksikliklerini tanımanın bir vasıtası olarak gören ve inanan öğrenciler, soruları cevaplamaya isteklidirler ve sınav motivasyonları yüksektir. Bu durum sonuçların güvenirliğini artırır. Sınavları öğrencileriniz için bir ölüm kalım meselesi haline getirmeyiniz. Sınavların onların kendi durumlarını, görebilmesinde bir ayna vazifesi gördüğüne inanınız, inandırınız.
Objektif puanlanabilen sınavların güvenirliği daima yüksektir. Ayrıca puanlama hataları arttıkça güvenirlik düşer. Objektif puanlanabilen maddeler ile sınav yapınız (aksi gerekmedikçe), yazılı yoklamalarda mutlaka puanlama anahtarı kullanınız ve puanlama hataları ortaya çıkarabilecek durumlara karşı dikkatli olunuz.


GEÇERLİLİK

Geçerlilik, bir ölçme aracının ölçmeyi amaçladığı özelliği, başka herhangi bir özellikle karıştırmadan, doğru olarak ölçe bilme derecesidir. Başka bir deneyimde, bir ölçme aracının geliştirilmiş bulunduğu konuda maksada hizmet etmesidir. Bir ölçme aracı kullanış amacına ne oranda hizmet edebiliyorsa o oranda geçerlilik özelliğine sahiptir.

Bir aracın geçerli olması için onun sadece ölçmek için düzenlediği özelliği ölçmesi yani onu başka özelliklere karıştırmadan ölçmesi de gerekir. Lise son sınıf örgencilerinin sosyoloji bilgilerini ölçmek bir yazılı yoklama yapıldığını ve sınav sonunda her öğrenciye başarısının özeti olan bir puan verildiğini düşünelim. Bu sınav lise sosyoloji bilgilerinin tümünü ölçüyorsa; elde edilen puanlarda, yazı güzelliği anlatımının biçimi düzgünlüğü, bilgiyi sunuş biçimi sınav gibi sosyoloji bilgisi dışındaki başka etkenlerin etkisi yoksa söz konusu sınavın geçerliği tamdır. Bu durumda sınavdan elde edilen puan bizim ölçmek istediğimiz sosyoloji bilgilerinin tümünün ve sadece sosyoloji bilgilerinin bir ölçüsü olur. Uyguluma ve özellikte eğitimde birçok durumda ölçmek istediğimiz bilgi ve becerinin tümünü bir sınavda ölçmek olanaksız olduğu gibi sınavdan elde edilen puana ölçme konusu bilgi ve beceriler dışındaki başka etkenler de etki eder. Bu etkenlerden ötürü kullanılan ölçme araçlarının geçerliği, hiçbir zaman tam değildir

Eğitimde kullanılan ölçme araçlar için geçerlik türleri şunlardır:

1) Kapsam geçerliği,

2) Tahmin (yordama) geçerliği

3) Görünüş geçerliği
Kapsam Geçerliği

Testin veya ölçme aracının tam olarak ve ölçme aracındaki her maddenin amacı ne derece hizmet ettiğinin belirtisidir. Ölçülecek testin bütün veya ayrı ayrı her madenin tam olarak ölçebilme özelliğidir. İyi bir test verildiği konularda bütünü kapsamına alacak biçimde örneklere sahip olmalıdır Ne gereğinden çok soru sorulmalı nede az soru sorulmalıdır. Bütünü meydana getirebilecek sondaları yapacak nitelikte soruları kapsamına almalıdır.

Kapsamın geçerliği bir bütün olarak testin ve testteki her bir maddenin maksada ne derece hizmet etiğidir .bir maddenin maksada ne derece hizmet ettiğidir bir testin kapsam geçerliği (1) 0 testteki toplam maddelerin ölçülecek davranışları ve konu içeriğini örnekleme derecesine ve (2) testteki her bir maddenin ölçmek istediği madenin ölçmek istedi davranışı ve derece iyi ölçtüğüne bağlıdır bir testtin kapsam geçerliğine sahip olabilmesi için bu iki isterin ola bilmesi için bu iki isterin birlikte karşılanması gerekir ..ölçme konusu evreni yeterli ve dengeli olarak örnekleyen ve kapsadığı maddelerin her biri ölçmek istediği davranışları gerçekten ölçen bir test kapsam geçerline sahiptir.

Kapsam geçerliği bir testin bu testle ölçülmek istenen davranışları ne derece kapsadığıyla ilgilidir. Ne amaçla kullanılırsa kullanılsın, test kapsamı açısından ölçmeye konu olan davranışları yeterli derecede temsil etmelidir. Başarı testlerinde kapsam geçerliği hazırlanan testin, bir alana dönük programı ya da kapsamını ne derece temsil ettiği değerlendirmek suretiyle belirlenir.

Bu aracın kapsam geçerliliği iki yolla bulunur

a. Mantıksal yol

b. İstatistiksel yol

a) Mantıksal yol ile araçtaki her sorunun ve bunların dağılımının ölçülmek istenilen konuları ve davranışları örnekleyip örneklemediği, deneyimli öğretmen ve uzmanlardan yararlanarak araştırılır.

b) İstatistiksel yol, belli bir alan için geçerli bir araç seçilir. O alan için geliştirilen yeni araçla kıyaslanır. Bunun için bu iki araç da aynı öğrencilere uygulanır ve öğrencilerin iki araçtan elde ettikleri puanlar arasındaki korelasyon hesaplanır. Hesaplama sonucunda bulunan korelasyon katsayısı kapsam geçerliğini belirlemeye çalışılan aracın GEÇERLİK KATSAYISI olarak adlandırılır. Bu katsayı ne ölçüde büyükse araç o ölçüde geçerlidir.Crocker ve Algina (1986), Kapsam geçerliği belirlenirken aşağıdaki adımların izlenmesi gerektiğini belirtmişlerdir.

Ölçmeye konu olan ilgili kapsam alanını tanımlamak,
Ölçmeye konu olan kapsam alanında seçkin uzmanların bir araya getirilerek panel oluşturulması,
Kapsama ilişkin belirlenen hedef davranışları ve ölçme aracının maddelerini eşleştirebilmek için bir çerçeve oluşturmak,
Bu eşleştirme işlemine dayalı bilgi toplama ve özetleme.


Kapsamlı bir test hazırlamak için aşağıdaki unsurlara dikkat edilmelidir.

1 - Konunun genel ve özel amaçlarının iyi belirlenmesi ve bilinmesi,

2 - Konuların önem derecesine göre sıralanabilmesi,

3- Amaçlara uygun soru veya test tipinin iyi seçilmesi,

4 - Ölçülmek isteneni ölçecek kadar soru veya test konulması.


Tahmin (Yordama) Geçerliği

İstatistiksel teknik kullanarak ve bilinenden yararlanarak bilinmeyen durumlar hakkında yapılan geleceğe yönelik tahminde bulunma işidir. Örneğin, bir veya bir grup üniversite öğrencisinin lise bitirme dereceleri ile üniversite giriş sınavlarında aldıkları puanlara göre üniversite başarılarını incelemek gibi. Bireylerin gelecekteki başarılarının telafi edilebilmesi için kullanılan testlerin bu amaca hizmet etmesi, tahmin geçerliğine sahip olması beklenir.

İstatistiksel teknikler kullanarak ve bilinenlerden yararlanarak bilinmeyen durumlar hakkında geleceğe yönelik tahminlerde bulunma işlemidir. Yordama işinde kullanılan istatistiksel teknik REGRASYON'dur.

Bir aracın yordama geçerliği bireyin o araçtaki sorulara verdiği cevaplarla aracın tahmin için ön gördüğü özelliğin, doğrudan ölçüsü olan ve sonradan elde edilen ölçü arasındaki korelâsyondur. Korelâsyonun büyüklüğü yordama geçerliğini arttırmaktadır.

Bir testin yordama geçerliğini belirlemede en önemli nokta uygun bir ölçüt ölçüsü elde etmektir. Seçilen ölçüt ölçüsünün önem sırasına göre şu dört niteliğe sahip olması istenir:

1. Ölçüt ölçüsü; testin yordamaya çalıştığı değişkenle doğrudan ilgili olmalıdır. Başka bir deyişle, ölçüt ölçüsü; elde hazır bulunan test puanlarının alınmasında etkili olan aynı etkenler tarafından belirlenmelidir.

2. Ölçüt ölçüsü, oldukça kararlı olmalı, günden güne değişmemelidir. Çok açıktır ki, kendisi kararsız olan bir ölçü, hiçbir araçla yordanamaz.

3. Ölçüt ölçüsü, kişinin başarısını gerçekten yansıtan nesnel ve güvenilir bir ölçü olmalıdır. Sözgelişi, okulda alınan notlar ölçüt olarak alınmışsa, öğrencilere verilen notlara, öğrenci başarısının dışındaki etkenler (kişilik özellikleri ve öğretmen öğrenci arasındaki ilişki gibi) etki etmemelidir

4. Ölçütün elde edilmesi, kolay ve pratik olmalıdır.

Yapı Geçerliği

“Bir testten elde edilen puanın hangi anlama geldiğinin ifadesidir. Testten elde edilen puanlarla psikolojik ve eğitimsel yapı arasında bağıntı yüksekse bu testle yapı geçerliği yüksektir. Bunun anlamı, test belirlenen yapıyı ölçüyor demektir. Örneğin, genel yetenekle ilgili belli bir kuram ortaya atılmış ve kuram genel yeteneği yapı yönünden tanımlamış olsun. Eğer geliştirilen test bu yapı ile ilgili ölçme yapıyor ve yapıyı açıklamamıza dolayısıyla test uygulanan bireylerin almış oldukları puanlara göre bireyleri bu yapı yönünden tanımlayabilmemize yardım ediyorsa testte yapı geçerliği var deriz.

Yapı geçerliğinin belirlenmesinde şu yol izlenmelidir; (1) yapı ve diğer yapılarla ilişkileri, özellikleri araştırılarak yapı hakkında kuramsal ve işe vuruk tanımlar yapılmalı, (2) işe vuruk tanımlara dayalı hipotezler kurulmalı, (3) hipotezleri test etmek üzere araç-gereçler geliştirilmeli veya hazır olanlar kullanılmalı, ( 4) araç uygun bir gruba uygulanarak veriler toplanmalı, (5) elde edilen verilerin hipotezleri destekleyip-desteklemediği test edilmeli, (6) destekliyorsa, yapının ortaya çıkan özellikleri ortaya konmalıdır. Yapı geçerliğine kanıt sağlamak için bir çok yöntem geliştirilmiştir.(Atılgan ve diğ., 2006, s.125)

Bir testin yapı geçerliğini belirleme süreci bir ölçüde, bilimsel kuram geliştirme süreciyle aynıdır.

Görünüş Geçerliliği

Teste bakıldığında, içindeki örneklerin testin neyi ölçtüğünün kolayca görülebilmesi özelliğidir. Bazı testlerde tersine neyi ölçtüğünün belli olmaması da istenebilir.

Görünüş geçerliği bir testin gerçekten ne ölçtüğüyle değil onun ne ölçüyor göründüğüyle ilgilidir. Bir testin görünüş geçerliği o testin ölçmek istediği şeyi ölçüyor görünmesidir. Görünüş geçerliği olan bir test kapağında ne yazılıysa onu ölçüyor görünür. Sözgelişi kapağında “Fizik Testi” yazılı olan bir testin içinde fizikle ilgili sorular varsa, söz konusu testin görünüş geçerliği vardır denir.

Genel olarak bir ölçme aracının geçerliliğinin yükseltilebilmesi için:

1. Açıklaması (yönerge) herkesçe aynı biçimde anlaşılabilmeli.

2. Kullanılan ölçekler bireyin seviyesinde olmalı.

3. Gruba uygulanıyorsa grubun seviyesinde olmalı.

4. Tekniğine göre hazırlanmalı.

5. Test maddeleri veya test bataryası belirtilen amaçlan ölçecek nitelikte olmalı.

6. Hazırlanan testin güvenirliği olmalı.

Bir testin geçerliğini artırmak için öğretmen nelere dikkat etmeli, hangi önlemleri almalıdır?

Her soru ölçmek istediğimiz davranışlardan en az, birini ortaya çıkarıcı ve ölçücü olacak biçimde hazırlanmalıdır. Hazırladığınız her sorunun, o dersin hedef davranışlarından en az bir tanesi ile ilişkili olmasını sağlayınız. Bunun için soru hazırlarken dersin amaçlarını ve hedef davranışları daima göz önünde tutunuz.

Her soru ölçtüğümüz davranışa sahip olanlarla olmayanları ayırıcı biçimde hazırlanmalıdır. Sorularınızın bilen öğrenciler bilmeyeni, az bilen ile yanlış öğrenmiş olanı ayırt edebilecek özelliklere sahip olmasını sağlayınız.

Geçerlilik özelliğini sağlamak için testi muhakkak güvenilir biçimde hazırlamak gerekir. Çünkü güvenilir olmayan test, zaten geçerli de değildir. Bu yüzden önceki sayfalarda açıklanan güvenirliği artırıcı her tavsiye burada da söz konusudur.

Test, ders programını hem kapsayıcı, hem de dengeli biçimde temsil edici nitelikte hazırlanmalıdır. Bu ise her şeyden önce iyi bir sınav planı hazırlamakla sağlanabilir.

Aynı sorular hiç değiştirilmeden yıllarca üst üste kullanılmamalıdır. Sorular hiç değiştirilmeden defalarca kullanıldığında yayılabilecek, böylece öğrenciler derse çalışmak yerine geçmiş yıllarda sorular soruların çözümlerini ezberleme yolunu seçeceklerdir. Her uygulamada sorularınızı değiştiriniz.

Öğrencilere sınavdan önce ipucu olabilecek bilgiler vermek ya da bir kısım soru yazdırıp içinden bazılarını sormak da geçerliliği düşürür. Öğrencilerinizi sınavdan önce sorular üzerinde yetiştirmeyiniz.

Cevap kâğıtlarının puanlanmasında ortaya çıkacak bir yanlışlık da geçerliliği düşürür. Dikkatsizlik ya da yanlı davranma gibi faktörlerden arındırılmış bir puanlama yaklaşımı benimseyiniz.

Sınavda kopya yapılması da geçerliliği düşürür. Sınavların eğitim-öğretim sürecinde birer araç olduğunu unutmayınız ve öğrencilerinize bu fikri veriniz. Sınavlar sayesinde ne öğrendik? Ne kadar öğrendik? Eksiğimiz ve yanlışınız nelerdir? Gibi soruların cevapları bulunacaktır.

Böylece öğrenme sürecini daha verimli ve başarılı bir çizgiye getirebileceğiz. Sınavlarda kopya yapılması ise bu amacımıza engel olur. Kopya, bir öğrencinin gerçekten ne kadar öğrendiği, eksiği ve yanlışının neler olduğu konusunda doğru geri bildirim vermemizi önler. Olumsuz bir davranışı ortaya çıkmadan önce önlemenin daha kolay, ortaya çıktıktan sonra sonuçlarını telafi etmenin daha zor olduğunu hiç unutmadan, kopyaya müsaade etmeyiniz.

Geçerliği Etkileyen Etmenler

Her ölçme aracının geçerliği o araçtaki maddelerin teker teker geçerliğine bağlıdır. Bir madde o testle ölçülen değişkenin en az bir yönünü ölçüyorsa test geçerliğine katkıda bulunur. Maddenin geçerliğini madde yapısı ve kapsamı tayin eder.
Ölçme aracının kapsamı, geçerliği tayin eden etmenlerden biridir. Kapsam yalnız bir programa bağlı testlerde değil, genel zeka testi gibi kapsam evreni sınırlandırılmamış testlerde de önemlidir. Kapsamın geçerli olup olmadığını yoklamak için aracın puanlarının ne amaçla kullanılacağı bilinmelidir. Amaç göz önünde bulundurulduğunda hem dar bir kapsam hem de gereğinden geniş bir kapsam geçerliğin düşük olacağını gösterir.
Ölçme amaçlarında madde sayısı arttıkça kapsam genişleyeceği ve güvenirlik artacağı için geçerlik de artar.
Test güvenirliğini arttıran bütün etkenler, kapsamı daraltmamak kaydıyla test geçerliğini de arttırır.
Ölçmelerin yapılma koşulları ve ölçme ortamı ölçmelerin geçerliğini etkiler Standart uygulama koşullarına uyulmaması ölçme sırasında gürültü v.b. gibi yan etkiler, geçerliği düşürür.
Cevaplayıcıların içinde bulundukları bedensel ve ruhsal koşullar da geçerliği etkiler. Sınavlarda kişilerin yeteneklerini tam olarak ortaya koyacakları farz edilir. Oysa ki, cevaplayıcıların gerektiği derecede güdülenmemiş olmaları, hızlı çalışmamaları, düzeyde ortaya koymalarını engeller.
Uygulamada cevaplamaya verilen sürede ölçümlerin geçerliğini etkiler. Sürenin çok kısa verilmesi hiçbir cevaplayıcının testi bitirememesine, bu da test kapsamının daralmasına yol açar. Üstelik, çok kısa süre verilen testlerde cevaplayıcıların rasgele cevaplama eğilimleri artar. Uygulamada gereğinden fazla süre verilmesi de geçerliğin düşmesine sebep olur.
Puanlama hataları ve puanlama yanlılıkları da geçerliği düşürür. Diğer etkenler aynı kalmak koşuluyla, objektif yöntemlerle puanlanabilen bir araç daha geçerli puanlar verir.
Ölçme aracının geçerliğini onu cevaplandıran grubun yetenek düzeyine, bu nedenle test güçlüğüne de bağlıdır. Bir grup için çok güç gelen bir test yeterince geçerli olmayacağı gibi, çok kolay gelen bir test de geçerli olmaz. Testin ortalama güçlüğü, puanların kullanılacağı amaca göre ayarlanır.
Ölçüt puanlarının yeterince güvenilir olmaması halinde geçerlik katsayısı gerçek değerinden küçük bulunur. Ölçüt puanları yeterince güvenilir olsa bile, bir ölçüte göre hesaplanan geçerlik katsayısı ölçütün hangi değişkenlerden oluştuğuna bağlıdır. Bu sebeple, bir test bir ölçütle yüksek korelasyon verdiği halde her bir ölçütle düşük korelasyon verebilir.
Denemelerle bulunan geçerlik katsayılarının büyüklüğü, verilerin toplanmasında kullanılan deneysel yöntem ile istatistiğin hesaplanmasında kullanılan yönteme de bağlıdır.


KULLANIŞLILIK

Bir testin uygulama yönetme ve kolaylığıdır. Testin verilmesi kolay, açıklanması ve anlaşılmazı kolay, değerlendirilmesi kolay ve gereğinden fazla zaman almayan özelliğidir. Bütün bunların yanında çeşitli yaş ve beceri seviyelerine adaptasyon kolaylığı da bir başka kullanışlılık özelliğidir.

Bir ölçme aracının sahip olması istenen üçüncü nitelik, kullanışlılıktır. Bir testin kullanışlılığı, onun geliştirilmesi, çoğaltılması, uygulanması ve puanlanmasının en kolay ve ekonomik olması demektir.

Bir ölçme aracının kullanılışlığı; o aracın kullanan ve o aracı değerlendiren kişi için kolaylığıdır. Bir ölçme aracı uygulanırken, cevaplanırken, puanlanırken ve puanları yorumlanırken az zaman almalı, kolay olmalı, fazla zahmet gerektirmelidir. Ayrıca ölçme aracının ucuza mal edilmesi de kullanışlılık özelliğidir. Bir ölçme aracı kullanışlı olabilmesi için şu özelliklere sahip olması gerekir.

Ölçme aracının bir uygulama yönergesi olmalıdır. Bu yönerge aracın uygulanması sırasında güçlüklerle karşılaşılmamasını sağlar. Örneğin, sınavın süresinin, sınav sırasında dikkat edilecek hususların yer aldığı bir yönerge sınavın daha sağlıklı yürütülmesine imkân verir.

Ölçme aracının kullanışlı olmalıdır. Ölçme aracının cevap anahtarına göre puanlanması ve bu puanlama işleminin kolay olması hem zamandan hem emekten tasarruf sağlar. Örneğin, cevap kâğıdı kullanma puanlama kolaylıklarından biridir.

Öğrenci için kullanışlı olmalıdır. Ölçme aracının özellikle öğrenci için kullanışlılığı çok önemlidir. Örneğin uygun punto ile yazılmış olması, okunaklı olması, kullanılan dilin anlaşılır olması ya da mümkün olduğu kadar az işaretleme ile cevaplanabilmesi öğrenciye sağlanacak kolaylıktadır

Ölçme aracı ucuza mal edilmelidir. Ölçme aracının hazırlanması ve kullanımı sırasında kâğıt, mürekkep, baskı, silgi gibi masrafların az aza indirilmesi gerekir. Ayrıca ölçü aracı için harcanılan zamanın da maliyete katılması, bu konuda da az harcama yapılmasına dikkat edilmesi yerinde olur. Aksi takdir de bu gibi hususlarda ölçme aracının maliyetini artırmaktadır

Ölçme aracı tekrar kullanılabilmelidir. Bir ölçme aracının bir kez kullanılabilme özelliği de o aracın kullanışlığını arttırır. Bir ölçme aracının bir kez kullanılması o aracın hazırlanması için harcanan zaman ve emeğin büyük kısmının boşa gitmesidir. Örneğin, cevap kağıtlı uygulamak, soru kitapçığı üzerine hiçbir şey yazmamayı söylemek ya da kullanılan kağıdı dayanıklı kağıttan seçmek gibi hususlar aynı ölçme aracının tekrar tekrar kullanımına imkan sağlar. Ancak bazı sınavlarda ölçme aracının bantlanarak ya da arka kapağı zarf şeklinde öğrenciye verilmesi gerekmektedir. Üniversite giriş sınavı ya da kamu personeli dil sınavı gibi ülke çapında yürütülen sınavlarda bu tür uygulamalar oldukça yararlıdır. Bu takdirde öğrenci tarafından kullanılmayan ölçme araçlarının başkaları tarafından da (örneğin gözetmenler tarafından) açılmasını engellenmiş olur. Bu tür bir uygulamada öğrenci tarafından kullanılan ölçme aracının tekrar kullanılabilirlik özelliği ortadan kalkar ancak sınavın ciddiyeti ve sorunsuz geçmesi için bu tür bir uygulama gerekebilir.

Ölçme araçlarının kullanışlılık özelliği şu hususlarla ilgilidir:

1. Uygulama sırasında güçlükle karşılaşmamak: Testi alanların uygulayıcıya cevaplama ile ilgili fazla soru sormamaları ve “şimdi ne yapacağız?” şeklinde tereddüde düşmemeleri, gerekir. Bunun için test yönergesinin ve test açıklamalarının çok iyi hazırlanmış olması gerekir.

2. Testi puanlamanın kolay olması: İleride öğreneceğiniz bazı konuların ve geçmiş yaşantılarınızın sayesinde şu soruya cevap verebilirsiniz: Yazılı yoklamalar, kısa cevap gerektiren sorular, çoktan seçmeli testler ve doğru yanlış maddelerinden oluşan sınavlardan hangileri daha kolay, çabuk ve daha az hatalı puanlanabilir? Bu soruya vereceğiniz cevap, puanlama kolaylığı açısından söz konusu ölçme araçlarının durumunu ortaya koyacaktır. Tartışınız.

3. Testin baskı yönünden de kullanışlı olması gerekir: Okuma güçlüğü olmaması, baskısının düzgün olması, seçeneklerin belirli ve ay biçimde basılmış olması, satır aralarının ve yazı puntosunun öğrencilerin yaşlarına uygunluğu gibi nitelikleri taşıması gerekir.

4. Cevaplama yönünden kullanışlı olmalıdır: Cevapları yazma, işaretleme işlemi gereksiz enerji ve zaman sarf etmeyi gerektirmemeli, çeşitli hatalara sebep olmayacak tarzda düzenlenmelidir. Bu noktada cevap kâğıdının veya cevapların yazılacağı boşlukların, cevaplamayı kolaylaştıracak bir nitelik taşıması ön plana çıkmaktadır.

5. Testin, ucuza, mal olması da kullanışlılığın bir başka yönüdür: Testin ucuza mal olması derken kâğıt, baskı, mürekkep masraflarının yanında harcanan zaman faktörü de kastedilmektedir.

Beğeniler: 0
Favoriler: 0
İzlenmeler: 5493
favori
like
share