Ölçme Araçlarının Nitelikleri

Son güncelleme: 03.06.2010 10:03
  • Ölçme Ve Değerlendirme - Güvenilirliği Etkileyen Faktörler - Test Ve Madde Istatistikleri - Uygulama şekillerine Göre - Ölçme Araçlarının Geçerlik Ve Güvenirliğini Sağlamak Için

    Ölçme ve Değerlendirme

    Ölçme:Nesnelerin ya da özelliklerin miktarlarının belirli bir yöntemle gözlenip gözlem sonuçlarının sayı ya da sembollerle ifade edilmesidir.
    1. Doğrudan Ölçme: Ölçülmek istenen özellik ya da nesne evrende varolduğu şekliyle ölçülür. Yani özelliğin ya da nesnenin kendisi ölçülür.
    2. Dolaylı Ölçme: Bazı özellikleri ya da nesneleri şekliyle değil de eserleriyle ölçeriz. (zeka gibi)

    Ölçek: Belirli bir özelliği ölçmek için hazırlanmış ve üzerinde birimleri hep aynı olan ölçme araçlarıdır.
    1. sınıflama ölçekleri:benzerliklere göre (kadın erkek gibi)
    2. sıralama ölçekleri:belirli bir ölçekle sıralama(birinci, ikinci)
    3. eşit aralıklı ölçekler:bir nokta sıfır alınır (takvim gibi)
    4. oranlı ölçekler: birimler arasında oran vardır (terazi, saat gibi)

    Değerlendirme: Ölçme işlemiyle elde edilen sonuçlara bir anlam yüklemek (sınavdan 50 almak değil geçip geçmediği bilgisi değerlendirme.)

    Ölçme araçlarının sahip olması gereken nitelikler

    Geçerlilik
    Bir ölçme aracının ölçmeyi amaçladığı özelliği ölçüp başka özellikleri ölçmemesidir. Bir ölçeğin geçerliliğini belirlemek için çeşitli yöntemler geliştirilmiştir. Bu yöntemler geliştirilen ölçeğin ne amaçla kullanılacağına bağlı olarak değişir.
    1.kapsam geçerliliği
    2.yordama geçerliliği
    3.yapı geçerliliği
    4.görünüş geçerliliği

    kapsam geçerliliği: değerlendirme amacıyla hazırlanan testlerin o derste kazandırılmaya çalışılan davranışların hepsini belirli bir oranda kapsaması gerekir. Bir konuyla ilgili binlerce madde yazılabilir, soru çıkarılabilir. Bunların azaltılması gereklidir elbette, kapsam geçerliliği bu az sayıdaki maddenin o konuyla ilgili yazılabilecek binlerce maddeyi ne kadar temsil ettiğini belirler. 2 farklı yol vardır: rasyonel yaklaşım, istatistiksel yaklaşım.
    Rasyonel yaklaşım: testler, konuları ve kazandırılmak istenen davranışları içeren belirtke tablosuna göre geliştirilir. Bu tabloya bakılarak testteki soruların her bir davranışta belirli oranda yer alması sağlanarak kapsam geçerliliği için çalışma yapılır.

    İstatistiksel yaklaşım: eğer biz bir alanda geliştirilmiş olan ve kapsam geçerliliği yüksek olduğunu bildiğimiz bir testle kendi geliştirdiğimiz testi aynı öğrencilere uygulayıp öğrencilerin bu testlerden aldıkları puanlar arasındaki ilişkiyi hesaplarsak ortaya çıkan ilişki değerini kendi testimizin kapsam geçerliliği derecesi olarak yorumlayabiliriz.

    yordama geçerliliği:yordama belirli bilgilere dayanarak ve belirli teknikler uygulayarak geleceğe ilişkin tahminde bulunmaktır. Eğitimde yordama bir öğrencinin ya da bir öğrenci grubunun gelecekte ne derecede başarı göstereceğini tahmin etmek için kullanılır. Okula henüz başlamamış öğrencinin zeka testine bakarak, okuldaki başarı durumunun ne olacağını tahmin etmeye yönelik bir çalışma yordama çalışmasıdır. Yordama geçerliliği ise bir testin kişilerin o alanda gelecekteki başarısını ne derecede doğru olarak tahmin ettiğidir.

    yapı geçerliliği: yapı, birbiriyle ilişkili olduğu düşünülen belirli öğelerin ve bu öğeler arası ilişkilerin oluşturduğu bir örüntüdür. Zeka, bir yapıdır. Kendine özgü alt öğeleri vardır ve bu öğeler birbirleri arasında ilişkilidir. Biz bu öğeler arasında olduğunu düşündüğümüz ilişkinin aynısını o özelliği ölçen testten elde ettiğimiz veriler arasında da görmek isteriz. Bir anlamda yapı geçerliliği çalışmasında ölçmeye çalıştığımız özelliği nasıl tanımladıysak testin de bize bu tanıma uygun veri sağlamasını bekleriz.

    görünüş geçerliliği:bir testin, ne ölçüyor göründüğü o testin görünüş geçerliliğidir. Soruların tümü matematikle ilgili olan bir matematik testinin görünüş geçerliliği vardır diyebiliriz.

    Güvenilirlik
    Bir ölçme aracının, ölçme sonuçlarına hata karıştırmadan ölçme yapabilmesi güvenilirliktir. Hata, ölçme aracının ölçmek istediği özellik dışındaki özellikleri ölçmesidir. Güvenilirlik, ölçme aracının hatalardan arınık olması yeterliliğidir.

    Hata kaynakları:
    1.ölçmeciden kaynaklanan hatalar
    2.ölçme aracından kaynaklanan hatalar
    3.ölçmenin yapıldığı ortamdan kaynaklanan hatalar
    4.ölçüm alınan kişilerden kaynaklanan hatalar
    Hata türleri:
    1.sabit hatalar: ölçmeden ölçmeye hep aynı miktarda karışan hatalardır.
    2.sistemli hatalar: puanlama yapanın yanlılığı durumu.
    3.rasgele hatalar:dikkatsizlik sonucu oluşur.

    Güvenilirliğin Anlamları
    Güvenilirlik katsayısının belirlenmesi;
    1.tekrarlı ölçümle güvenilirlik kestirimi: bu yöntemde güvenilirlik katsayısı tahmin edilecek test aynı gruba belirli bir zaman aralığıyla 2 kez uygulanır. Korelasyon katsayısı -1 ile +1 arasında değişir fakat güvenilirlik katsayısı 0 ile +1 arasında değişir. Eğer iki ölçüm arasında hiç ilişki yoksa güvenilirlik katsayısı 0 olacaktır. Bu durum ölçmelerimizin tamamen hatalı olduğunu gösterir.
    2.paralel testler: bu yöntemle güvenilirlik katsayısı hesaplanırken bir testin eşdeğer formu geliştirilir. Eşdeğer form=madde sayısı, maddelerin ölçtüğü davranışlar ve maddelerin niteliği bakımından testlerin birbirine denk olması. İki paralel test aynı öğrenci grubuna aynı zamanda verilir ve bu iki testten elde edilen puanlar arasındaki korelasyona bakılır. Böylece bu testlerin eşdeğerlik katsayısı hesaplanmış olur. Aynı testler aynı öğrenci grubuna farklı zamanlarda verilirse hem testlerin eşdeğerliği hem de ölçülen özeliğin ne derecede kararlı olarak ölçüldüğüne ilişkin bilgi toplanmış olur.
    3.testi yarıya bölme yöntemi: bu yöntemin temel varsayımı testin içindeki tüm maddelerin aynı psikolojik özelliği ölçtüğü yönündedir. Bu nedenle hepsi aynı şeyi ölçen soruların 2eşit yarıya bölünmesi ve bu yarılar arasındaki korelasyonun hesaplanması, testi oluşturan maddelerin testin genel amacına bağlı olarak kendi içlerinde ne derecede tutarlı ölçme yaptıklarını gösterecektir.

    Güvenilirliği etkileyen faktörler
    Güvenilirliği testin uzunluğu, testin yönergesi, testi oluşturan maddelerin homojenliği gibi etmenler etkiler. Test uzatılırsa güvenilirlik artar ama belirli bir yerden sonra güvenilirlik çok büyük artışlar göstermez.

    Güvenilirlik ve geçerlilik arasındaki ilişki
    Güvenilirlik geçerlilik için yeterli koşul değildir. Bir test için geçerlilik en fazla güvenilirliğin kareköküne eşit olabilir.

    Testlerin sınıflandırılmasıÖlçtükleri davranışların içeriğine göre
    1.tipik tepki testleri
    2.maksimum performans testleri

    Uygulama şekillerine göre
    1.bireysel testler
    2.grup testleri

    test ve madde istatistikleri
    test ve madde istatistikleri test üzerindeki bilgilerimizi ve testin gücünü artırmaya yönelik bir çalışmadır.
    Güvenilirlik katsayısı: test puanlarındaki ölçüm hatasının etkileri hakkında bir şeyler söyler
    Geçerlilik katsayısı: test puanlarına dayalı kaba bir yordama yapabilmeyi sağlar.
    Medyan: puanlar büyükten küçüğe sıralanınca ortadaki rakam
    Mod: en çok tekrarlanan puan

    Normal dağılım (sir francis galton-1800)
    Normal dağılım varsayımına göre evren, her bir özellik ya da madde için (zeka, kişilik, yetenek, boy, kilo vs) bu özelliklere ya da maddeler dahil olan öğelerin birbirine yakın değerlerde veya benzerlikte olmasına özen gösterilmektedir. Yani herhangi bir özelliğin ya da maddenin içindeki öğelerin çok az bir kısmı aşırı uçlarda değerler alır.
    Ölçümlerimizin normal dağılıma olan benzerliği ne kadar artarsa bu ölçümlerin evrene ait ölçümler olduğuna dair kesinliği de artar.
    Ölçümlerimizin evrene olan benzerliği bu ölçümlerden yola çıkarak yapacağımız tahminlerin, yordamaların ve bu yordamalara ilişkin tüm girişimlerimizin daha ayakları yere basar şekilde yapılması demektir.
    Eğer mod aynı zamanda ortalamaysa elde ettiğimiz puanların normal dağılım gösterdiğini söyleyebiliriz.eğer medyan da bu puanlara eşitse mükemmel bir dağılım eğrisi vardır.
    Mod>ort veya medyan>mod ise normal dağılımdan uzaklaşma vardır.

    Varyans, standart kayma(sapma)
    En önemli test istatistiklerinden ikisi varyans ve standart kaymadır. Herhangi bir değişkenin alabileceği tüm değerlerin bulunduğu aralığa o değişkenin değişim alanı denir.
    Değişim alanı= varyans

    Varyansı biz elimizde bulunan sabit bir ölçme aracına örneğin bir metrelik bir çubuğa benzetebiliriz. Buyo bir metre veya bir metrenin katları olan herşeyi ölçebiliriz. Fakat boyu tam bir metre olmayan ya da bir metreden daha uzun olup ta tam iki metre olmayan cisimlerin boylarını tam olarak belirleyemeyiz. Bunu yapabilmek için çubuğumuzun üzerinde bu çubuğu eşit parçalara bölen bazı işaretlere gereksinim duyarız. Bu işaretlere denk gelen yerleri kaçıncı işaret olduğuna bakarak örneğin 3işaret ya da 4işaret uzunluğunda diyebiliriz. Elde ettiğimiz puanların üzerine yerleştiği yere de dağılım deriz. Ve bu dağılımın iki ucu arasında kalan yeri tıpkı çubukta olduğu gibi bir ölçme aracı düşünürüz. Bu dağılımı da eşit parçalara bölebilmek için de biz bir formülden yararlanırız ve dağılımı eşit parçalara böleriz. Bu bölünen parçaların her birisi bizim dağılımımızın birimleri olur ve bu birimin adı da standart kayma'dır.
#03.06.2010 10:03 0 0 0