Edit
Adres
Hoşdere Caddesi, Güzelkent Sokak, Çankaya Evleri, F Blok, No:2 Çankaya PK 06540 ANKARA
Telefon
Faks
+90 (312) 442 36 54
Hoşdere Caddesi, Güzelkent Sokak, Çankaya Evleri, F Blok, No:2 Çankaya PK 06540 ANKARA
+90 (312) 442 36 54
Bilimsel bir çalışma; araştırma konusunun veya problemin belirlenmesi, araştırmanın planlanması, hipotezlerin kurulması, doğru örnekleme yöntemleri ile örneklem seçimi, doğru verinin toplanması, hipotezlerin uygun yöntemlerle test edilmesi ve elde edilen sonuçların yorumlanması ve raporlanması aşamalarından oluşmaktadır. Bu sürecin herhangi bir aşamasında yapılan bir hata tüm çalışmanın seyrini ve sonuçlarını etkileyebilir. Araştırmacıların sıklıkla karşı karşıya kaldığı problem, elde ettikleri verilerle hipotezlerini test ederken doğru istatistiksel yöntemleri uygulayamamak veya analiz sonuçlarını doğru yorumlayamamaktır. Bu yazıda, araştırmacılara çalışmalarının istatistiksel analizlerinde temel düzeyde yardımcı olacak bir rehber hazırlanması amaçlanmıştır.
Anahtar Kelimeler: Bilimsel araştırma, hipotez, önemlilik testleri, istatistiksel yaklaşımlar
Abstract
Determination of research topic or problem, planning of research, determination of hypotheses, sample selection with correct sampling methods, collection of correct data, testing hypotheses with appropriate statistical test and interpretation and reporting the results are the main stages of a scientific study. An error at any stage of this process may affect the course and the results of the entire study. The common problem with the researchers is using inappropriate statistical methods or can not interpret the findings correctly. In this paper, it is aimed to prepare a guide that will help the researchers in the basic level in the statistical analysis of their studies.
Keywords: Scientific research, hypothesis, statistical tests, statistical approachs
Önemlilik testleri, genel anlamda, bir araştırma sonucunda elde edilen değerlerin ya da bulguların istatistiksel açıdan anlamlı olup olmadığını test etmek için kullanılan yöntemlerdir [1]. Deney gruplarının karşılaştırılması, değişkenler arası ilişkilerin incelenmesi, sağ kalım sürelerinin tahmini, herhangi bir hastalığın tedavisinde yeni yöntemin belirlenmesi için kriter veya kriterlerin ne olacağının belirlenmesi, bir değişkenin sağlıklı veya hasta kişilerdeki referans değerlerinin belirlenmesi gibi çeşitli amaçları incelemek için hipotez testleri kullanılır [2, 3].
İstatistiksel hipotez; belirli varsayımlar altında, iki ya da daha fazla toplum parametresinin birbirine eşit veya farklı olduğunu, değişkenler arası ilişki düzeyini, değişkenlerin birbirlerinden bağımsızlığı gibi ifadeleri sembolik olarak ifade eden ve geçerliliği önemlilik testleri ile denetlenen önermelerdir [3].
İstatistiksel hipotezler sıfır hipotezi ve karşıt (alternatif) hipotez olmak üzere iki farklı şekilde oluşturulurlar.
a) Sıfır Hipotezi
Farksızlık, eşitlik, benzerlik üzerine kurulan önermelerdir. Bu sebeple yokluk hipotezi farksızlık hipotezi ya da geçersizlik hipotezi olarak da adlandırılır. “H0” şeklinde gösterilir. Bir testte öne sürülen ve asıl test edilmek istenen hipotezdir [4]. Örneğin, deney ve kontrol grupları arasında vücut kitle indeksi bakımından fark olup olmadığını araştıran bir araştırmacının kuracağı hipotez;
“H0: Deney ve kontrol grupları arasında vücut kitle indeksi bakımından fark yoktur” şeklinde olacaktır. Önemlilik testi sonucuna göre sıfır (yokluk) hipotezi kabul edilir veya reddedilir.
b) Alternatif (Karşıt) Hipotez
Sıfır hipotezine karşı kurulan hipotezdir. H1 veya HA şeklinde gösterilmektedir. Hipotezin tek yönlü mü çift yönlü mü olduğu alternatif hipotez ile belirlenir. Örneğin, bir hipotez çift yönlü ise;
H0:μ=20
H1:μ≠20 şeklinde kurulur. Eğer sıfır hipotezi reddedilirse evren parametresi µ’nün 20’ye eşit olmadığı öngörülmektedir.
Eğer bir hipotez tek yönlü ise;
H0:μ=20
H1:μ>20 ya da H1:μ<20 şeklinde kurulur. Eğer sıfır hipotezi reddedilirse evren parametresi µ’nün alternatif hipotezin kuruluş yönüne göre 20’den büyük ya da küçük olabileceği öngörülmektedir.
İstatistiksel testlerin temel amacı, sıfır hipotezini alternatif hipoteze karşı belirli bir yanılma payı (α) ve belirli bir güven olasılığına (1-α) göre test etmektir. Bu nedenle hipotez testlerinin ele alınmasında çözülecek soruna uygun bir hipotez kurulması gerekir [3].
Verilerin Analize Hazırlanması
Bir çalışmada elde edilen veriler analiz edilmesinden önce verilerin doğruluğunun kontrol edilmesi gerekir. Bunun için yapılan en temel denetim “en küçük-en büyük (min.-max.) hata denetimi”dir. Araştırmada toplanan her bilgi için beklenen en küçük ve en büyük değer veya kod dışında bir karakterin bulunup bulunmadığı kontrol edilir. Eğer varsa hasta dosyası, soru veya gözlem kağıdından kontrol edilerek düzeltilir [5].
Doğru Önemlilik Testinin Seçimi
Çalışmada hangi önemlilik testinin kullanılacağına karar vermeden önce, bir takım sorulara cevap vermek gerekir. Doğru önemlilik testinin seçiminde; verinin ölçüm biçimi, grup sayısı, grupların bağımsız olup olmaması, gruplardaki denek sayısı, test edilecek değişken sayısı ve verinin herhangi bir parametrik dağılıma uyup uymaması etkilidir. Bu kriterler göz önüne alınarak doğru önemlilik testi seçilir.
Ölçümle elde edilen veriler için önemlilik test seçimine karar vermeden önce, bu verilerin parametrik test varsayımlarını sağlayıp sağlamadıklarının kontrol edilmesi gerekmektedir. Örneklemin çekildiği evrenle ilgili parametrik varsayımlar, normal dağılıma uygunluk ve varyansların homojenliğidir [6]. Eğer bu koşullar sağlanıyor ise parametrik testler tercih edilmelidir. Parametrik olmayan önemlilik testlerinde ise evren dağılımları ile ilgili herhangi bir varsayım yoktur. İlgili değişkenlerin evren dağılımı konusunda herhangi bir bilgi yoksa, üzerinde çalışılan örneklemlerin incelenmesi yardımıyla parametrik test varsayımları sınanır [7].
Normal Dağılıma Uygunluğun Araştırılması
Bir dağılımın normal dağılıma uygunluğu temel olarak grafiksel yöntemler ve önemlilik testleri olmak üzere iki farklı yolla incelenebilir. Grafik yöntemlerinin kolaylığı neredeyse bütün istatistiksek paket programlarda yer almaları ve görsel olarak normal dağılıma uygunluğa karar verebilmeleridir [7]. Kutu-çizgi grafiği, Histogram, Dal-yaprak grafiği, P-P ve Q-Q grafikleri bunlara örnek verilebilir. Grafiksel yöntemlerin yanında önemlilik testleriyle de dağılımın normal dağılıma uygunluğu araştırılır. Shapiro-Wilk ve Kolmogorov-Smirnov en çok bilinen ve kullanılan önemlilik testleri olsalar da, Anderson-Darling, Jarque-Bera ve Cramer-von-Mises gibi farklı durumlarda kullanılması gereken normal dağılım testleri de vardır [8].
Grup Sayısı 1 olduğunda;
Verinin ölçüm biçimine bakılır. Eğer ki niteliksel bir veri varsa “Ki-kare Uyum İyiliği” testi doğru bir seçim olacaktır. Eğer ölçüm ile elde edilmiş veriye sahip isek testin uygulanması için gereken varsayımların sağlanıp sağlanmadığına bakılır. Eğer ki varsayım sağlanmıyorsa “İşaret testi”; varsayımlar sağlanıyor ise “Evren Ortalaması” veya “Evren Oranı” önemlilik testleri kullanılmalıdır [1].
Grup Sayısı 2 olduğunda;
Verinin ölçüm biçimine bakılır. Eğer ki ölçüm ile elde edilmiş bir veri ise, grupların bağımsızlığı sorgulanır. Gruplar bağımsız ise parametrik test varsayımlarının sağlanıp sağlanmadığı test edilir. Varsayım her 2 grupta da sağlanıyor ise “Bağımsız Örneklem t testi (Independent Samples t test)”, varsayım en az 1 grupta sağlanmıyor ise “Mann-Whitney U” testi kullanılır. Eğer gruplar bağımlı ise aynı parametrik test varsayımı tekrar sınanır. Varsayım her 2 grupta da sağlanıyor ise “İki Eş Arasındaki Farkın Önemlilik Testi (Paired Samples t test)”, varsayım en az 1 grupta sağlanmıyor ise “Wilcoxon” testi kullanılır.
Eğer ki verinin ölçüm biçimi nitel ise, yine benzer şekilde grupların bağımlı olup olmadığına bakılır. Eğer ki gruplar bağımsız ise iki yüzde arasındaki farkın önemlilik testi veya “Pearson Ki-kare” testi kullanılır. Ancak sadece 2x2’lik çapraz tablolar için; beklenen değeri 5’ten küçük bir göze var ise “Fisher’in Kesin Ki-kare”, gözlenen değer n=25’ten küçük bir göze var ise “Yates düzeltmeli Ki-kare” testleri tercih edilir. Eğer gruplar bağımlı ise, 2x2’lik çapraz tablolar için “McNemar” testi, diğer durumlar için bağımlı gruplarda iki yüzde arasındaki farkın önemlilik testi tercih edilir.
Grup Sayısı 3 veya daha fazla olduğunda;
Grup sayısı 2 olduğunda yapıldığı gibi verinin ölçüm biçimine bakılır. Eğer ki ölçüm ile elde edilmiş bir veri ise, grupların bağımsızlığı sorgulanır. Gruplar bağımsız ise parametrik test varsayımların sağlanıp sağlanmadığı test edilir. Varsayım tüm gruplarda da sağlanıyor ise “Varyans Analizi (ANOVA)”, varsayım en az 1 grupta sağlanmıyor ise “Kruskal Wallis” testi kullanılır. Eğer gruplar bağımlı ise parametrik test varsayımı sınanır. Varsayım tüm gruplarda da geçerli ise “Tekrarlı Ölçümlerde Varyans Analizi (repeated measures of ANOVA)” varsayım en az 1 grupta sağlanmıyor ise “Friedman” testi kullanılır.
Eğer ki verinin ölçüm biçimi nitel ve gruplar bağımsız ise “Ki-kare” veya “Kolmogorov-Smirnov” testleri kullanılır. Gruplar bağımlı ve verinin ölçüm biçimi ikili (binary) ise “Cochran Q” testi ile hipotez testi gerçekleştirilir.
Nicel Değişkenler Arasındaki İlişkiler
* İki ya da daha çok değişken arasında ilişki olup olmadığını, ilişki varsa yönü ve gücü korelasyon analizi ile belirlenir [6]. Örnek vermek gerekirse;
* Gelişim çağındaki çocuklarda yaş ile boy arasında bir ilişki olup olmadığı,
* Toksik bir maddenin verilen dozu ile deney hayvanın ölüm süresi arasında ilişki olup olmadığı,
* Yaş ile kan basıncı arasında ilişki olup olmadığı,
* Günlük alınan kalsiyum miktarı ile kemik yoğunluğu arasında ilişki olup olmadığı.
“Korelasyon Analizi” ile incelenebilir. Eğer değişkenler normal dağılıma uyuyor ise “Pearson Korelasyon Katsayısı”; normal dağılıma uymuyor ise “Spearman Korelasyon Katsayısı” ile değişkenler arasındaki ilişkinin düzeyi raporlanabilir [9]. Korelasyon analizinde önemli olan durum değişkenler arasında neden-sonuç ilişkisinin aranmasıdır. Bazen araştırmacılar nicel iki değişken arasında anlamlı bir ilişki bulduklarında, gerçekte bu iki değişken arasında bir neden-sonuç ilişkisi olup olmadığına bakmadan yorumlayabiliyorlar. Burada dikkat edilmesi gereken söz konusu iki değişkeni etkileyen 3. bir değişkenin olup olmadığıdır. Eğer bu atlanırsa aralarında hiç bir ilişki olmayan iki değişken arasında ilişki varmış gibi bir sonuca varılabilir.
Korelasyon analizini uygularken yapılan bir diğer temel hata ise veri setinde herhangi bir uç değerinin olup olmadığının kontrol edilmemesidir. Bazı durumlarda iki değişken arasında aslında hiç bir ilişki yokken; var olan uç bir değer iki değişken arasında ilişki varmış gibi bir sonuç elde edilmesine neden olabilir. Böyle bir durumun önüne geçmek için yapılması gereken, aralarında ilişki bulunan iki değişken için saçılım (scatter plot) grafiğinin çizilmesidir. Grafik çizildiğinde, böyle bir durumun olup olmadığı net bir şekilde görülecektir.
Bağımlı değişken ve en az 1 bağımsız değişken arasındaki ilişkinin matematiksel bir fonksiyon ile gösterilmesi için “Regresyon Analizi” uygulanır. Bağımsız değişken sayısı kurulan modelin yapısına göre iki veya daha fazla olabilir [10]. Bağımsız değişken “x” ve bağımlı değişken “y” ile gösterilirse y’nin x üzerine olan regresyonu y=f(x) şeklinde gösterilir. Bir bağımlı bir bağımsız değişken olması durumunda ilişki “Basit Regresyon” ile, bağımsız değişken sayısı 2’den fazla olduğunda “Çoklu Regresyon” ile belirtilir [11].
Regresyon analizine örnek vermek gerekirse;
* Yaş ile boy arasında bir model geliştirilir ise, bir çocuğun belirli yaşlarda boyunun ne kadar olacağı,
* Doğum sayısı ile hemoglobin miktarı arasında bir model geliştirilir ise, belirli sayıda doğum yapacak bir kadının hemoglobin değerinin ne olacağı,
* Yaş ile kan basıncı arasında ilişki olup olmadığı,
* Bir hastalıkta kullanılan ilacın doz miktarı ile iyileşme süresi arasında bir model geliştirilir ise verilen doza göre hastanın ne kadar sürede iyileşebileceği tahmin edilebilir [6].
* Regresyon analizi, bağımlı değişkenin türüne göre farklılaşmaktadır. Eğer bağımlı değişken ikili (binary) değerler alan bir değişken ise “Logistik Regresyon”; bağımlı değişken sıralı (ordinal) ise “Ordinal Regresyon”, bağımlı değişken ölçüm değişkeni ise “Linear Regresyon” veya yaşam süresi üçerinde bağımsız (açıklayıcı) değişkenlerin etkilerini ölçebilmek için “Cox Regresyon” analizleri kullanılabilir [12].
Sonuç
Bu çalışmada yer verilen kavramlar araştırmacıların çalışmalarında ve kendi alanlarında yayımlanan güncel kaynakları takiplerinde temel düzeyde dikkat etmesi ve özen göstermesi gereken kavramlar olup çalışmanın planlama aşamasından analiz sonuçlarının yorumlanma aşaması da dahil olmak üzere bir biyoistatistik uzmanının desteğinin alınmasında fayda bulunmaktadır.
Araştırma yapıldıktan sonra biyoistatistik uzmanına başvurmak; ölüye otopsi yapmasını istemekten başka bir şey değildir. Çünkü, bu aşamada biyoistatistikçi sadece, araştırmanın neden öldüğünü söyleyebilir (R.A. Fisher-1938).
Hakem Değerlendirmesi: Dış bağımsız.
Çıkar Çatışması: Yazar çıkar çatışması bildirmemiştir.
Finansal Destek: Yazar bu çalışma için finansal destek almadığını beyan etmiştir.
Peer-review: Externally peer-reviewed.
Conflict of Interest: The author have no conflicts of interest to declare.
Financial Disclosure: The author declared that this study has received no financial support.
Kaynaklar
1. Akdağ B, Sümbüloğlu K. Önemlilik Testleri, 1. Baskı, Hatipoğlu Yayınları, 2010, Ankara.
2. Ankaralı H, Cangür Ş, Sungur MA. Formülsüz Biyoistatistik, 1. Baskı, Betim Yayın, 2015, İstanbul.
3. Özdamar K. SPSS ile Biyoistatistik, 5. Baskı, Eskişehir, 2003.
4. Sümbüloğlu V, Sümbüloğlu K. Klinik ve Saha Araştırmalarında Örnekleme Yöntemleri ve Örneklem Büyüklüğü, 2005, Ankara.
5. Sümbüloğlu V, Sümbüloğlu K. Sağlık Bilimlerinde Araştırma Yöntemleri, 5. Baskı, Ankara, 2004.
6. Sümbüloğlu K, Sümbüloğlu V. Biyoistatistik, 13. Baskı, Ankara, 2009.
7. Alpar R. Spor, Sağlık ve Eğitim Bilimlerinden Örneklerle Uygulamalı İstatistik ve Geçerlik-Güvenirlik, 2. Baskı, Ankara, 2012.
8. Büyükuysal MÇ. Farklı Örneklem Genişliklerinde Normal Dağılım Testlerinin Karşılaştırılması, Doktora Tezi, Zonguldak Bülent Ecevit Üniversitesi Sağlık Bilimleri Enstitüsü, Zonguldak, 2014.
9. Dişçi R. Temel ve Klinik Biyoistatistik, 1. Baskı, İstanbul, 2008.
10. Çömlekçi N. Temel İstatistik İlke ve Teknikleri, Eskişehir, 1998.
11. Kan İ. Biyoistatistik, 1. Baskı, Bursa, 2009.
12. Sertkaya D, Ata Sözer MT. Yaşam Çözümlemesinde Zamana Bağlı Açıklayıcı Değişkenli Cox Regresyon Modeli”. Ankara Üniversitesi Tıp Fakültesi Mecmuası 2005; 58: 153-8.
Adres :
Hoşdere Caddesi, Güzelkent Sokak, Çankaya Evleri, F Blok, No:2 Çankaya PK 06540 ANKARA
Telefon :
+90 (312) 442 36 53
Faks :
+90 (312) 442 36 54
E-Posta :
trd@trd.org.tr
Bu internet sitesinde sizlere daha iyi hizmet sunulabilmesi için çerezler kullanılmaktadır. Çerezlerin nasıl kullanıldığını incelemek ve çerezler hakkında detaylı bilgi almak için Çerez Politikamızı inceleyiniz.
Açık Rıza Metni Aydınlatma Metni Çerez Politikası