Örneklem Sayısı Belirleme Ve Güç Analizi Hakkında Bilinmeyenler

0 1.062

Sizce bilim üretenler, neden çalışmaya başlamadan önce uygun örneklem sayısı belirlemeye ihtiyaç duyar?

Yıllar önce böyle bir ihtiyaç bu kadar gündemde değildi. Dergiler ve hakemlerin çoğu bu konuda istek veya öneride bulunmuyordu. Son 5-10 yıldır özellikle kaliteli akademik dergiler bu konuda araştırmacıları tabir-i caizse sıkıştırmaya başladılar. Bilimsel ve istatistiksel yöntemler geliştikçe yayın yapma şartları daha zorlu hale geliyor. Bu gelişmeye paralel olarak uygun örneklem sayısının belirlenmesi ya da daha doğru bir ifadeyle tahminlenmesi de artık pek çok akademik çalışmada elzem hale geldi diyebiliriz. Bilimsel dergilerle beraber araştırmaların etik kurul başvuru formlarında ve tez öneri formlarında da artık standart bir şablonda “örneklem sayısının ne şekilde belirlendiği” nin açıklanması gerekmektedir. Fakat maalesef çoğunlukla bu konu layıkıyla anlaşılmadığı için araştırmacılar bu işlemi angarya olarak görmektedir. Oysaki yeterli sayıda örneklem seçilmesi, araştırmacının beklediği farkı veya ilişkiyi istatistiksel olarak anlamlı göstermesi için bir fırsattır. Yani bu işi hakemler, etik kurul veya fon sağlayıcılar için değil kendimiz için yapmalıyız. Bu farkındalığın araştırmacılar tarafından yeterince oluşmamış olmasının bir nedeni, konunun belirli eğitimlerle anlatılmaması, araştırmacıların bu konuyu zor olarak görmesi ve bu nedenle çalışma motivasyonlarının düşük olmasıdır.

Belki de bu konunun mantığını anlayan ve anlatan akademisyen sayısının azlığı nedeniyle “güç analizi” konusu lisans ve lisans üstü müfredatta yeterli ilgiyi görememektedir.

Güç analizine adını veren güç kavramına değinerek konuya derinleşelim. Sizce hangi çalışmalara “güçlü” deriz? Sonuçları tutarlı, güvenilir, genellenebilir olan çalışmalar güçlüdür gibi yanıtlar aklımıza gelebilir. Fakat buradaki güçten kasıt istatistiksel güç…İstatistiksel güç şu anlamlara gelmektedir:

  • Araştırılan evrende, araştırmacının bulmak istediği veya bulmayı umduğu “gerçek etkiyi” ortaya çıkarabilme ihtimalidir.
  • Gerçek etki, şansa bağlı olarak elde edilmeyen bir değerdir.
  • Güç, popülasyonda belirli bir etki büyüklüğü veya daha fazlası varken, örnekte mevcut olan bu etkiyi gözlemleme olasılığıdır.
  • Tip 2 hata yapmama olasılığı (1-β) > %80 olması iyidir.

Özet olarak aşağıdaki tablodaki gibi gerçek durum ile çalışmanın sonucu karşılaştırılmaktadır.

Tablo 1. İstatistiksel Kararlar ve Hata Türleri

GERÇEK DURUM
ETKİ / FARK YOK ETKİ / FARK VAR
ÇALIŞMA SONUCU ETKİ / FARK YOK

H0

Doğru karar Tip II hata (β)
ETKİ / FARK VAR

H1

Tip I hata (α) Testin gücü (1-β)

 

Tabloda yer alan α (alfa) değeri yani 1. Tip hata da meşhur p değeri ile karşılaştırdığımız değer olan çoğunlukla 0,05 olarak belirlenen değerdir. Buradan da yola çıkarak hem α hem de β değerlerinin birer koşullu olasılık olduklarını belirtelim. Lise matematiğinden bildiğimiz koşullu olasılığa geçmeden önce araştırmalarda kurulan iki hipotez türünden, etkinin/farkın olmadığı H0 yani yokluk ve etkinin/farkın bulunduğu ve araştırmacının savunduğu alternatif hipotez H1den bahsedelim.

Hipotezi olan her araştırmada yokluk hipotezi ve alternatif hipotez olmak üzere iki türlü hipotez kurulur. Bu hipotezler (non-inferiority, equivalence, superiority türleri dışında) genellikle aşağıdaki tablodaki gibi karşılıkları olacak şekilde (çift yönlü) kurulur.

Tablo 2. Yokluk ve alternatif hipotez örnekleri

H0= Grupların ölçümleri arasında fark yoktur. H1 = Grupların ölçümleri arasında fark vardır.
H0= Ölçümler arasında ilişki yoktur. H1 = Ölçümler arasında ilişki vardır.
H0= Tedavi ile hastalık sonucu arasında ilişki yoktur. H1 = Tedavi ile hastalık sonucu arasında ilişki vardır.

 

Tip 1 hata yani α değeri (H1 | H0) olarak ifade edilen, H0’ın doğru kabul edilmesi gereken durumda H1’in doğru olma olasılığıdır. β değeri ise bunun tam tersi, H1’in doğru kabul edilmesi gereken durumda H0’ın doğru olma olasılığıdır ( H0 | H1)Bu değerler çalışmanın başında belirlenir ve sabittir. Bu noktada karşımıza yeni bir soru daha çıkıyor: Neden 1. tip hatanın genellikle 0,05’i geçmesi istenmezken 2. tip hatanın limiti 0,20’ye kadar çıkabilmektedir? (Çünkü testin gücü en az %80 olmalıdır). Bu konuda fikir üretenlerin başında gelen bilim insanı Psikolog Jocob Cohen’in önermiş olduğu 4:1 beta/alfa oranı aslında şu anlama geliyor:

“Elde edilen sonuçlarla kişileri kandırmanın riski, var olan bir etkiyi ortaya çıkaramamaktan dört kat daha ciddidir.”

İşte bilim dünyasını ayakta tutan, bilime yön veren koşul ve iki oran! Okuduğumuz tüm nicel araştırmaların sonuçlarını etkileyen bir durum. Umarım bu konu sizi de en az benim kadar heyecanlandırıyordur 😊

Şekil 1. Güç analizinin bahsedilmeye başlandığı dönemlerde yayımlanan önemli bir eser

Bu iki hatayı aynı anda azaltmak istemek çok doğal fakat başarmak çok zordur. Çünkü:


Bilim ve istatistik dünyasında bu kadar fazla kullanılan fakat yanlış yorumlanan konulardan bir de p değeridir.

Bu konudaki bilginizi sınamak ister misiniz?

Daha fazla içerik

Cevap C seçeneğidir. Çünkü p değeri de tıpkı alfa gibi bir koşullu olasılıktır. Konu size oldukça karışık gelmiş olabilir. Zor kavranan bir durum ancak bu konuyu özümsememiz istatistik okuryazarlığımızı yükseltecektir. Özetle güç analizinin amacı  p değerini anlamlı bulabilmek için ihtiyaç duyduğumuz örneklem sayısını belirlemektir. Klinik/Pratik anlamlılıkla istatistiksel anlamlılığı paralel hale getirmektir. Pratik anlamlılığı, gerçek hayatta bir karşılığı olan, önemli bir sorunu çözme iddiası bulunan sonuç olarak görebiliriz. Gereğinden fazla örneklem sayısıyla çalışmamız nedeniyle klinik/pratik anlamlılığın olmasa da istatistiksel anlamlılık çıkabilir, gereğinden az örneklemde de klinik/pratik anlamlılık varken istatistikte bunu gösteremeyebiliriz. Bizim istediğimiz ideal olan durum, klinikte veya pratik hayatta anlamlı olduğunu düşündüğümüz sonucu istatistiksel olarak da anlamlı bulabilecek sayıda örneklem toplamaktır. Aslında bakarsanız p değerinin yalnız başına yorumlanmaması gerektiği de istatistiğin en temel konularından biri, alfabesidir. p değeriyle birlikte etki büyüklüğü, güven aralıkları, test istatistikleri de sunulmalı ve bu değerler birlikte yorumlanabilmelidir. Alfabesi buysa kelimesi, cümlesi nasıldır dediğinizi duyar gibiyim. 😊 Lütfen korkmayın, amacım sizi istatistikten soğutmak değil, sadece doğru bir başlangıç yapmanızı, farkındalık yaratmayı ve varsa yanlış bildiklerinizi düzeltmenizi sağlamak…

Tekrar dönelim güç analizi konusuna… Güç analizi her çalışmada uygulanmak zorunda mı? Aslında değil. Güç analizi, gücün söz konusu olduğu durumlarda yani elimizde bir hipotez varken kullanılmaktadır. Çünkü güçten bahsedebilmemiz için gerçek etkiyi ve hipotezimizin sonucunda elde ettiğimiz etkiyi karşılaştırmamız gerekmektedir. Yani ortada bir hipotezimiz olmalıdır. Tanımlayıcı araştırmalarda bir hipotez olmadığı için güç analizi terimini kullanmak yerine örneklem sayısı tahmini ifadesinden faydalanmaktayız.

Örneklem sayısı tahminlemesi İçin Hangi bilgilere ihtiyaç duymaktayız?

Örneklem sayısı tahmin yöntemleri araştırma türlerine, deneme tasarımına göre değişmektedir. Sizi detaylarla boğmamak adına temel olarak iki şekilde yapıldığını ifade edebilirim. Her iki yöntemde de hesaplama yapılabilmesi için öncelikle çalışmamızın primer çıktısını (primary outcome) belirlemiş olmanız gerekmektedir. Primer çıktı, çalışmanın en can alıcı, literatüre en çok katkı yapacağını düşündüğünüz, çalışmayı yapmadaki en çok heves ettiğiniz sorudur. Primer çıktınızı henüz belirlemediyseniz veya ne olduğunu bilmiyorsanız bu konuyu netleştirdikten sonra uygun örneklem sayısı belirleme aşamasına geçmelisiniz.

1. Tanımlayıcı araştırmalar için uygun örneklem sayısı belirleme:

Bu tür araştırmalar, sonunda herhangi bir çıkarıma sahip olmayan, sadece mevcut durumu tespit etmeye çalışan çalışmalardır. Bu yöntemde formüllerden ve hesaplayıcılardan faydalanıyoruz. Bu hesabın yapılabilmesi için çalışmanın primer çıktısına ait TAHMİNİ bir parametre değeri sunmalısınız. Örneğin çocuklarda idrar yolu enfeksiyonu geçirme prevalansını tahminlemeye çalışacaksanız, geçmiş çalışmalara bakarak tahmini bir oran (p) değeri belirlenmelidir. Eğer primer çıktınız örneğin bir ölçeğin ortalama değeri ise tahmini ortalama ve standart sapma değeri belirlemelisiniz. Bu değerlerle birlikte öngörülen parametreye ait (oran ise orana ait, ortalama ise ortalamaya ait) tahmini örnekleme hatası (margin of error yani d değeri) ile ilgili de yine bir tahmini değer belirlemelisiniz.

Tanımlayıcı (descriptive) çalışmalar için örneklem hesaplaması için önerdiğimiz başlıca web hesaplayıcıları:

http://homepage.stat.uiowa.edu/~rlenth/Power/oldversion.html—> Programı bilgisayarınıza yükledikten sonra zip klasörünü sağ tıklayıp birlikte aç diyerek JAVA seçilmesi gerekmektedir.

https://www.calculator.net/sample-size-calculator.html

2. Hipotezi olan çıkarımsal araştırmalar için güç analizi:

Güç analizi yapabilmek için literatür ve uzman bilgisine dayalı bazı bilgilere ihtiyaç duyulmaktadır. Bunlardan en önemlisi etki büyüklüğüdür (effect size). Etki büyüklüğünü hesaplama nedenimiz, çalışmanızda primer çıktınız için ortaya çıkarmak istediğiniz Minimum Klinik Önemli Fark/İlişkinin düzeyini belirlemek. Mesela iki grup arasındaki minimum fark kaç olursa siz bunu klinik olarak anlamlı görürsünüz? Gibi… Örneğin Sistolik Arter Basınç değeri için ilaç verilmeden önce hesaplanan 140 mm/Hg değeri, ilaç verildikten sonra kaça düşerse ilaç etkili diyebilirsiniz? 135 mi? 130 mu? Yoksa 120 mi? Bu örneğimizden yola çıkarak kendi çalışmanız için uyarlama yapabilirsiniz. Amacımız çalışmanızın ana hipotezi yani en önemli araştırma sorusundan yola çıkarak ortaya çıkarmaya çalıştığınız etkinin minimum değerini saptayarak 0,05 hata payı ve %80-90 güç ile çalışmaya dahil edilmesi gereken minimum örneklem sayısını tahminlemek. Minimum önemli farkı belirlemek için alana özgü rehberlerden (guideline) faydalanabilirsiniz.

Eğer bu farkı belirlemekte zorlanıyorsanız literatürdeki benzer çalışmalardan faydalanabilirsiniz. Çalışmanızdaki primer çıktınıza göre benzer bulunan sonucu işaretleyerek bir istatistik uzmanından yardım alabilir veya kendiniz hesaplama yapabilirsiniz. Yani en önemli bulgunuz ne olacaksa benzer çalışmada da o bulguyu işaretlemeniz gerekmektedir. Bunu seçerken ana hipoteziniz yani çalışma konusunda motivasyonunuzu oluşturan öncelikli soruya göre seçim yapmanız önerilir. Mesela gruplar arası farka ait ortalama ve standart sapma değerleri olabilir, ilişki katsayıları olabilir veya iki grubun oran değerleri olabilir. İki veya en fazla üç sonucu işaretleyebilirsiniz. Bu gibi durumlarda da her bulguya göre ayrı ayrı örneklem sayısı tahminlenir ve en yüksek sayıda elde edilen örneklem sayısı uygun olarak görülür.

Seçtiğiniz 1-2 veya 3 bulguyu, ücretsiz olarak indirebileceğiniz G*Power programına giriş yaptığınız takdirde sonuca ulaşabilirsiniz. En yüksek çıkan örneklem sayısına, öngörülen kayıp (drop-out) sayısı oranında ekleme yaparak çalışmaya başlanır.

Benzer yayınların metot kısmında yer alan (genelde iyi dergilerde bulunur) “sample size” bölümlerini inceleyerek power analizinin nasıl yazıldığı ve hangi bilgilerin sunulduğu hakkında fikir sahibi olursanız işiniz daha kolaylaşacaktır.

Aşağıdaki görselde örneklem sayısı tahmini için geliştirilen hesaplayıcılara ve programlara erişebilirsiniz.

GPower programını ücretsiz indirmek için: https://www.psychologie.hhu.de/arbeitsgruppen/allgemeine-psychologie-und-arbeitspsychologie/gpower.html

Şekil 2. Çevrim içi erişilen ücretsiz örneklem sayısı tahminleme yapan yazılım ve hesaplayıcılar*

Güç analizi hakkında daha detaylı bilgi almak için hazırladığım webineri izlemenizi öneririm. Sevgiyle kalın.

Charan, J., & Biswas, T. (2013). How to calculate sample size for different study designs in medical research? Indian journal of psychological medicine, 35(2), 121.

Cevap bırakın

E-posta hesabınız yayımlanmayacak.