B3 • Araştırma yaşam döngüsü · Metodoloji/İstatistik

B3 — Metodoloji ve İstatistik Planlama

Çalışma dizaynı, analiz planı, test seçimi ve kod üretimi için denetlenebilir AI kullanımı.

[O] Orta / [İ] İleriTez öğrencisi, klinik araştırmacı, akademisyen, istatistik danışmanıyla çalışan ekip

Modül B3 — Metodoloji ve İstatistik Planlama

Seviye: [O] Orta / [İ] İleri

Amaç: AI'ı çalışma dizaynı, analiz planı ve analiz kodu için bir akıl yürütme ortağı olarak kullanmak; ama metodolojik ve istatistiksel kararların nihai sorumluluğunu insanda (ve gerektiğinde istatistik danışmanında) tutmak.

Kavramsal çerçeve

İstatistik, AI'ın hem en yardımcı hem de en tehlikeli olduğu alandır. Yardımcıdır: dizayn seçeneklerini hızla karşılaştırır, analiz planını yapılandırır, kod yazar. Tehlikelidir: yanlış testi kendinden emin önerebilir, varsayımları atlayabilir, çalışan ama mantıken hatalı kod üretebilir. Kural: AI önerir, insan (gerekirse istatistikçi) doğrular. Üretilen hiçbir analiz planı veya kod, mantığı denetlenmeden uygulanmaz.

[O] Dizayn seçimi

AI, araştırma sorusu ve veri yapısına göre olası dizaynları (RCT, kohort, vaka-kontrol, kesitsel, meta-analiz) ve her birinin güçlü/zayıf yönlerini, bias profilini ve uygun raporlama yönergesini (CONSORT, STROBE, PRISMA) karşılaştırmak için iyidir. Seçim sizindir.

[O] Analiz planı ve test seçimi

AI, değişken tiplerine (sürekli/kategorik, eşleştirilmiş/bağımsız, normal/normal değil) göre aday testleri ve varsayımlarını listeleyebilir. Ancak varsayım ihlallerini ve gerçek veri dağılımını insan kontrol eder. Önceden kayıtlı analiz planı (pre-registration) iyi pratiktir ve HARKing/p-hacking riskini düşürür.

[İ] Örneklem büyüklüğü

AI güç analizi (power analysis) mantığını ve formül seçimini açıklayabilir, hatta hesaplama kodu üretebilir. Ancak girdi varsayımları (beklenen etki büyüklüğü, alfa, güç, kayıp oranı) klinik gerekçeyle insan tarafından belirlenir ve sonuç bağımsız doğrulanır.

[İ] Kod üretimi

R/Python kodu üretmek için güçlüdür, ancak: çalışan kod ≠ doğru analiz. Kodun her adımı (veri temizleme mantığı, dışlanan gözlemler, test çağrısı, varsayım kontrolleri) okunur ve anlaşılır. Anlamadığınız kodu çalıştırmayın.

Prompt desenleri

Dizayn karşılaştırması:

[ROL]: CONSORT, STROBE ve PRISMA yönergelerine hâkim bir araştırma metodoloğusun.
[BAĞLAM]: Araştırma sorum: [PICO]. Eldeki veri/imkân: [retrospektif kayıt /
prospektif toplama / vb.].
[GÖREV]: Bu soruya uygun 2-3 çalışma dizaynını karşılaştır: her biri için
güçlü yön, zayıf yön, başlıca bias türü ve uygun raporlama yönergesi.
[FORMAT]: Karşılaştırma tablosu + tek paragraf öneri (gerekçeli).
[DOĞRULAMA KANCASI]: Kesin "en iyisi budur" deme; ödünleşmeleri sun, kararı bana bırak.

Analiz planı taslağı:

[BAĞLAM]: Bağımlı değişken: [tip]. Bağımsız değişken(ler): [tip]. Tasarım:
[eşleştirilmiş/bağımsız]. Örneklem: [n].
[GÖREV]: Birincil ve ikincil analizler için aday istatistiksel testleri listele;
her testin varsayımlarını ve varsayım ihlalinde alternatifini belirt.
[KISITLAR]: Test seçimini bana dayatma; varsayımları ben veride kontrol edeceğim.
[DOĞRULAMA KANCASI]: Varsayım kontrolü gereken her noktayı açıkça işaretle.

Kod üretimi (denetlenebilir):

[GÖREV]: Aşağıdaki analiz için R kodu yaz: [analiz tanımı]. Her satırı
yorumla; varsayım kontrolü ve eksik veri ele alma adımlarını dâhil et.
[KISITLAR]: Veri uydurma; örnek veri kullanacaksan açıkça "örnek" olduğunu belirt.
[DOĞRULAMA KANCASI]: Kodun hangi varsayımlara dayandığını ve hangi durumlarda
yanıltıcı sonuç vereceğini ayrı bir notta açıkla.

Kötü → İyi karşılaştırması

Kötü: "Verim için hangi testi kullanayım?" deyip gelen tek testi uygulamak.

→ Varsayımlar kontrol edilmez; yanlış test sessizce uygulanır.

İyi: Değişken tiplerini ve tasarımı tanımlayıp aday testleri varsayımlarıyla listeletmek, sonra varsayımları gerçek veride kontrol edip testi seçmek.

→ Karar veriye ve insana dayanır; model yalnızca seçenek haritası sunar.

Yaygın hata kalıpları (failure modes)

Tek test dayatması. Modelin önerdiği ilk testi sorgusuz uygulamak. Çözüm: varsayım kontrolü.
Çalışan kod = doğru kod yanılgısı. Hatasız çalışan kodun doğru analiz yaptığını sanmak. Çözüm: satır satır okuma.
Güç analizi varsayımlarını modele bırakma. Etki büyüklüğünü modelin uydurması. Çözüm: klinik gerekçeli insan girdisi.
Post-hoc plan. Analizi gördükten sonra hipotez kurmak (HARKing). Çözüm: önceden kayıtlı plan.

Uygulamalı egzersiz

Devam eden bir çalışmanızın birincil sorusu için analiz planı şablonunu çalıştırın. Modelin önerdiği her testin varsayımlarını not edin. Şimdi kendinize sorun: bu varsayımları verinizde kontrol ettiniz mi? Etmediyseniz, planınız henüz tamam değildir.

Doğrulama kontrol listesi

Dizayn seçimini ödünleşmeleri görerek ben yaptım.
Test varsayımlarını gerçek veride kontrol ettim.
Örneklem büyüklüğü girdilerini klinik gerekçeyle belirledim.
Ürettiğim kodun her adımını okudum ve anladım.
Analiz planı veri görülmeden (ideal: önceden kayıtlı) belirlendi.
Gerekliyse istatistik danışmanına başvurdum.

Anahtar çıkarımlar

İstatistik, AI'ın hem en faydalı hem en riskli alanıdır: önerir, insan doğrular.
Çalışan kod doğru analiz demek değildir; her satır okunur.
Test seçimi varsayım kontrolüne, örneklem girdileri klinik gerekçeye dayanır.
Önceden kayıtlı analiz planı p-hacking/HARKing riskini düşürür.