İki Kategorik Değişken Arasındaki İlişki
Merhaba 10. Sınıf Matematik öğrencileri! Bu dersimizde, iki kategorik değişken arasındaki ilişkiyi inceleyeceğiz. Kategorik değişkenler, verileri belirli gruplara veya kategorilere ayıran değişkenlerdir. Örneğin, cinsiyet (erkek/kadın), medeni durum (bekar/evli/boşanmış), tercih edilen renk (kırmızı/mavi/yeşil) gibi. Bu değişkenler arasındaki ilişkiyi anlamak, veri analizinde önemli bir adımdır.
Kavramlar ve Yöntemler
İki kategorik değişken arasındaki ilişkiyi incelemek için genellikle çapraz tablolar (contingency tables) kullanılır. Bu tablolar, değişkenlerin kategorilerini satır ve sütunlara yerleştirerek gözlemlenen frekansları gösterir.
Çapraz Tabloların Yapısı
Bir \(2 \times 2\) çapraz tablo örneği şu şekildedir:
| Değişken 2 - Kategori A | Değişken 2 - Kategori B | Toplam | |
|---|---|---|---|
| Değişken 1 - Kategori X | \(n_{11}\) | \(n_{12}\) | \(n_{1.}\) |
| Değişken 1 - Kategori Y | \(n_{21}\) | \(n_{22}\) | \(n_{2.}\) |
| Toplam | \(n_{.1}\) | \(n_{.2}\) | \(N\) |
Burada:
- \(n_{ij}\) ilgili hücredeki gözlemlenen frekansı temsil eder.
- \(n_{i.}\) satır toplamlarını, \(n_{.j}\) sütun toplamlarını ve \(N\) ise toplam gözlem sayısını ifade eder.
Bağımsızlık Testi (Ki-Kare Testi)
İki kategorik değişkenin birbirinden bağımsız olup olmadığını test etmek için Ki-Kare (\(\chi^2\)) bağımsızlık testi kullanılır. Bu test, gözlemlenen frekanslar ile değişkenler bağımsız olduğunda beklenen frekanslar arasındaki farkı inceler.
Temel Fikir: Eğer iki değişken arasında bir ilişki yoksa (bağımsızlarsa), bir değişkenin belirli bir kategoriye sahip olmasının, diğer değişkenin hangi kategoriye sahip olacağını etkilememesi gerekir. Ki-Kare testi, bu beklentiden sapmaları ölçer.
Beklenen Frekansların Hesaplanması
Bağımsızlık varsayımı altında beklenen frekans (\(E_{ij}\)) şu formülle hesaplanır:
$ \( E_{ij} = \frac{(\text{Satır Toplam}_i) \ imes (\text{Sütun Toplam}_j)}{N} = \frac{n_{i.} \ imes n_{.j}}{N} \) \(Ki-Kare Test İstatistiği
Ki-Kare test istatistiği (\) \(\chi\) ^2 \() şu şekilde hesaplanır:
\) \( \chi^2 = \sum_{i} \sum_{j} \frac{(O_{ij} - E_{ij})^2}{E_{ij}} \) \(Burada \) O_{ij} \( gözlemlenen frekans, \) E_{ij} \( ise beklenen frekanstır.
Yorumlama: Hesaplanan \) \(\chi\) ^2 \( değeri, belirli bir anlamlılık düzeyinde (\) α \() Ki-Kare dağılım tablosundaki kritik değer ile karşılaştırılır. Eğer hesaplanan \) \(\chi\) ^2 \( değeri kritik değerden büyükse, değişkenler arasında istatistiksel olarak anlamlı bir ilişki olduğu sonucuna varılır.
İlişkinin Gücü ve Yönü
Ki-Kare testi sadece ilişkinin varlığını gösterir, gücünü veya yönünü belirtmez. İlişkinin gücünü ölçmek için Cramér'in V katsayısı gibi ölçütler kullanılabilir.
💡 Önemli Not: Ki-Kare testi, kategorik değişkenler arasındaki ilişkiyi anlamak için güçlü bir araçtır ancak verilerin yeterli sayıda gözlem içermesi ve beklenen frekansların belirli bir eşiğin altında olmaması gibi varsayımları vardır.
✍️ Çözümlü Örnek Sorular
Soru 1
Bir okulda yapılan anket sonucunda, öğrencilerin tercih ettikleri spor dalı ile cinsiyetleri arasındaki ilişki incelenmiştir. Sonuçlar aşağıdaki çapraz tabloda verilmiştir:
| Futbol | Basketbol | Toplam | |
|---|---|---|---|
| Erkek | \) 80 \( | \) 40 \( | \) 120 \( |
| Kız | \) 20 \( | \) 60 \( | \) 80 \( |
| Toplam | \) 100 \( | \) 100 \( | \) 200 \( |
Öğrencilerin tercih ettikleri spor dalı ile cinsiyetleri arasında istatistiksel olarak anlamlı bir ilişki olup olmadığını \) α \(= 0\).05 \( anlamlılık düzeyinde Ki-Kare testi ile inceleyiniz.
Çözüm 1
- Beklenen Frekansları Hesaplama:
- Erkek ve Futbol: \) E_{EF} \(= \frac{120 \ imes 100}{200} = 60\) \(
- Erkek ve Basketbol: \) E_{EB} \(= \frac{120 \ imes 100}{200} = 60\) \(
- Kız ve Futbol: \) E_{KF} \(= \frac{80 \ imes 100}{200} = 40\) \(
- Kız ve Basketbol: \) E_{KB} \(= \frac{80 \ imes 100}{200} = 40\) \(
- Ki-Kare Test İstatistiğini Hesaplama:
- \) \(\chi\) ^ \(2 = \frac{(80-60)^2}{60} + \frac{(40-60)^2}{60} + \frac{(20-40)^2}{40} + \frac{(60-40)^2}{40}\) \(
- \) \(\chi\) ^ \(2 = \frac{400}{60} + \frac{400}{60} + \frac{400}{40} + \frac{400}{40}\) \(
- \) \(\chi\) ^ \(2 = 6\).67 + 6. \(67 + 10 + 10 = 33\).34 \(
- Karar Verme:
- Serbestlik derecesi \) (r-1)(k-1) \(=\) (2-1)(2-1) \(= 1\) \( dir.
- \) α \(= 0\).05 \( anlamlılık düzeyinde kritik \) \(\chi\) ^2 \( değeri yaklaşık \) 3.84 \('tür.
- Hesaplanan \) \(\chi\) ^2 \( (\) 33.34 \() > Kritik \) \(\chi\) ^2 \( (\) 3.84 \() olduğundan, cinsiyet ile tercih edilen spor dalı arasında istatistiksel olarak anlamlı bir ilişki vardır. ✅
Soru 2
Bir şirkette çalışanların eğitim durumu ile iş tatmin düzeyleri arasındaki ilişki incelenmiştir. Aşağıdaki tablo gözlemlenen frekansları göstermektedir:
| Yüksek Tatmin | Düşük Tatmin | Toplam | |
|---|---|---|---|
| Lise Mezunu | \) 50 \( | \) 30 \( | \) 80 \( |
| Üniversite Mezunu | \) 70 \( | \) 50 \( | \) 120 \( |
| Toplam | \) 120 \( | \) 80 \( | \) 200 \( |
Eğitim durumu ile iş tatmini arasında bir ilişki olup olmadığını \) α \(= 0\).05 \( anlamlılık düzeyinde test ediniz.
Çözüm 2
- Beklenen Frekansları Hesaplama:
- Lise & Yüksek Tatmin: \) E_{LY} \(= \frac{80 \ imes 120}{200} = 48\) \(
- Lise & Düşük Tatmin: \) E_{LD} \(= \frac{80 \ imes 80}{200} = 32\) \(
- Üniversite & Yüksek Tatmin: \) E_{UY} \(= \frac{120 \ imes 120}{200} = 72\) \(
- Üniversite & Düşük Tatmin: \) E_{UD} \(= \frac{120 \ imes 80}{200} = 48\) \(
- Ki-Kare Test İstatistiğini Hesaplama:
- \) \(\chi\) ^ \(2 = \frac{(50-48)^2}{48} + \frac{(30-32)^2}{32} + \frac{(70-72)^2}{72} + \frac{(50-48)^2}{48}\) \(
- \) \(\chi\) ^ \(2 = \frac{4}{48} + \frac{4}{32} + \frac{4}{72} + \frac{4}{48}\) \(
- \) \(\chi\) ^ \(2 = 0\).083 + 0.125 + 0.056 + 0. \(083 \approx 0\).347 \(
- Karar Verme:
- Serbestlik derecesi \) (2-1)(2-1) \(= 1\) \( dir.
- \) α \(= 0\).05 \( anlamlılık düzeyinde kritik \) \(\chi\) ^2 \( değeri \) 3.84 \('tür.
- Hesaplanan \) \(\chi\) ^2 \( (\) 0.347 \() < Kritik \) \(\chi\) ^2 \( (\) 3.84$) olduğundan, eğitim durumu ile iş tatmini arasında istatistiksel olarak anlamlı bir ilişki yoktur. 📌
🚀 Başarılar dilerim!
Bir sınıftaki öğrencilerin cinsiyetlerine göre en sevdikleri spor dalları aşağıdaki tabloda verilmiştir:
\[\(\begin{array}{|c|c|c|c|}\) & \(\text{Futbol}\) & \(\text{Basketbol}\) & \(\text{Toplam}\) \\(\text{Kız}\) & 15 & 25 & 40 \\(\text{Erkek}\) & 35 & 25 & 60 \\(\text{Toplam}\) & 50 & 50 & 100 \\(\end{array}\) \]
Bu sınıftan rastgele seçilen bir öğrencinin basketbol seven bir kız öğrenci olma olasılığı (göreli frekansı) kaçtır?
B) \( 0,25 \)
C) \( 0,40 \)
D) \( 0,50 \)
E) \( 0,60 \)
Bir grubun okuma alışkanlıkları üzerine yapılan araştırmada elde edilen veriler aşağıdaki tabloda gösterilmiştir:
\[\(\begin{array}{|c|c|c|c|}\) & \(\text{Kitap}\) & \(\text{Dergi}\) & \(\text{Toplam}\) \\(\text{Genç}\) & 40 & 10 & 50 \\(\text{Yetişkin}\) & 20 & 30 & 50 \\(\text{Toplam}\) & 60 & 40 & 100 \\(\end{array}\) \]
Dergi okuyanlar arasından rastgele seçilen bir kişinin genç olma olasılığı (koşullu göreli frekansı) kaçtır?
B) \( \frac{1}{3} \)
C) \( \frac{1}{4} \)
D) \( \frac{1}{5} \)
E) \( \frac{2}{5} \)
İki farklı şehirden seyahat eden yolcuların tercih ettikleri ulaşım araçlarına dair bazı verilerin eksik bırakıldığı tablo aşağıdadır:
\[\(\begin{array}{|c|c|c|c|}\) & \(\text{Otobüs}\) & \(\text{Tren}\) & \(\text{Toplam}\) \\(\text{A Şehri}\) & x & 20 & 50 \\(\text{B Şehri}\) & 40 & y & 60 \\(\text{Toplam}\) & z & 40 & 110 \\(\end{array}\) \]
Buna göre, \( x + y + z \) işleminin sonucu kaçtır?
B) \( 110 \)
C) \( 120 \)
D) \( 130 \)
E) \( 140 \)
Bir lisedeki öğrencilerin cinsiyetlerine göre tercih ettikleri spor dalları aşağıdaki tabloda verilmiştir:
\[\(\begin{array}{|c|c|c|c|}\) & \(\text{Basketbol}\) & \(\text{Voleybol}\) & \(\text{Toplam}\) \\(\text{Kız}\) & 40 & 60 & 100 \\(\text{Erkek}\) & 70 & 30 & 100 \\(\text{Toplam}\) & 110 & 90 & 200 \\(\end{array}\) \]
Bu okuldan rastgele seçilen bir öğrencinin kız olduğu bilindiğine göre, bu öğrencinin voleybolu tercih etme olasılığı kaçtır?
B) \( \frac{3}{5} \)
C) \( \frac{2}{3} \)
D) \( \frac{4}{5} \)
E) \( \frac{9}{20} \)
Bir şirkette çalışanların departmanları ve işe ulaşım tercihleri aşağıdaki tabloda verilmiştir:
\[\(\begin{array}{|c|c|c|c|}\) & \(\text{Servis}\) & \(\text{Özel Araç}\) & \(\text{Toplam}\) \\(\text{Satış}\) & 15 & 10 & 25 \\(\text{Üretim}\) & 45 & 30 & 75 \\(\text{Toplam}\) & 60 & 40 & 100 \\(\end{array}\) \]
Buna göre, üretim departmanında çalışanlar arasında servis kullananların koşullu göreli sıklığı kaçtır?
B) \( 0,30 \)
C) \( 0,45 \)
D) \( 0,60 \)
E) \( 0,75 \)
Bir sınıftaki öğrencilerin cinsiyetlerine göre gözlük kullanma durumları aşağıdaki tabloda eksik olarak verilmiştir:
\[\(\begin{array}{|c|c|c|c|}\) & \(\text{Gözlüklü}\) & \(\text{Gözlüksüz}\) & \(\text{Toplam}\) \\(\text{Erkek}\) & 8 & A & 20 \\(\text{Kız}\) & B & 12 & 18 \\(\text{Toplam}\) & 14 & 24 & 38 \\(\end{array}\) \]
Tablodaki verilere göre, gözlük kullanmayan erkek öğrenci sayısının (\( A \)), gözlüklü kız öğrenci sayısına (\( B \)) oranı kaçtır?
\[\(\frac{A}{B}\) \]
B) \( 2 \)
C) \( 3 \)
D) \( 4 \)
E) \( 5 \)
Bir sınıftaki öğrencilerin cinsiyetlerine göre en sevdikleri spor dalları aşağıdaki tabloda verilmiştir:
\[\(\begin{array}{|c|c|c|}\) & \(\text{Futbol}\) & \(\text{Basketbol}\) \\(\text{Erkek}\) & 15 & 10 \\(\text{Kız}\) & 5 & 20 \\(\end{array}\) \]
Bu verilere göre, sınıftan rastgele seçilen bir öğrencinin "Kız" ve "Basketbol seven" biri olma (birleşik göreli frekans) değeri kaçtır?
B) \( 0,20 \)
C) \( 0,30 \)
D) \( 0,40 \)
E) \( 0,50 \)
Bir kütüphanedeki okuyucuların yaş grupları ve tercih ettikleri yayın türleri aşağıdaki tabloda gösterilmiştir:
\[\(\begin{array}{|c|c|c|c|}\) & \(\text{Kitap}\) & \(\text{Dergi}\) & \(\text{Toplam}\) \\(\text{Genç}\) & 30 & 20 & 50 \\(\text{Yetişkin}\) & 40 & 10 & 50 \\(\text{Toplam}\) & 70 & 30 & 100 \\(\end{array}\) \]
Buna göre, okuyucular arasından rastgele seçilen birinin "Kitap" okumayı tercih etme marjinal göreli frekansı kaçtır?
B) \( 0,40 \)
C) \( 0,50 \)
D) \( 0,70 \)
E) \( 0,80 \)
Bir müzik okulundaki öğrencilerin çaldıkları enstrüman ve sevdikleri müzik türü ilişkisi tabloda verilmiştir:
\[\(\begin{array}{|c|c|c|}\) & \(\text{Pop}\) & \(\text{Rock}\) \\(\text{Gitar}\) & 12 & 18 \\(\text{Piyano}\) & 16 & 4 \\(\end{array}\) \]
Gitar çaldığı bilinen bir öğrencinin Rock müzik sevme koşullu göreli frekansı kaçtır?
B) \( 0,40 \)
C) \( 0,60 \)
D) \( 0,75 \)
E) \( 0,80 \)
Bir sınıftaki öğrencilerin cinsiyetlerine göre en sevdikleri spor dalı aşağıdaki tabloda verilmiştir:
\[\(\begin{array}{|c|c|c|c|}\) & \(\text{Futbol}\) & \(\text{Basketbol}\) & \(\text{Toplam}\) \\(\text{Erkek}\) & 12 & 8 & 20 \\(\text{Kız}\) & 8 & 12 & 20 \\(\text{Toplam}\) & 20 & 20 & 40 \\(\end{array}\) \]
Buna göre, futbolu seven öğrenciler arasından seçilen birinin erkek olma koşullu sıklığı kaçtır?
B) \( 0,4 \)
C) \( 0,5 \)
D) \( 0,6 \)
E) \( 0,8 \)
Bir gruptaki 100 kişiye içecek tercihleri ve bu içeceği günün hangi vaktinde tükettikleri sorulmuştur. Elde edilen veriler aşağıdaki tabloda gösterilmiştir:
\[\(\begin{array}{|c|c|c|c|}\) & \(\text{Çay}\) & \(\text{Kahve}\) & \(\text{Toplam}\) \\(\text{Sabah}\) & 30 & 20 & 50 \\(\text{Akşam}\) & 10 & 40 & 50 \\(\text{Toplam}\) & 40 & 60 & 100 \\(\end{array}\) \]
Buna göre, bu gruptaki kişilerin kahve tercih etme marjinal sıklığı kaçtır?
B) \( 0,4 \)
C) \( 0,5 \)
D) \( 0,6 \)
E) \( 0,8 \)
Bir kütüphanede yapılan araştırmada, 100 kişinin yaş grupları ve düzenli kitap okuma alışkanlıkları incelenerek aşağıdaki tablo oluşturulmuştur:
\[\(\begin{array}{|c|c|c|c|}\) & \(\text{Okuyor}\) & \(\text{Okumuyor}\) & \(\text{Toplam}\) \\(\text{Genç}\) & 45 & 5 & 50 \\(\text{Yetişkin}\) & 35 & 15 & 50 \\(\text{Toplam}\) & 80 & 20 & 100 \\(\end{array}\) \]
Buna göre, seçilen bir kişinin hem yetişkin olması hem de kitap okumaması olayının birleşik göreli sıklığı (joint relative frequency) kaçtır?
B) \( 0,15 \)
C) \( 0,20 \)
D) \( 0,35 \)
E) \( 0,50 \)
Bir sınıftaki öğrencilerin cinsiyetlerine ve en sevdikleri spor dalına göre dağılımı aşağıdaki tabloda verilmiştir:
\[\(\begin{array}{|c|c|c|c|}\) & \(\text{Futbol}\) & \(\text{Basketbol}\) & \(\text{Toplam}\) \\(\text{Kız}\) & 8 & 12 & 20 \\(\text{Erkek}\) & 18 & 12 & 30 \\(\text{Toplam}\) & 26 & 24 & 50 \\(\end{array}\) \]
Buna göre, basketbolu sevenler içindeki kız öğrencilerin oranı yüzde kaçtır?
B) 24
C) 40
D) 50
E) 60
Bir gruptaki kişilerin yaş grupları ve teknoloji kullanım alışkanlıkları incelenmiş ve aşağıdaki veriler elde edilmiştir:
\[\(\begin{array}{|c|c|c|c|}\) & \(\text{Aktif Kullanıcı}\) & \(\text{Pasif Kullanıcı}\) & \(\text{Toplam}\) \\(\text{Genç}\) & 45 & 5 & 50 \\(\text{Yetişkin}\) & 20 & 30 & 50 \\(\text{Toplam}\) & 65 & 35 & 100 \\(\end{array}\) \]
Bu gruptan rastgele seçilen bir kişinin "yetişkin ve aktif kullanıcı" olma olasılığı (göreceli sıklığı) kaçtır?
B) \( 0,30 \)
C) \( 0,45 \)
D) \( 0,50 \)
E) \( 0,65 \)
Bir okulda öğrencilerin yabancı dil tercihleri ile okudukları bölümler arasındaki ilişkiyi gösteren tablo aşağıdadır:
\[\(\begin{array}{|c|c|c|c|}\) & \(\text{Almanca}\) & \(\text{Fransızca}\) & \(\text{Toplam}\) \\(\text{Sayısal}\) & 30 & 10 & 40 \\(\text{Sözel}\) & 15 & 45 & 60 \\(\text{Toplam}\) & 45 & 55 & 100 \\(\end{array}\) \]
Sözel bölümdeki öğrencilerin yüzde kaçı Fransızca dersini tercih etmiştir?
B) 45
C) 60
D) 75
E) 80
Bir sınıftaki öğrencilerin cinsiyetlerine göre tercih ettikleri spor dalları aşağıdaki tabloda verilmiştir:
\[\(\begin{array}{|c|c|c|c|}\) & \(\text{Futbol}\) & \(\text{Voleybol}\) & \(\text{Toplam}\) \\(\text{Erkek}\) & 15 & 10 & 25 \\(\text{Kız}\) & 5 & 20 & 25 \\(\text{Toplam}\) & 20 & 30 & 50 \\(\end{array}\) \]
Bu sınıftan rastgele seçilen bir öğrencinin voleybol tercih eden bir kız öğrenci olma olasılığı (göreli frekansı) kaçtır?
B) \( 0,30 \)
C) \( 0,40 \)
D) \( 0,50 \)
E) \( 0,60 \)
Bir kütüphanedeki okuyucuların yaş grupları ve tercih ettikleri kitap türleri arasındaki ilişkiyi gösteren çapraz tablo aşağıdadır:
\[\(\begin{array}{|c|c|c|c|}\) & \(\text{Roman}\) & \(\text{Bilimsel}\) & \(\text{Toplam}\) \\(\text{Genç}\) & 30 & 10 & 40 \\(\text{Yetişkin}\) & 20 & 40 & 60 \\(\text{Toplam}\) & 50 & 50 & 100 \\(\end{array}\) \]
Kütüphaneden seçilen bir kişinin yetişkin olduğu bilindiğine göre, bu kişinin bilimsel kitap tercih etme koşullu göreli frekansı kaçtır?
B) \( \frac{1}{2} \)
C) \( \frac{2}{3} \)
D) \( \frac{3}{4} \)
E) \( \frac{4}{5} \)
İki farklı mahalledeki sakinlerin ulaşım tercihleri üzerine yapılan bir araştırmanın sonuçları aşağıdaki tabloda verilmiştir:
\[\(\begin{array}{|c|c|c|c|}\) & \(\text{Otobüs}\) & \(\text{Metro}\) & \(\text{Toplam}\) \\(\text{A Mahallesi}\) & 45 & 55 & 100 \\(\text{B Mahallesi}\) & 75 & 25 & 100 \\(\text{Toplam}\) & 120 & 80 & 200 \\(\end{array}\) \]
Buna göre, tüm katılımcılar içinde metro kullananların marjinal göreli frekansı yüzde kaçtır?
B) \( 30 \)
C) \( 40 \)
D) \( 50 \)
E) \( 60 \)
Cevap Anahtarı ve Detaylı Çözümler İçin QR Kodu Okutun
https://yazili.eokultv.com/test/4974-10-sinif-iki-kategorik-degisken-iliskisi-test-coz-l3pa