Skip to content

buketyuce/Diyabet_Feature_Engineering

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 

Repository files navigation

İş Problemi

Özellikleri belirtildiğinde kişilerin diyabet hastası olup olmadıklarını tahmin edebilecek bir makine öğrenmesi modeli geliştirilmesi istenmektedir.

Modeli geliştirmeden önce gerekli olan veri analizi ve özellik mühendisliği adımlarını gerçekleştirmemiz gerekmekte.

Veri Seti Hikayesi

Veri seti ABD'deki Ulusal Diyabet-Sindirim-Böbrek Hastalıkları Enstitüleri'nde tutulan büyük veri setinin parçasıdır.

ABD'deki Arizona Eyaleti'nin en büyük 5. şehri olan Phoenix şehrinde yaşayan 21 yaş ve üzerinde olan Pima Indian kadınları üzerinde yapılan diyabet araştırması için kullanılan verilerdir.

Hedef değişken "outcome" olarak belirtilmiş olup; 1 diyabet test sonucunun pozitif oluşunu, 0 ise negatif oluşunu belirtmektedir.

Değişkenler

Pregnancies: Hamilelik sayısı

Glucose: Oral glikoz tolerans testinde 2 saatlik plazma glikoz konsantrasyonu

Blood Pressure: Kan Basıncı (Küçük tansiyon) (mm Hg)

SkinThickness: Cilt Kalınlığı

Insulin: 2 saatlik serum insülini (mu U/ml)

DiabetesPedigreeFunction: Soydaki kişilere göre diyabet olma ihtimalini hesaplayan bir fonksiyon

BMI: Vücut kitle endeksi

Age: Yaş (yıl)

Outcome: Hastalığa sahip (1) ya da değil (0)

Gerekli importları yapıp veriyi okutalım.

Keşifçi Veri Analizi

Ekran görüntüsü 2022-06-22 165838

Ekran görüntüsü 2022-06-22 165911

Ekran görüntüsü 2022-06-22 165931

Ekran görüntüsü 2022-06-22 165952

Ekran görüntüsü 2022-06-22 170010

Numerik ve kategorik değişkenleri yakaladım.

Ekran görüntüsü 2022-06-22 170159

Numerik ve kategorik değişkenlerin analizini yaptım.

Ekran görüntüsü 2022-06-22 170159 Ekran görüntüsü 2022-06-22 170422 Ekran görüntüsü 2022-06-22 170438 Ekran görüntüsü 2022-06-22 170451 Ekran görüntüsü 2022-06-22 170504 Ekran görüntüsü 2022-06-22 170518 Ekran görüntüsü 2022-06-22 170533 Ekran görüntüsü 2022-06-22 170549 Ekran görüntüsü 2022-06-22 170603

Ekran görüntüsü 2022-06-22 170728

Ekran görüntüsü 2022-06-22 170758

Hedef değişken analizi yaptım.

Ekran görüntüsü 2022-06-22 171000 Ekran görüntüsü 2022-06-22 171018

Korelasyon analizi yaptım.

Ekran görüntüsü 2022-06-22 171110

BASE MODEL KURULUMU

Ekran görüntüsü 2022-06-22 171159

Ekran görüntüsü 2022-06-22 171306

Eksik değer analizi

Aykırı gözlem analizi

ÖZELLİK ÇIKARIMI

Yaş değişkenini katagorilere ayırıp yeni yaş değişkeni oluşturulması

BMI 18,5 asağısı underweight, 10.5 ile 24.9 arası normal, 24.9 ile 29.9 arası Overweight ve 30 üstü obese

Glukoz değerlerini kategorik değişkene çevirme

İnsülin değeri ile kategorik değişken türetme

Ekran görüntüsü 2022-06-23 153323

ENCODING

Ekran görüntüsü 2022-06-23 153547

Ekran görüntüsü 2022-06-23 153607

STANDARTLAŞTIRMA

Ekran görüntüsü 2022-06-23 153730

Ekran görüntüsü 2022-06-23 153746

MODELLEME

Ekran görüntüsü 2022-06-23 153902

FEATURE İMPORTANCE

Ekran görüntüsü 2022-06-23 153957

Ekran görüntüsü 2022-06-23 154021

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages