-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathders6-TR.qmd
112 lines (73 loc) · 5.33 KB
/
ders6-TR.qmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
---
title: "Regresyon Yöntemleri"
subtitle: "FEF3001 Yapay Zekaya Giriş - Ders 6"
author: "Alper Yılmaz"
date: 2024-07-25
format:
revealjs:
chalkboard: true
css: custom.css
smaller: true
scrollable: true
controls: true
touch: true
history: false
progress: true
slide-number: c/t
typora-copy-images-to: images
---
## İçerik
* Regresyonun tanımı
* Regresyon türleri (doğrusal, polinom ve topluluk yöntemleri)
* Doğrusal Regresyon: Basit Doğrusal Regresyon, En Küçük Kareler yöntemi, Model performansının değerlendirilmesi (R-kare, RMSE)
* Polinom Regresyon: Ne zaman polinom regresyon kullanılır, aşırı uyum
* Rastgele Orman ile Regresyon: Regresyon için Rastgele Orman algoritması, Avantajları (doğrusal olmayan ilişkileri ele alma, özellik önemi)
* Diğer regresyon türleri: Lojistik regresyon (ikili sonuçlar için), Ridge ve Lasso regresyonu (düzenlileştirme teknikleri)
* Excel'de örnekler
* R ve Python'da kod örnekleri
## Regresyon
Regresyon, bir bağımlı değişken (genellikle hedef veya sonuç değişkeni olarak adlandırılır) ile bir veya daha fazla bağımsız değişken (ayrıca tahmin edici veya özellik olarak da bilinir) arasındaki ilişkiyi modellemek ve analiz etmek için veri analizinde ve makine öğrenmesinde kullanılan istatistiksel bir yöntemdir. Regresyonun temel amacı, bağımsız değişkenlerdeki değişikliklerin bağımlı değişkendeki değişikliklerle nasıl ilişkili olduğunu tahmin etmek ve çıkarım yapmaktır.
Regresyon hakkında önemli noktalar:
1. Değişkenler arasındaki ilişkileri tanımlamaya ve ölçmeye yardımcı olur.
2. Hem tahmin hem de değişkenlerin etkisini anlamak için kullanılabilir.
3. Doğrusal, polinom ve Rastgele Orman veya regresyon için Sinir Ağları gibi daha karmaşık yöntemler dahil olmak üzere çeşitli regresyon türleri vardır.
4. Regresyon modelleri hem sürekli hem de kategorik değişkenleri ele alabilir.
5. Bilim, ekonomi ve sosyal bilimler dahil olmak üzere birçok alanda yaygın olarak kullanılır.
## Doğrusal (Lineer) Regresyon
![](images/linear-regression-summary-TR.png)
## Doğrusal Regresyon
![](images/linear-regression-point-detail-TR.png)
## Doğrusal Regresyon
En iyi doğruyu bulmayı deneyin: [https://www.geogebra.org/m/xC6zq7Zv](https://www.geogebra.org/m/xC6zq7Zv)
## En Küçük Kareler (OLS) Yöntemi
En Küçük Kareler (Ordinary Least Squares - OLS), doğrusal bir regresyon modelinin parametrelerini tahmin etmek için kullanılan istatistiksel bir yöntemdir. Doğrusal regresyonda bir veri kümesine doğru yerleştirmek için en yaygın kullanılan tekniktir.
OLS, gözlemlenen bağımlı değişken değerleri ile bağımsız değişken(ler)in doğrusal fonksiyonu tarafından tahmin edilen değerler arasındaki farkların karelerinin toplamını en aza indiren bir yöntemdir. Başka bir deyişle, kare artıkların toplamını en aza indirerek verilere en iyi uyan çizgiyi (veya çoklu boyutlarda hiperplane) bulur.
Teknik detaylar için lütfen Wikipedia'daki [OLS Yöntemi](https://en.wikipedia.org/wiki/Ordinary_least_squares) sayfasını ziyaret edin.
## Çok Değişkenli Doğrusal Regresyon
Çok Değişkenli Doğrusal Regresyon, aynı zamanda Çoklu Doğrusal Regresyon olarak da bilinen, birden fazla bağımsız değişken ile tek bir bağımlı değişken arasındaki ilişkiyi modellemek için kullanılan istatistiksel bir yöntemdir. Basit doğrusal regresyon kavramını birden fazla tahmin değişkeni içerecek şekilde genişletir.
Modelin genel formu şöyledir:
$$
y = \beta_0 + \beta_1x_1 + \beta_2x_2 + \ldots + \beta_nx_n + \varepsilon
$$
Burada:
y bağımlı değişken, x₁, x₂, ..., xₙ bağımsız değişkenler, β₀ y-kesişimi (tüm x'ler sıfır olduğunda y'nin değeri), β₁, β₂, ..., βₙ her bağımsız değişkenle ilişkili katsayılar, n bağımsız değişken sayısı, ε hata terimi
## Polinom Regresyon
Polinom Regresyon, bağımsız değişken x ile bağımlı değişken y arasındaki ilişkinin n'inci dereceden bir polinom olarak modellendiği bir regresyon analizi formudur. Değişkenler arasındaki ilişki doğrusal olmadığında ancak bir polinom fonksiyonuyla yaklaşık olarak ifade edilebileceği durumlarda kullanılır.
$$
y = \beta_0 + \beta_1x + \beta_2x^2 + \beta_3x^3 + \ldots + \beta_nx^n + \varepsilon
$$
Burada:
y bağımlı değişken, x bağımsız değişken, β₀, β₁, β₂, ..., βₙ tahmin edilecek katsayılar, n polinomun derecesi ve ε hata terimi
## Polinom Regresyon
![](images/parabolic-data-points.png)
## Excel'de Doğrusal Regresyon
[MTCARS veri seti Excel dosyasını](files/mtcars-v2.xlsx) kullanın ve;
* **wt** (ağırlık) ve **mpg** (galon başına mil) sütunları arasında Eğilim Çizgisi çizin.
* **disp** (silindir hacmi) ve **wt** (ağırlık) sütunları arasında Eğilim Çizgisi çizin.
Excel'de nasıl Eğilim Çizgisi çizileceğini görmek için lütfen [MyExcelOnline](https://www.myexcelonline.com/blog/add-trendlines-excel-charts/) sayfasını ziyaret edin.
##
![](images/Trendlines.gif)
## R ile Doğrusal Regresyon
Basit doğrusal ve polinom regresyon için lütfen [R ile Doğrusal Regresyon](r-linear-regression-tr.qmd) sayfasına bakın.
## Rastgele Orman (Random Forest) ile Regresyon
Lütfen [R ile rastgele orman regresyonu](rf-regression-R-tr.qmd) belgesine bakın.