Bir düşünce deneyi: Zaman mı matematiği kapsar yoksa matematik mi zamanı?

Matematiği ilk önce sayılardan öğrendim. Duvarda asılı, o eski , sesi geceleri odamda yankılanan, yankılanırken beni uykularımdan uyandıran saatten… O zamanlar henüz üç yaşımdaydım. Benim icin matematik saatin üzerindeki sayılardan öte değildi. Matematik saatin içinde gizliydi ben 3 yaşımdayken, yani zamanın içinde gizliydi… Önce zaman vardı, sonra matematik. Matematik, zamanın matematiği idi o zamanlar…

Sonraları ise düşünceler değişti, aşağıdaki dizeler doğrultusunda:[efn_note]S. Hawking, Zamanın Daha Kısa Tarihi, 7. baskı, s. 87, (2009). [/efn_note]

Wight’in genc leydisi,
Işıktan hızlı gidebilirdi.
Bir gün gitti.
Ama farklı bir yoldan…
Ve gitmeden önceki gece geri döndü…

Şimdi tersten düşünüyorum: Ben üç yaşımdayken matematik yok muydu? Vardı. Peki ya zaman? O da vardı. Ya 3 değil de -3 yaşımdayken? Matematik yok muydu? Yine vardı… Peki ya -333333 yaşımdayken? Vardı. Gizliydi ve keşfedilmeyi bekliyordu, ama vardı! Ya zaman? Peki ya çok daha öncesi? Çok çok daha öncesinde zaman var mıydı?

Bu durumda matematik mi zamanı kapsar yoksa zaman mi matematiği? Matematik mi zamanındır yoksa zaman mı matematiğin?

Polinomları matrisler olarak düşünmek

[latexpage]Polinomları matrisler olarak ele alma fikri aslında çeşitli programlama dilleri kullanılarak polinomlar ile ilgili çeşitli hesaplamalar yapma ihtiyacına dayanıyor. Bunlar örneğin iki polinomun toplanması, bir polinomla bir sabitin çarpımı, polinomların türevi veya integrali olabilir. Hatta bunlar bir arada ve daha karmaşık bir biçimde de olabilir. Örneğin verilen bir $P^1$ polinomu için aşağıdaki gibi bir yineleme bağıntısını bilgisayara çözdürmek istiyoruz:

\begin{equation} \label{yin}
P^{n+1}(x,y) = \int_0^x \int_0^y (P_{\xi\xi}^n – 2iP_{\xi\eta}^n + (3 – i)P_\eta^n – P^n)(\xi,\eta) d\eta d\xi, \quad n = 1, 2, 3, \dotsc
\end{equation}

Yaklaşık yöntemler kullanırsak polinomun tanım kümesinin ayrık yapısı ve türev alma, integral alma yöntemleri ayrıklaştırma hatalarını doğuracaktır. Daha da kötüsü türev işlemi için uygulayacağımız yaklaşık yöntem, “round-off error” denilen yuvarlama hatasına yol açacaktır. Bu hata başlarda ihmal edilebilir düzeyde olsa da, birkaç yineleme sonrasında ihmal edilemez boyutlara ulaşacak ve nihayetinde tamamen tutarsız sonuçlara yol açacaktır. Bu durumda ayrıklaştırarak yaklaşık yöntemlerle çözme fikrinden vazgeçip sembolik hesaplamalar yapma imkanı tanıyan paketlere –örneğin Matlab için konuşmak gerekirse symbolic toolbox– yönelebiliriz. Fakat bu paketler üzerinden yapılan hesaplamalar birkaç yineleme sonrasında bir metin belgesinde ekranı kaplayacak büyüklükte sonuçlar üretecektir. Bu durum ise, devam eden yinelemelerin son derece ağır çalışmasına yol açacaktır. Dahası, sembolik olarak elde edilen sonucun sayısal veriye dönüştürülmesi ise ayrı bir soru işaretidir. Yine de sembolik hesap, kesin sonuç bulabilmemiz adına bir gerekliliktir. O halde symbolic toolbox gibi hazır paketlere başvurmadan, sembolik (yani cebirsel) hesaplama yapan bir kod nasıl yazabiliriz? Bu soruyu yanıtlamak için polinomlarla matrisler arasındaki özel bir ilişkiden faydalanacağız.

Örnek teşkil etmesi açısından ele alacağımız polinom iki bağımsız değişkene sahip ve $n$-inci dereceden olsun. Bağımsız değişken sayısı farklı olan polinomlar için de anlatacağımız strateji uygulanabilir.

\begin{align*}
P(x,y) = \sum_{k= 0}^{n} \sum_{i+j=k} a_{i,j}x^i y^j &= a_{0,0} + a_{1,0} x + a_{0,1} y + a_{2,0} x^2 + a_{1,1} xy + a_{0,2} y^2 + \dotsm \\
&+ a_{n,0} x^n + a_{n-1,1} x^{n-1}y + a_{n-2,2} x^{n-2}y^2 + \dotsm + a_{1,n-1} xy^{n-1} + a_{0,n} y^n.
\end{align*}

Her $0 \leq i,j \leq n$ için $a_{i,j} \in \mathbb{C}$ olsun. $\mathbb{C}$ üzerinde $n$-inci dereceden iki bağımsız değişkenli polinomların kümesini $\mathbb{C}_n[\cdot,\cdot]$ ile gösterelim. Bu küme üzerindeki toplama işlemini “$+$” sembolü ile gösterelim. Bu taktirde $(\mathbb{C}_n[\cdot,\cdot],+)$ cebirsel yapısı skalarla çarpma özelliğini sağlayan değişmeli bir gruptur (elbette daha fazlasıdır fakat yazının içeriği gereği ihtiyacımız olan bu kadar).

Şimdi tanım kümesi $\mathbb{C}_n[\cdot,\cdot]$ olan bir fonksiyon tanımlayalım ve bu fonksiyonu $[\cdot]$ ile gösterelim. $[\cdot]$, $\mathbb{C}_n[\cdot,\cdot]$ kümesindeki her elemanı $n\times1$ boyutlu bir kare matris ile eşlesin öyle ki, bu eşleme söz konusu polinomun $a_{i,j}$ katsayısını eşlenen matrisin $(i+1)$-inci satır $(j+1)$-inci sütun elemanına götürsün. Yani,

\begin{equation} \label{islem}
[\cdot] : P(x,y) = \sum_{k= 0}^{n} \sum_{i+j=k} a_{i,j}x^i y^j \in \mathbb{C}_n[x,y] \longrightarrow [P(x,y)] := \mathbf{P} =
\begin{bmatrix}
a_{0,0} & a_{0,1} & \cdots & a_{0,n-1} & a_{0,n} \\
a_{1,0} & a_{1,1} & \cdots & a_{1,n-1} & \\
\vdots & \vdots & & &\\
a_{n-1,0} & a_{n-1,1} & & \mbox{\Huge 0} \\
a_{n,0} & & &&
\end{bmatrix}.
\end{equation}

Örneğin $P(x,y) =y^5 – 5x^4y + x^3y^2 – 3x^4 – 2x^2y^2 + 3xy^2 – 6x^2y + 4y^2 + x + 2$ polinomunun $[\cdot]$ fonksiyonu altındaki örüntüsü

\begin{equation*}
\mathbf{P} =
\begin{bmatrix}
2 & 0 & 4 & 0 & 0 & 1 \\
1 & 0 & 3 & 0 & 0 & \\
0 & -6 & -2 & 0 & & \\
0 & 0 & 1 & & & \\
-3 & -5 & & \mbox{\Huge 0} & & \\
0 & & & & &\\
\end{bmatrix}
\end{equation*}

matrisidir.

Sonuç olarak polinomları, onlara yapı olarak benzeyen özel birtakım matrisler türünden tarif etmiş olduk. Fark edeceğiniz üzere bu matrisleri özel kılan durum, girdilerinin belirli bir düzene göre oluşturulmuş olmasıdır. Daha açık bir dille ifade etmek gerekirse bir matrisin satır numaraları, bu matrisin karşılık geldiği polinomun birinci bileşeninin kuvvetlerini temsil eder. Örneğin bir polinomun birinci bileşeninin $(i-1)$-inci kuvvetini barındıran terimlerinin katsayıları, söz konusu matrisin $i$-inci satırında yer almaktadır. Benzer ilişki matrisin sütun numaraları ile polinomun ikinci bileşenlerinin kuvvetleri arasında da mevcuttur. Sonuç olarak bir polinoma karşılık gelen matrisin girdileri, bu polinomun terimlerinde yer alan bileşenlerin ayrı ayrı kuvvetlerine göre özel bir düzene sahiptir. Bu özel düzen, polinomlar üzerinde gerçekleştirilecek birtakım işlemlerin, onlara $[\cdot]$ fonksiyonu altında karşılık gelen matrisler üzerinden yapılabilmesine olanak tanımaktadır. Şimdi bu işlemleri nasıl yapabileceğimizi aşağıda verelim.

Polinomumun belirli bir noktadaki değeri. Şimdi bir $(\alpha,\beta) \in \mathbb{C}^2$ noktasının $P$ polinomu altındaki görüntüsünü bulalım. Fakat bu işlemi $P$ polinomu üzerinden değil, bu polinoma karşılık gelen $\mathbf{P}$ matrisi üzerinden gerçekleştirelim. $\mathbf{P}|_{(\alpha,\beta)}$, $P$ polinomunun $(\alpha,\beta)$ noktasındaki görüntüsünü temsil eden matris olsun. Tabii burada $P(\alpha,\beta)$ ifadesini, derecesi sıfır olan bir polinom olarak düşünebiliriz ve derecesi sıfır olan bir polinomun matris gösterimi 1. satır 1. sütun girdisi hariç tüm girdileri $0$ olan bir matris olacaktır. Burada basitçe $x = \alpha$ ve $y = \beta$ aldığımızı düşünelim. Bu durumda $\mathbf{P}|_{(\alpha,\beta)}$ matrisi

\begin{equation*}
\mathbf{P}|_{(\alpha,\beta)} = \begin{bmatrix}
P(\alpha,\beta) & 0 & \cdots & 0} \\
0 & 0 & \cdots & 0\\
\vdots & \vdots & \ddots & \vdots\\
0 & 0& \cdots &0
\end{bmatrix}, \quad P(\alpha,\beta) = \sum_{k= 0}^{n} \sum_{i+j=k} a_{i,j}\alpha^i \beta^j
\end{equation*}

biçiminde olacaktır. Benzer biçimde yalnızca birinci bileşenin veya yalnızca ikinci bileşenin değer aldığı durumlar da incelenebilir. Örneğin $P(\alpha,\cdot)$ polinomunu ele alalım. Bu polinomu temsil eden matrisi $\mathbf{P}|_{(\alpha,\cdot)}$ ile gösterelim. $P(\alpha,\cdot)$ polinomunda yalnızca ikinci bileşenin bir değişken olarak kaldığına dikkat ediniz. Diğer bir ifade ile bu polinomun birinci bileşeninin derecesi artık $0$’dır. Bu yüzden (\ref{islem}) tanımını düşündüğümüzde $\mathbf{P}|_{(\alpha,\cdot)}$ matrisi ilk satır girdileri hariç tüm girdileri $0$ olan bir matris olacaktır,

\begin{equation} \label{ilkgoruntu}
\mathbf{P}|_{(\alpha,\cdot)} = \begin{bmatrix}
\sum_{k=0}^n a_{k,0} \alpha ^k & \sum_{k=0}^{n-1} a_{k,1} \alpha ^k & \cdots & \sum_{k=0}^1 a_{k,n-1} \alpha ^k & a_{0,n} \\
0 & 0 & \cdots & 0 &0\\
\vdots & \vdots & \ddots & \vdots & \vdots\\
0 & 0 & \cdots & 0 & 0 \\
0 & 0& \cdots & 0 & 0
\end{bmatrix}.
\end{equation}

Şimdi de $P(\cdot,\beta)$ polinomunu ele alalım ve bu polinomu temsil eden matrisi $\mathbf{P}|_{(\cdot,\beta)}$ ile gösterelim. $P(\cdot,\beta)$ polinomu yalnızca ilk bileşenini değişken olarak barındıran bir polinomdur. Dolayısıyla $\mathbf{P}|_{(\cdot,\beta)}$, ilk sütununda yer alan girdiler hariç tüm girdileri $0$ olan bir matristir,

\begin{equation*}
\mathbf{P}|_{(x,\beta)} = \begin{bmatrix}
\sum_{k=0}^n a_{0,k} \beta^k & 0 & \cdots & 0 &0 \\
\sum_{k=0}^{n-1} a_{1,k} \beta ^k & 0 & \cdots & 0 & 0\\
\vdots & \vdots & \ddots & \vdots & \vdots\\
\sum_{k=0}^1 a_{n-1,k} \beta^k & 0 & \cdots & 0 & 0 \\
a_{n,0} & 0& \cdots & 0 & 0
\end{bmatrix}.
\end{equation*}

Toplama ve skalarla çarpma. Girdileri $\mathbb{C}$’den olan $n+1$ boyutlu kare matrislerin kümesini $M^{n+1}(\mathbb{C})$ ile gösterelim. $M^{n+1}(\mathbb{C})$’de yer alan ve ikincil köşegenin (yani $\{a_{i,n-i}\}_{i=0}^N$ elemanlarının) altındaki girdileri $0$ olan matrislerin kümesini ise $M^{n+1}_0(\mathbb{C})$ ile gösterelim. Bu küme üzerinde tanımlı toplama işlemini “$\oplus$” sembolü ile gösterelim. Bu taktirde $(M^{n+1}_0(\mathbb{C}),\oplus)$ yapısı skalarla çarpma özelliğini sağlayan değişmeli bir gruptur. Şimdi

\begin{equation*}
P(x,y) = \sum_{k= 0}^{n} \sum_{i+j=k} a_{i,j}x^i y^j, \quad Q(x,y) = \sum_{k= 0}^{n} \sum_{i+j=k} b_{i,j}x^i y^j
\end{equation*}

olacak şekilde herhangi iki $P, Q \in \mathbb{C}_n[\cdot,\cdot]$ alalım.

\begin{equation*}
[P(x,y) + Q(x,y)] = \mathbf{P} \oplus \mathbf{Q}
\end{equation*}

olduğu kolaylıkla gösterilebilir. O halde (\ref{islem}) ile tanımladığımız $[\cdot]:\mathbb{C}_n[\cdot,\cdot]} \to M^{n+1}_0(\mathbb{C})$ fonksiyonu bir grup homomorfizmasıdır. Dahası, bu fonksiyon birebir ve örten bir fonksiyondur. O halde $[\cdot]$ bir grup izomorfizmasıdır, $\mathbb{C}_n[\cdot,\cdot] \simeq M^{n+1}_0(\mathbb{C})$. Sonuç olarak elemanları ve bu elemanları arasında tanımlı toplama işlemi farklı olsa dahi, $\mathbb{C}_n[\cdot,\cdot]$ ve $M^{n+1}_0(\mathbb{C})$ kümeleri aynı yapıya sahip iki kümedir. Dolayısıyla birinde gerçekleştireceğimiz bir işlemi, alternatif olarak diğerinde de gerçekleştirebiliriz. Örneğin

\begin{align*}
P(x,y) &= x^3 – 3x^2y + 3xy – y + 3, \\
Q(x,y) &= x^2 – 2xy + y^2 + x + 2y
\end{align*}

polinomlarını ele alalım. Burada $P \in \mathbb{R}_3[\cdot,\cdot]$ ve $Q \in \mathbb{R}_2[\cdot,\cdot]$’dir. Fakat $\mathbb{R}_2[\cdot,\cdot] \subset \mathbb{R}_3[\cdot,\cdot]$ olduğundan $Q \in \mathbb{R}_3[\cdot,\cdot]$ almamızda bir sakınca yoktur. Bunu yapmamızın sebebi, az sonra gerçekleştireceğimiz $\oplus$ işlemi öncesinde matrislerin boyutlarını aynı kılmaktır. Bunu bir anlamda polinomun katsayısı $0$ olan bazı terimlerini yazmak olarak düşünebiliriz. Devam edelim… Öncelikle $[\cdot]$ bir homomorfizma olduğundan ve sırasıyla hem polinomların hem de matrislerin skalarla çarpma özelliğinini kullanarak

\begin{equation*}
[2P(x,y) – 3Q(x,y)] = [(2P)(x,y) + (-3Q)(x,y)] = (\mathbf{2P}) \oplus (\mathbf{-3Q}) = 2\mathbf{P} \oplus (-3)\mathbf{Q}
\end{equation*}

yazabiliriz. Burada $P(x,y)$ ve $Q(x,y)$ matrislerinin $[\cdot]$ fonksiyonu altındaki görüntüleri

\begin{equation*}
\mathbf{P} =
\begin{bmatrix}
3 & -1 & 0 & 0 \\
0 & 3 & 0 & 0 \\
0 & -3 & 0 & 0 \\
1 & 0 & 0 & 0\\
\end{bmatrix}
\quad \text{ve} \quad
\mathbf{Q} =
\begin{bmatrix}
0 & 2 & 1 & 0 \\
1 & -2 & 0 & 0 \\
1 & 0 & 0 & 0 \\
0 & 0 & 0 & 0\\
\end{bmatrix}
\end{equation*}

olup, bu değerleri kullanarak

\begin{equation*}
2\mathbf{P} \oplus (-3)\mathbf{Q} = \begin{bmatrix}
6 & -8 & -3 & 0 \\
-3 & 0 & 0 & 0 \\
-3 & -6 & 0 & 0 \\
2 & 0 & 0 & 0\\
\end{bmatrix}
\end{equation*}

elde ederiz. Son olarak $[\cdot]$ fonksiyonun birebir ve örten olmasından faydalanarak

\begin{equation*}
2P(x,y) – 3Q(x,y) = 2x^3 – 6x^2y -3x^2 -3y^2 -3x -8y + 6
\end{equation*}

sonucunu elde ederiz.

Türev. $\mathrm{D}_x :M^{n+1}_0(\mathbb{C}) \to M^{n+1}_0(\mathbb{C})$ operatörünü

\begin{equation} \label{turev_tanim}
\mathbf{P} \overset{R_i \to (i-1)R_{i-1}}{\xrightarrow{\makebox[2.3cm]{}}} \mathrm{D}_x \mathbf{P}, \quad \forall i, i \in \{2, 3, \dotsc, n+1\}
\end{equation}

olarak tanımlayalım. Yani $\mathbf{P}$ matrisinin ilk satırı hariç her satırını, satır numarasının bir eksiği ile çarpalım, daha sonra bu sonuçları bir üst satıra kaydırarak $\mathrm{D}_x \mathbf{P}$ matrisini oluşturalım. Bu şekilde tanımladığımız $\mathrm{D}_x$ operatörü, bir polinomun birinci bileşenine göre kısmi türevi ile, o polinomun $[\cdot]$ fonksiyonu altındaki görüntüsünü ilişkilendirecektir,

\begin{equation*}
\left[\frac{\partial}{\partial x} P(x,y)\right] = \mathrm{D}_x \mathbf{P}.
\end{equation*}

Türev alma işleminin bir polinom üzerindeki cebirsel etkisini düşündüğümüz zaman, esasında bu biçimde bir “satır kaydırma” işlemi olarak tanımlamak esasında son derece uygundur.

Bir örnekle devam edelim. $P(x,y) = -2x^3 + 3x^2y + xy + y^2 + 2x – 5$ polinomunu ele alalım. Bu durumda $\mathbf{P}$ matrisi

\begin{equation}
\label{turevvv}
\mathbf{P} =
\begin{bmatrix}
-5 & 0 & 2 & 0 \\
2 & 1 & 0 & 0 \\
0 & 3 & 0 & 0 \\
-2 & 0 & 0 & 0\\
\end{bmatrix}
\end{equation}

biçimindedir. Şimdi $\mathbf{P}$ matrisine $\mathrm{D}_x$ operatörünü uygulayalım. Bunun için yapacağımız şey her satırı, o satırın satır numarasının bir eksiği ile çarpmak ve elde ettiğimiz sonucu bir üst satıra yazmaktır. Bu işlemi elbette ilk satır hariç yapıyoruz, ne de olsa ilk satırın bir “üst” satırı yok! Fakat bu durum, yani üst satır olmamasından dolayı ilk satırı hariç tutmamız, gerçekten de klasik anlamdaki türevle de tutarlı. Zira ilk satır $x^0$’lı terimlerin katsayılarının yer aldığı satırdır ve bu terimlerin $x$’e göre türevi $0$’dır. Dolayısıyla bu terimler türev fonksiyonunda yer almazlar. Devam edelim… Verdiğimiz satır kaydırma algoritmasını uygulayarak

\begin{equation*}
\mathrm{D}_x\mathbf{P} =
\begin{bmatrix}
2 & 1 & 0 & 0 \\
0 & 6 & 0 & 0 \\
-4 & 0 & 0 & 0 \\
0 & 0 & 0 & 0\\
\end{bmatrix}
\end{equation*}

buluruz. Elde ettiğimiz sonucun $[\cdot]$ fonksiyonu altındaki ters görüntüsü ise $-4x^2 + 6xy +y + 2$ polinomuna karşılık gelir ki bu da $\frac{\partial}{\partial x}P(x,y)$ türevinin ta kendisidir.

Benzer şekilde bir polinomun ikinci bileşenine göre kısmi türevini de ilişkilendireceğimiz bir operatör tanımlayabiliriz. Bunun için yine bir $\mathbf{P} \in M_0^{n+1}(\mathbb{C})$ seçelim. $C_i$, $\mathbf{P}$ matrisinin $i$-inci sütununu temsil etsin.

\begin{equation*}
\mathbf{P} \in M_0^{n+1}(\mathbb{C}) \overset{C_i \to (i-1)C_{i-1}}{\xrightarrow{\makebox[2.3cm]{}}} \mathrm{D}_y \mathbf{P} \in M_0^{n+1}(\mathbb{C}), \quad \forall i, i \in \{2, 3, \dotsc, n+1\}
\end{equation*}

biçiminde tanımlı $\mathrm{D}_y$ operatörü, $P$ polinomunun ikinci bileşenine göre türevi ile $[\cdot]$ fonksiyonu altındaki görüntüsünü ilişkilendirecektir,

\begin{equation*}
\left[\frac{\partial}{\partial y} P(x,y)\right] = \mathrm{D}_y \mathbf{P}.
\end{equation*}

Bu seferki tanımın sütunları kaydırmaya dayalı bir algoritmaya sahip olduğuna dikkat çekelim. Sonuç olarak $\mathrm{D}_x$ ve $\mathrm{D}_y$ operatörlerini bu yazı bağlamında “türev operatörleri” olarak isimlendirmemizde bir sakınca yoktur.

$\mathrm{D}_x$ ve $\mathrm{D}_y$ operatörlerinin tanımlarını kullanarak yüksek mertebeden türev operatörlerini de tanımlayabiliriz. Örneğin $\mathrm{D}_x^2$, $\mathrm{D}_y^3$, $\mathrm{D}_x^3\mathrm{D}_x^2$ gibi. Bunlar sırasıyla polinomlar üzerinde gerçekleştirilen $\frac{\partial^2}{\partial x^2}$, $\frac{\partial^3}{\partial y^3}$, $\frac{\partial^5}{\partial x^3 \partial x^2}$ işlemlerine karşılık gelecektir. Dahası türev türev operatörlerinin değişmeli olduğunu kolayca gösterebiliriz,

\begin{equation*}
\mathrm{D}_x\mathrm{D}_y \mathbf{P} = \left[\frac{\partial^2}{\partial x \partial y}P(x,y)\right] = \left[\frac{\partial^2}{\partial y \partial x}P(x,y)\right] = \mathrm{D}_y\mathrm{D}_x \mathbf{P}.
\end{equation*}

İntegral. Genel olarak integral alma işlemi polinomlar üzerinde türev alma işleminin tam tersi bir etkiye sahiptir. Polinomları düşünecek olursak, türev alma işlemi bir değişkenin kuvvetini azaltırken, integral alma işlemi ise tersine artırıcı bir etkide bulunur. Bu gözlemden yola çıkarak integral operatörünü, türev operatörüne kıyasla ters etkiye sahip olacak şekilde tanımlayacağız. Diğer bir ifade ile, söz konusu matrisin satırlarını (veya sütunlarını) bir alt satıra (veya bir sağ sütuna) kaydıracak biçimde bir operatör tanımlayacağız.

$n$-inci dereceden bir $P(x,y)$ polinomuna karşılık gelen $\mathbf{P}$ matrisini ele alalım. Fakat bu matrisi $M_0^{n+1}(\mathbb{C}})$ kümesinden seçmek yerine $M_0^{n+2}(\mathbb{C}})$ kümesinden seçelim. $\mathrm{J}_x :M^{n+2}_0(\mathbb{C}) \to M^{n+2}_0(\mathbb{C})$ operatörünü

\begin{equation*}
\mathbf{P} \overset{R_i \to \frac{R_{i+1}}{i}}{\xrightarrow{\makebox[1.9cm]{}}} \mathrm{D}_x \mathbf{P}, \quad \forall i, i \in \{1, 2, \dotsc, n+1\}
\end{equation*}

biçiminde tanımlayalım. Yani matrisin bir satırındaki her elemanı bu satır numarası ile bölelim ve sonucu bir üst satıra kaydıralım. Bu biçimde tanımlı $\mathrm{J}_x$ operatörü, $P$ polinomunun birinci bileşenine göre integrali ile o polinomun $[\cdot]$ fonksiyonu altındaki görüntüsünü ilişkilendirecektir:

\begin{equation*}
\left[\int_a^x P(\xi,y)d\xi\right] = \mathrm{J}_x\mathbf{P} – (\mathrm{J}_x\mathbf{P})|_{(a,\cdot)}.
\end{equation*}

Örneğin yine $P(x,y) = -2x^3 + 3x^2y + xy + y^2 + 2x – 5$ polinomunu ele alalım ve $\int_1^x P(\xi,y) d\xi$ integralini hesaplayalım. $P$ polinomunun $M_0^{4}(\mathbb{C})$ kümesindeki matris gösteriminin ($\ref{turevvv}$) olduğunu yukarıda gösterdik. Fakat bu sefer $M_0^{5}(\mathbb{C})$ kümesinden bir gösterim yazmamız gerekiyor. Dolayısıyla uygun gösterim

\begin{equation*}
\mathbf{P} =
\begin{bmatrix}
-5 & 0 & 1 & 0 & 0\\
2 & 1 & 0 & 0 & 0\\
0 & 3 & 0 & 0 & 0\\
-2 & 0 & 0 & 0 & 0\\
0 & 0 & 0 & 0 & 0
\end{bmatrix}
\end{equation*}

biçiminde olacaktır. Bu şekilde yazma gereği duyuyoruz çünkü az sonra integral alma işlemi gerçekleştireceğiz ve integral alma algoritmamıza göre her satırı bir alt satıra kaydırmamız gerekiyor. Böylelikle en alttaki satır için uygun bir alan açmış oluyoruz. Tanıma göre her satır girdisi satır numarasına bölünerek bir üst satıra kaydırılmalı. Bu işlem bizi

\begin{equation*}
\mathrm{J}_x\mathbf{P} =
\begin{bmatrix}
0 & 0 & 0 & 0 & 0\\
-5 & 0 & 1 & 0 & 0\\
1 & 1/2 & 0 & 0 & 0\\
0 & 1 & 0 & 0 & 0\\
-1/2 & 0 & 0 & 0 & 0
\end{bmatrix}
\end{equation*}

matrisine götürür. Öte yandan (\ref{ilkgoruntu}) eşitliğinden faydalanarak integralin alt sınırını

\begin{equation*}
(\mathrm{J}_x\mathbf{P})|_{(1,\cdot)} =
\begin{bmatrix}
-9/2 & 3/2 & 1 & 0 & 0\\
0 & 0 & 0 & 0 & 0\\
0 & 0 & 0 & 0 & 0\\
0 & 0 & 0 & 0 & 0\\
0 & 0 & 0 & 0 & 0
\end{bmatrix}
\end{equation*}

buluruz. O halde integralin sonucunu

\begin{equation*}
\left[\int_1^x P(\xi,y)d\xi\right] = \mathrm{J}_x\mathbf{P}-(\mathrm{J}_x\mathbf{P})|_{(1,\cdot)} = \begin{bmatrix}
9/2 & -3/2 & -1 & 0 & 0\\
-5 & 0 & 1 & 0 & 0\\
1 & 1/2 & 0 & 0 & 0\\
0 & 1 & 0 & 0 & 0\\
-1/2 & 0 & 0 & 0 & 0
\end{bmatrix}
\end{equation*}

elde ederiz. Bulduğumuz matris

\begin{equation*}
-\frac{1}{2}x^4 + x^3y + \frac{1}{2}x^2y + xy^2 + 2x^2 – y^2 – 5x – \frac{3}{2}y +\frac{9}{2}
\end{equation*}

polinomuna karşılık gelir ki bu polinom da $\int_1^x P(\xi,y)dx$ integralinin sonucudur.

Şimdi benzer bir biçimde ikinci değişkene göre integral işlemini gerçekleştirebileceğimiz bir operatör tanımlayalım. Bunun için yine $\mathbf{P} \in M_0^{n+2}(\mathbb{C}})$ seçelim.

\begin{equation*}
\mathbf{P} \overset{C_i \to \frac{C_{i+1}}{i}}{\xrightarrow{\makebox[2.3cm]{}}} \mathrm{J}_x \mathbf{P}, \quad \forall i, i \in \{1, 2, \dotsc, n+1\}
\end{equation*}

biçiminde tanımlı $\mathrm{J}_y$ operatörü, $P$ polinomunun ikinci bileşenine göre integrali ile $\mathbf{P}$ matrisini ilişkilendirecektir,

\begin{equation*}
\left[\int_b^y P(x,\eta)d\eta\right] = \mathrm{J}_y\mathbf{P} – (\mathrm{J}_y\mathbf{P})|_{(\cdot,b)}.
\end{equation*}

Lafı uzatmadan, $\mathrm{J}_x$ ve $\mathrm{J}_y$ operatörleri vesilesiyle çok katlı integralleri de hesaplayabileceğimizi belirtip sonlandıralım.

Sonuç. Yazının başına dönecek olursak, polinomları matrisler olarak düşünme gereksiniminin, çeşitli programlama dilleri kullanılarak polinomlarla ilgili hesaplamalar yapma ihtiyacından doğduğunu belirtmiştik. (\ref{islem}) ile tanıttığımız eşleme sayesinde, polinomları birer fonksiyon olarak düşünmekten ziyade, onları cebirsel nesneler olarak ele aldık. Bu düşünce biçimi noktasal değer hesaplama, toplama, skalarla çarpma, türev ve integral gibi işlemlerin hesaplanabilir olmasında bize bir engel yaratmadı. Öte yandan, her ne kadar yazıda değinmesek de, bu işlemler bilgisayarlar tarafından da kolayca gerçekleştirilebilir, zira yapılması gereken tek şey basit döngü yapıları kurmak. Örneğin yazının en başındaki (\ref{yin}) eşitliğinin sağ tarafına bakın. İntegral ve integralin içerisindeki işlemler dahil olmak üzere, bu işlemlerin tümünü anlattığımız stratejiyi kullanarak gerçekleştirebilir ve verilen bir $P^n$ için $P^{n+1}$’i bulabiliriz. Dahası yaptığımız işlemler tamamen cebirsel oldukları için bulacağımız sonuç $P^{n+1}$’in kesin değeri olacaktır.

Son olarak bu yazıda anlattığımız strateji polinomlar için olup, elbette farklı tip fonksiyonlar için de uygun eş cebirsel yapılar bulunabilir ve tıpkı burada anlattığımız gibi, bu yapılar sayesinde fonksiyonlar üzerinde çeşitli işlemler gerçekleştirilebilir.

Matematiksel modelleme yapmak için neden diferansiyel denklemlere başvururuz?

[latexpage] Sorunun yanıtını vermeye başlamadan peşin peşin söyleyeyim, diferansiyel denklemin ne demek olduğunu aşağıda belirteceğim. Teknik kelimeler sizi korkutmasın. Ayrıca şunu da belirteyim,başlıktaki sorunun yanıtını kendi düşüncem ve birikimim doğrultusunda vermeye çalışacağım, çapım artık ne kadar elveriyorsa… Çalışma alanım diferansiyel denklemler üzerine olduğu için soruyu bu çerçevede yanıtlamaya çalışacağım. Yoksa çevremizdeki olayların hangi yöntemler kullanılarak ve nasıl modellendiğine dair farklı bakış açıları içeren, daha doyurucu yanıtlar elbet başka kaynaklarda olabilir. Bu yazı yalnızca bir öğrencim tarafından başlıktaki sorunun bana sorulması üzerine verdiğim yanıtın derlenip toparlanmış halidir. Dolayısıyla bu yazı daha çok üniversite öğrencilerine veya türevin geometrik olarak ne anlama geldiğini bilen lise öğrencilerine hitap etmektedir.

Diferansiyel denklem nedir? Öncelikle diferansiyel denklemin ne olduğuyla başlayalım. Bir denklem düşünün, öyle ki içerisinde bağımsız değişken (diyelim ki $t$), bağımlı değişken (diyelim ki $y = y(t)$) ve onun belirli mertebeden türevleri ($y^\prime(t), y^{\prime\prime}(t), \dotsc$ vb.) içersin. Örneğin aşağıdakiler gibi:

\begin{align*}
&y^\prime + 2y = 0, \\
&y^{\prime\prime\prime} – 3y^{\prime\prime} + 2 y^\prime = e^{-t} \sin t, \\
&(y^{\prime})^2 – \cos y = 0.
\end{align*}

Burada $y$ bilinmeyen fonksiyondur ve genel çerçevede amaç $y$’yi elde etmek (bu her zaman mümkün değildir veya mümkünse bile elde etmek o kadar da kolay olmayabilir) veya $y$’nin $t$ içerisindeki davranışını analiz etmektir. $y$ fonksiyonunun tanım kümesi, yani $t$ değişkeninin alabileceği elemanların kümesi problemden probleme göre değişir. Kimi problemde tüm reel sayılar iken kimi problemde yarı eksen (örneğin $t \in \mathbb{R}^+$), kimi problemde ise yalnızca bir aralık (örneğin $t \in [0,1]$) olabilir. Bağımsız değişken sayısı birden çok da olabilir, örneğin $y(t_1,t_2)$ gibi veya daha genel olarak $y(t_1,t_2, \dotsc, t_n)$ gibi. Bu tip fonksiyonlar için “çok değişkenli fonksiyon” ifadesini kullanırız. Bu fonksiyonların herhangi bir bağımsız değişkene göre türevini anlatmak için ise “kısmi türev” ifadesini kullanırız. O halde bağımsız değişkenler, çok değişkenli bir fonksiyon ve onun çeşitli mertebelerden kısmi türevlerini içeren denkleme özel olarak “kısmi diferansiyel denklem” denir. Yukarıda örneklediğim denklemlerde ise bilinmeyen fonksiyon tek bağımsız değişkene sahip. Bu yüzden bu tip diferansiyel denklemlere özel olarak “adi (sıradan, bayağı) diferansiyel denklem” de denir.

Mümkün olduğunca yalın olabilmek adına, başlıkta belirttiğim soruyu tek bağımsız değişkene sahip fonksiyonlar üzerinden açıklamaya çalışacağım.

Diferansiyel denklemlere neden ihtiyaç duyarız? Her şey gözlemle başlar. Eğer üzerine çalıştığımız bir olayı matematiksel olarak modellemek istiyorsak, olayın dinamiklerini anlamak adına ilk yapacağımız iş, söz konusu olayı zaman içerisinde gözlemlemektir. Gözlem (ölçüm) yapmak, bize söz konusu olay hakkında nicel veriler sağlar. Matematiksel olarak konuşacak olursak, farklı $t$ anlarına karşılık gelen $y(t)$ değerlerini nicel olarak elde etmemizi sağlar. Klasik bir örnek olarak, bir ortamdaki bakteri popülasyonunun zamana göre değişimi olayını ele alalım. Diyelim ki 1’er saat arayla yapılmış 10 saatlik şu bilgileri biliyoruz:

[latex mode=1]
\begin{table}
\begin{center}
\begin{tabular}{l | c | c | c | c | c | c | c | c | c | c }
Zaman (saat) & $1$ & $2$ & $3$ & $4$ & $5$ & $6$ & $7$ & $8$ & $9$ & $10$ \\ \hline
Miktar ($\times 10^3$) & $10$ & $20$ & $40$ & $80$ & $140$ & $210$ & $280$ & $330$ & $350$ & $310$
\end{tabular}
\end{center}
\end{table}
[/latex]

Bu tablo bakteri popülasyonuna dair hangi tür bilgiler edinebileceğimize bir bakalım. İlk olarak bu veriler bize, bakteri popülasyonunun $t = 1, 2, \dotsc, 10$ saatleri için değerlerini söyler. İkincisi bu veriler, $t$-inci saatten $(t+1)$-inci saate geçerken bakteri miktarının nasıl değiştiğini söyler. $t = 1, 2, \dotsc, 9$ olmak üzere,

\begin{equation*}
y(t+1) – y(t)
\end{equation*}

farkına bakarak bakteri miktarının ilk 9 saat boyunca arttığını, 9. saatten 10. saate geçerken ise azaldığı sonucunu elde ederiz.

[latex mode=1]
\begin{table}
\begin{center}
\begin{tabular}{l | c | c | c | c | c | c | c | c | c | c }
\text{Zaman (saat)} & $1$ & $2$ & $3$ & $4$ & $5$ & $6$ & $7$ & $8$ & $9$ & $10$ \\ \hline
\text{Miktar ($\times 10^3$)} & $10$ & $20$ & $40$ & $80$ & $140$ & $210$ & $280$ & $330$ & $350$ & $310$ \\ \hline
\text{De\u{g}i\c{s}im ($\times 10^3$)} & & +10 & +20 & +40 & +60 & +70 & +70 & +60 & +20 & -40 \\
\end{tabular}
\end{center}
\end{table}
[/latex]

Şimdi gözlemlerimiz üzerinden elde edebileceklerimizi bir adım daha ileri taşıyalım. $(y(t+1) – y(t))$ farkı bize $t$-inci saatten $(t+1)$-inci saate geçerken bakteri miktarının değişimini vermektedir. Benzer şekilde $(y(t+2) – y(t+1))$ farkı $(t+1)$-inci saatten $(t+2)$-inci saate geçerken bakteri miktarındaki değişimi vermektedir. Bu durumda bu ikisinin farkı, yani değişimlerin farkı bize değişimin nasıl değiştiği ile ilgili bilgi verecektir. O halde $t = 1, 2, \dotsc, 8$ için

\begin{equation*}
(y(t+2) – y(t+1)) – (y(t+1) – y(t))
\end{equation*}

işleminin sonucuna bakarak $t$-inci saatten $(t+2)$-inci saate ilerlerken bakteri miktarındaki değişimin değişimini elde edebiliriz.

İkinci tabloda artışın 9. saate kadar ilerlediği sonucunu elde etmiştik. Şimdi ise bu artışın nasıl değiştiğini son tabloya bakarak görebiliriz. 9. saate kadar devam eden artış, ilk 6 saat boyunca artarak, 7. saate geçerken sabit bir biçimde ve 9. saate kadar ise azalarak sürüyor. Eğer “artarak artmak”, “sabit bir biçimde artmak” veya “azalarak artmak” ifadelerini anlamakta güçlük çekiyorsanız aşağıdaki grafiklere bakın.

\begin{tikzpicture}
[+preamble]
\usepackage{tikz}
\usepackage{pgfplots}
\usepgfplotslibrary{fillbetween}
\usetikzlibrary{patterns}
\usepackage{color}
[/preamble]
\begin{axis}[grid=none,
xmin = -3, xmax=3,
xlabel=$x$,
xtick={-3,…,3},
ymin = -3, ymax=3,
ylabel=$y$,
ytick={-3,…,3},
axis lines=middle,
enlargelimits]
\addplot[blue,domain=-3:1.2,thick] {pow(e,x)};
\addplot[green,domain=-2.5:2.5,thick] {x};
\addplot[red,domain=1/2^6:3,samples=100,thick] {ln(x)};
\end{axis}
\end{tikzpicture}

Her üç fonksiyon da artan fonksiyon olmasına rağmen mavi olanın artış miktarı artmaktadır. Yeşil olanın artış miktarı sabittir. Kırmızı olan ise artmasına rağmen artış miktarı azalmaktadır.

En baştaki gözlemimizden yola çıkarak elde edebileceğimiz sonuçları daha da ileri götürebiliriz. Konudan sapmadan dikkatinizi tutmanızı istediğim nokta gözlemimizin popülasyon değerine ait olması ve bu gözlemden yola çıkarak önce popülasyon değişimine, sonra da popülasyon değişiminin değişimine ait veriler elde edebilmemizdir. Şimdi bir an için gözlemlerimizi sıklaştırdığımızı düşünün. Gözlemlerimiz artık saat başı değil de dakika başı. Daha da sıklaştıralım, saniye başı hatta salise başı… Hatta öyle ki ardışık iki gözlemimiz arasındaki farkı sıfıra yaklaştıralım. Böyle bir durumda yapacağımız gözlemler, bize bakteri popülasyonunun sürekli nicel değerlerini verecektir. Bu değerlerden elde edeceğimiz değişim, değişimin değişimi vb. çıkarımlar, popülasyon miktarını veren fonksiyonun çeşitli mertebeden türevlerine ait sonuçlar elde etme imkanı tanıyacaktır. Konunun en başına dönecek olursak yaptığımız gözlemler bize, aradığımız fonksiyona ve bu fonksiyonun belirli mertebeden türevlerine dair kestirimler yapma imkanı sunmaktadır. O halde modellemek istediğimiz olayı, söz konusu olayı tarif eden fonksiyon ve bu fonksiyonun belirli mertebeden türevlerini içeren bir matematiksel denklem ile ifade etmek yerinde olacaktır.