Τον τελευταίο καιρό ακούγεται από πολλούς ότι η εξάπλωση του κορονοϊού, γνωστού με την επιστημονική ονομασία Covid-19, ακολουθεί εκθετικό ρυθμό. Τι σημαίνει αυτό και γιατί συμβαίνει;
First things first! Αρχικά να διευκρινίσουμε ότι η πεποίθηση αυτή δεν είναι απόλυτα ακριβής. Στην πραγματικότητα αν και στην μαθηματική περιγραφή της εξάπλωσης του ιού όντως κάνει την εμφάνισή της η εκθετική συνάρτηση, ωστόσο η τελική συνάρτηση που εκφράζει το μέγεθος της διασποράς του ιού είναι η λεγόμενη «λογιστική», κατά πολλούς «σιγμοειδής» συνάρτηση. Προς αποφυγήν παρεξηγήσεων βέβαια σπεύδω να διευκρινίσω ότι η λογιστική στο αρχικό της διάστημα όντως προσομοιάζει την εκθετική. Ας δούμε όμως τα πράγματα πιο αναλυτικά.
Στη βιβλιογραφία έχουν προταθεί πολλά μοντέλα για την εξάπλωση μιας επιδημίας. Το γνωστότερο ίσως είναι το SIR, από τα αρχικά (S)usceptible, (I)nfected, (R)ecovered. Το μοντέλο αυτό χωρίζει τον πληθυσμό σε τρία ξένα μεταξύ τους σύνολα, των οποίων το πλήθος μεταβάλλεται με την πάροδο του χρόνου. Στο πρώτο σύνολο ανήκουν όσοι είναι ευάλωτοι στον ιό και αποτελούν υποψήφιους νέους φορείς. Ασφαλώς στην αρχή της επιδημίας στο σύνολο αυτό ανήκει όλος ο πληθυσμός. Στο δεύτερο σύνολο ανήκουν όσοι είναι μολυσμένοι από τον ιό και τέλος, στο τρίτο σύνολο ανήκουν όσοι έχουν είτε αναρρώσει είτε καταλήξει. Καθώς υπάρχουν πολλά κατατοπιστικά άρθρα και παραστατικά video στο διαδίκτυο, εμείς εδώ δεν θα εμβαθύνουμε στο μοντέλο αυτό. Ενδεικτικά, ακολουθώντας τους παρακάτω συνδέσμους θα μπορούσε κανείς να μάθει περισσότερα για το SIR, αλλά και για παρόμοια μοντέλα.
https://www.maa.org/press/periodicals/loci/joma/the-sir-model-for-spread-of-disease-the-differential-equation-model
https://youtu.be/Qrp40ck3WpI
Η δυσκολία του μοντέλου SIR, έγκειται στο ότι εμπλέκει μη γραμμικές διαφορικές εξισώσεις. Παρόλα αυτά, ακριβείς παραμετρικές λύσεις έχουν βρεθεί και δημοσιευθεί:
https://arxiv.org/abs/1403.2160
Στην ανάρτηση αυτή, χάριν ευκολίας θα παρουσιάσουμε ένα απλούστερο μοντέλο, η λύση του οποίου όμως δεν διαφέρει σημαντικά από τη λύση του SIR στην αρχή της εξέλιξης της επιδημίας. Το μοντέλο που θα χρησιμοποιήσουμε εμπίπτει στο πρότυπο πρόβλημα της εξάπλωσης επιδημίας του μαθηματικού κλάδου των διαφορικών εξισώσεων [1]. Στο μοντέλο αυτό, θεωρούμε ότι ο ρυθμός μετάδοσης της επιδημίας είναι ανάλογος τόσο του μέρους του πληθυσμού που φέρει τον ιό, όσο και του υπόλοιπου μέρους του πληθυσμού που δεν νοσεί, αλλά είναι ευάλωτο στον ιό. Αυτό διαισθητικά μπορεί να γίνει αντιληπτό ως εξής: Ασφαλώς όσο περισσότεροι άνθρωποι φέρουν τον ιό, τόσο αυξάνονται οι πιθανότητες αυτός να μεταδοθεί σε άλλους. Όμως, ταυτόχρονα τόσο λιγότεροι είναι και οι πιθανοί καινούργιοι φορείς. Προφανώς κανείς δεν μεταδίδει τον ιό σε κάποιον που ήδη νοσεί. Συνεπώς, όσο εξαπλώνεται η επιδημία, τόσο συρρικνώνεται το σύνολο των δυνάμει νοσούντων. Αυτός είναι και ο λόγος που τελικά η εξάπλωση δεν ακολουθεί εκθετικό ρυθμό, καθώς η ίδια η εξάπλωση τελικά εμποδίζει τον εαυτό της στη διαδικασία της περαιτέρω εξάπλωσης.
Η παραπάνω διπλή σχέση αναλογίας μπορεί να γραφεί μαθηματικά ως εξής:
First things first! Αρχικά να διευκρινίσουμε ότι η πεποίθηση αυτή δεν είναι απόλυτα ακριβής. Στην πραγματικότητα αν και στην μαθηματική περιγραφή της εξάπλωσης του ιού όντως κάνει την εμφάνισή της η εκθετική συνάρτηση, ωστόσο η τελική συνάρτηση που εκφράζει το μέγεθος της διασποράς του ιού είναι η λεγόμενη «λογιστική», κατά πολλούς «σιγμοειδής» συνάρτηση. Προς αποφυγήν παρεξηγήσεων βέβαια σπεύδω να διευκρινίσω ότι η λογιστική στο αρχικό της διάστημα όντως προσομοιάζει την εκθετική. Ας δούμε όμως τα πράγματα πιο αναλυτικά.
Στη βιβλιογραφία έχουν προταθεί πολλά μοντέλα για την εξάπλωση μιας επιδημίας. Το γνωστότερο ίσως είναι το SIR, από τα αρχικά (S)usceptible, (I)nfected, (R)ecovered. Το μοντέλο αυτό χωρίζει τον πληθυσμό σε τρία ξένα μεταξύ τους σύνολα, των οποίων το πλήθος μεταβάλλεται με την πάροδο του χρόνου. Στο πρώτο σύνολο ανήκουν όσοι είναι ευάλωτοι στον ιό και αποτελούν υποψήφιους νέους φορείς. Ασφαλώς στην αρχή της επιδημίας στο σύνολο αυτό ανήκει όλος ο πληθυσμός. Στο δεύτερο σύνολο ανήκουν όσοι είναι μολυσμένοι από τον ιό και τέλος, στο τρίτο σύνολο ανήκουν όσοι έχουν είτε αναρρώσει είτε καταλήξει. Καθώς υπάρχουν πολλά κατατοπιστικά άρθρα και παραστατικά video στο διαδίκτυο, εμείς εδώ δεν θα εμβαθύνουμε στο μοντέλο αυτό. Ενδεικτικά, ακολουθώντας τους παρακάτω συνδέσμους θα μπορούσε κανείς να μάθει περισσότερα για το SIR, αλλά και για παρόμοια μοντέλα.
https://www.maa.org/press/periodicals/loci/joma/the-sir-model-for-spread-of-disease-the-differential-equation-model
https://youtu.be/Qrp40ck3WpI
Η δυσκολία του μοντέλου SIR, έγκειται στο ότι εμπλέκει μη γραμμικές διαφορικές εξισώσεις. Παρόλα αυτά, ακριβείς παραμετρικές λύσεις έχουν βρεθεί και δημοσιευθεί:
https://arxiv.org/abs/1403.2160
Στην ανάρτηση αυτή, χάριν ευκολίας θα παρουσιάσουμε ένα απλούστερο μοντέλο, η λύση του οποίου όμως δεν διαφέρει σημαντικά από τη λύση του SIR στην αρχή της εξέλιξης της επιδημίας. Το μοντέλο που θα χρησιμοποιήσουμε εμπίπτει στο πρότυπο πρόβλημα της εξάπλωσης επιδημίας του μαθηματικού κλάδου των διαφορικών εξισώσεων [1]. Στο μοντέλο αυτό, θεωρούμε ότι ο ρυθμός μετάδοσης της επιδημίας είναι ανάλογος τόσο του μέρους του πληθυσμού που φέρει τον ιό, όσο και του υπόλοιπου μέρους του πληθυσμού που δεν νοσεί, αλλά είναι ευάλωτο στον ιό. Αυτό διαισθητικά μπορεί να γίνει αντιληπτό ως εξής: Ασφαλώς όσο περισσότεροι άνθρωποι φέρουν τον ιό, τόσο αυξάνονται οι πιθανότητες αυτός να μεταδοθεί σε άλλους. Όμως, ταυτόχρονα τόσο λιγότεροι είναι και οι πιθανοί καινούργιοι φορείς. Προφανώς κανείς δεν μεταδίδει τον ιό σε κάποιον που ήδη νοσεί. Συνεπώς, όσο εξαπλώνεται η επιδημία, τόσο συρρικνώνεται το σύνολο των δυνάμει νοσούντων. Αυτός είναι και ο λόγος που τελικά η εξάπλωση δεν ακολουθεί εκθετικό ρυθμό, καθώς η ίδια η εξάπλωση τελικά εμποδίζει τον εαυτό της στη διαδικασία της περαιτέρω εξάπλωσης.
Η παραπάνω διπλή σχέση αναλογίας μπορεί να γραφεί μαθηματικά ως εξής:
\[ \frac{dP(t)}{dt} = \alpha P(t) \left( 1-P(t) \right)\,\,\,\,\,\,\,\,\,\,(1) \]
όπου \( P(t) \) συμβολίζει το ποσοστό του πληθυσμού που έχει νοσήσει και είναι κανονικοποιημένο στο διάστημα \( [0,1] \), όπου το 0 σημαίνει ότι δεν νοσεί κανείς, ενώ το 1 σημαίνει ότι νοσεί το σύνολο του πληθυσμού και φυσικά κάθε τιμή ανάμεσα στο 0 και το 1 δηλώνει το ποσοστό επί τις εκατό των ανθρώπων που νοσούν. Ασφαλώς το \( P(t) \) είναι συνάρτηση του χρόνου που συμβολίζεται με \( t \). Επιπλέον, \( \frac{dP(t)}{dt} \) είναι η παράγωγος της συνάρτησης \( P(t) \) και εκφράζει το ρυθμό μεταβολής (αύξησης) του ποσοστού των νοσούντων με την πάροδο του χρόνου \( t \). Τέλος, $\alpha$ είναι ο συντελεστής αναλογίας που καθορίζει πόσο απότομα ξεκινάει η αύξηση των κρουσμάτων, αλλά και πόσο απότομα τελικά μειώνεται.
Προτού προχωρήσουμε στην παρουσίαση της λύσης, θα πρέπει να επισημάνουμε ότι το πραγματικό πρόβλημα είναι ένα διακριτό πρόβλημα που λύνεται με τη βοήθεια εξισώσεων διαφορών. Ωστόσο, χάριν απλότητας, το μετασχηματίσαμε στο αντίστοιχο συνεχές πρόβλημα.
Η (1) γράφεται και ως
\[ \frac{dP(t)}{P(t) \left( 1-P(t) \right)} = \alpha \, dt \]
και αποτελεί μια διαφορική εξίσωση χωριζομένων μεταβλητών. Ολοκληρώνοντας κατά μέλη λαμβάνουμε
\[ \int \frac{dP(t)}{P(t) \left( 1-P(t) \right)}= \int \alpha dt\,\,\,\,\,\,\,\,\,\,(2) \]
\[ \frac{1}{P(t) \left( 1-P(t) \right)} = \frac{1}{P(t)} + \frac{1}{1-P(t)} \]
η (2) γίνεται \[ \int \frac{1}{P(t)} dP(t) + \int \frac{1}{1-P(t)} dP(t) = \int \alpha dt \Leftrightarrow \]
\[ ln(P(t)) - ln(1-P(t)) = \alpha \, t + c \]
όπου \( c \) η σταθερά ολοκλήρωσης και \( ln \) ο λογάριθμος με βάση το \( e \). Συνεχίζοντας, από τη βασική ιδιότητα του αθροίσματος λογαρίθμων έχουμε\[ ln(P(t)) - ln(1-P(t)) = \alpha \, t + c \]
\[ ln\frac{P(t)}{1-P(t)} = \alpha \, t + c \Leftrightarrow \]
\[ \frac{P(t)}{1-P(t)} = e^{\alpha \, t + c} \Leftrightarrow \]
\[ P(t) = \left( 1-P(t) \right) e^{\alpha \, t + c} \Leftrightarrow \]
\[ P(t) + P(t) e^{\alpha \, t + c} = e^{\alpha \, t + c} \Leftrightarrow \]
\[ P(t) \left( 1 + e^{\alpha \, t + c} \right) = e^{\alpha \, t + c} \Leftrightarrow \]
\[ P(t) = \frac{e^{\alpha \, t + c}}{1 + e^{\alpha \, t + c}} \Leftrightarrow \]
\[ P(t) = \frac{1}{1 + e^{-(\alpha \, t + c)}} \]
Η προκύπτουσα συνάρτηση αποτελεί τη λογιστική καμπύλη που αναφέρθηκε παραπάνω. Η γενική μορφή της γραφικής της παράστασης φαίνεται στο Διάγραμμα 1, εξ ου και η ονομασία σιγμοειδής, αφού μοιάζει με το τελικό «σίγμα». Από το διάγραμμα είναι φανερό ότι αρχικά το πλήθος των ασθενών παρουσιάζει προσεγγιστικά εκθετική αύξηση. Ωστόσο, καθώς τα κρούσματα αυξάνονται, ο ρυθμός μετάδοσης μειώνεται μέχρι ένα σημείο, στο οποίο η καμπύλη στιγμιαία παίρνει γραμμική μορφή. Έπειτα από αυτό το σημείο η κατάσταση αντιστρέφεται. Αν και το πλήθος των νοσούντων εξακολουθεί να αυξάνεται, ο ρυθμός μετάδοσης αρχίζει να μειώνεται μέχρι το πλήθος να φτάσει στη μέγιστη τιμή που αντιστοιχεί στο σύνολο του πληθυσμού.
Διάγραμμα 1. Η λογιστική ή σιγμοειδής καμπύλη. |
Φυσικά, το παραπάνω είναι ένα εξιδανικευμένο μαθηματικό μοντέλο, το οποίο δεν κάνει καμία άλλη υπόθεση πέρα από την απλή υπόθεση της αναλογίας του ρυθμού μετάδοσης που αναφέρθηκε στην αρχή. Στην πραγματικότητα, η κατάσταση διαφέρει καθώς με την εφαρμογή περιοριστικών μέτρων, αλλά και με την προφύλαξη που απορρέει από την ατομική ευθύνη του καθενός, η κατάσταση δεν αφήνεται στο έλεος της. Σε πρώτο στάδιο, μεγάλη επιτυχία προς την καταπολέμηση της εξάπλωσης θεωρείται αν ο ρυθμός μετάδοσης σταθεροποιηθεί, οπότε έχουμε τη γραμμικοποίηση της καμπύλης. Στην περίπτωση αυτή, σε κάθε συγκεκριμένη χρονική περίοδο, π.χ., κάθε μέρα, προστίθεται ο ίδιος αριθμός νέων κρουσμάτων στο σύνολο των ήδη υπαρχόντων. Ο επόμενος στόχος που σηματοδοτεί τη νίκη απέναντι στην επιδημία είναι να μηδενιστεί ο ρυθμός εξάπλωσης. Εφόσον συμβεί αυτό, κανένα νέο κρούσμα δεν θα προστεθεί και αφού κλείσουν όλες οι τρέχουσες υποθέσεις ασθενών, θα εξαλειφθεί οριστικά η επιδημία.
Ας περάσουμε τώρα σε ένα συγκεκριμένο παράδειγμα που θα ξεκαθαρίσει ακόμα περισσότερο το τοπίο. Θεωρούμε ότι η μονάδα μέτρησης του χρόνου \( t \) είναι η ώρα. Έστω ότι την 5η μέρα τα κρούσματα είναι 7 και την 10η μέρα τα κρούσματα ανέρχονται σε 66, όπως έχει δηλαδή η κατάσταση στην Ελλάδα1. Τότε έχουμε τις αρχικές συνθήκες \( P(120) = 7 \times 10^{-7} \) και \( P(240) = 66 \times 10^{-7} \). Αν αντικαταστήσουμε τις τιμές αυτές στη γενική λύση που βρήκαμε παραπάνω, υπολογίζουμε ότι \( c = -16.349 \) και \( \alpha = 0.0193 \), οπότε η λύση στο πρόβλημά μας παίρνει τη μορφή \( P(t) = \frac{1}{1+e^{-0.0193 \, t + 16.349}} \).
Διάγραμμα 2. Η εξάπλωση της επιδημίας με βάση τις αρχικές συνθήκες που αναφέρονται παραπάνω. |
Η γραφική παράσταση αυτής της συνάρτησης απεικονίζεται στο Διάγραμμα 2. Στο διάγραμμα αυτό, για λόγους καλύτερης παρουσίασης, ως μονάδα μέτρησης του χρόνου (οριζόντιος άξονας) έχει χρησιμοποιηθεί η μία μέρα. Από το Διάγραμμα 2 παρατηρούμε ότι παρά τον σχετικά αργό ρυθμό αύξησης των κρουσμάτων τις πρώτες μέρες, κάποια στιγμή η εξάπλωση της επιδημίας εμφανίζει δραματική καμπή καθώς σε περίπου 38 μέρες θα έχει μολυνθεί ο μισός πληθυσμός. Το σημείο αυτό είναι γνωστό και με τον αγγλικό όρο «midpoint». Η ραγδαία αύξηση μάλιστα συνεχίζεται για μερικές ακόμη ημέρες (περίπου μία εβδομάδα) ώσπου αρχίζει να χαλαρώνει γύρω στις 45 μέρες, όταν ήδη έχει νοσήσει σχεδόν το σύνολο του πληθυσμού! Υπενθυμίζουμε ότι στην πραγματικότητα τελικά δεν θα νοσήσει ο συνολικός πληθυσμός διότι με τη λήψη μέτρων σε ατομικό και συλλογικό επίπεδο οι άνθρωποι αντιστεκόμαστε στην εξάπλωση της επιδημίας.
Όλα καλά ως εδώ. Γιατί όμως εμφανίζεται ο αριθμός \( e \) στη λύση της εξάπλωσης της επιδημίας; Ποια ιδιότητα έχει αυτός ο αριθμός που τον καθιστά ιδιαίτερο στο βασίλειο των πραγματικών αριθμών; Αν σας ενδιαφέρει η απάντηση ρωτήστε τον Occam!
Ο William του Ockham2 (1287-1347) ήταν θεολόγος-φιλόσοφος και ανήκε στο τάγμα των Φραγκισκανών. Ασχολήθηκε εντατικά με τη Λογική και με την Φυσική και έμεινε γνωστός στην ιστορία για το περίφημο «ξυράφι» του. Το ξυράφι του Occam ή Occam's razor στα αγγλικά είναι η φιλοσοφική αρχή που υπαγορεύει ότι από όλες τις δυνατές εξηγήσεις ενός φαινομένου, προτιμότερη είναι εκείνη που βασίζεται στις λιγότερες υποθέσεις. Το ξυράφι του Occam θα λέγαμε ότι «ξυρίζει» τις περιττές υποθέσεις κρατώντας μόνο τις απολύτως απαραίτητες. Πράγματι, αυτός είναι και ο τρόπος με τον οποίο αντιμετωπίζουμε οι άνθρωποι τα καθημερινά μας προβλήματα. Ξεκινάμε από τις λιγότερες δυνατές υποθέσεις και μόνο αν αυτές δεν είναι ικανές να μας οδηγήσουν στη λύση προσθέτουμε επιπλέον υποθέσεις.
Λόγω της ιδιαίτερης αγάπης που τρέφει αυτή η αρχή προς τις λακωνικές εξηγήσεις, έγινε επίσης γνωστή και ως η αρχή της οικονομίας (lex parsimoniae στα λατινικά). Ποια είναι όμως η σχέση αυτής της αρχής με τον αριθμό \( e \); Προηγουμένως, στην παρουσίαση του μοντέλου για την εξάπλωση της επιδημίας, εμφανίστηκε η σχέση διπλής αναλογίας
\[ \frac{dP(t)}{dt} = \alpha P(t) \left( 1-P(t) \right) \]
η οποία γράφεται και ως\[ \frac{dP(t)}{dt} = \alpha \left( P(t) - P^2(t) \right)\,\,\,\,\,\,\,\,\,\,(3) \]
Από τον ορισμό του \( P(t) \), για κάθε τιμή του χρόνου \( t \) ισχύει \( P(t) \le 1 \). Επιπλέον, στα πρώτα στάδια της εξάπλωσης της επιδημίας (για μικρά \( t \) δηλαδή) η ποσότητα \( P^2(t) \) μπορεί να θεωρηθεί πολύ μικρότερη της \( P(t) \) και ως εκ τούτου να παραληφθεί χωρίς να προκαλέσει μεγάλη αλλοίωση στην ακριβή λύση του προβλήματος. Η εξίσωση (3) απλοποιείται τότε στην\[ \frac{dP(t)}{dt} = \alpha P(t)\,\,\,\,\,\,\,\,\,\,(4) \]
Έχουμε δηλαδή προσεγγιστικά μια γνήσια αναλογία του ρυθμού μεταβολής \( \frac{dP(t)}{dt} \) με την συνάρτηση \( P(t) \). Συνεπώς, στο διάστημα ισχύος της (4), αναζητούμε τη συνάρτηση εκείνη η οποία ταυτίζεται με το ρυθμό μεταβολής της (κατά προσέγγιση φυσικά της σταθεράς \( \alpha \)). Μία από τις σημάντικότερες ιδιότητες του αριθμού e είναι το γεγονός ότι όταν υψώνεται στη δύναμη \( x \), όταν δηλαδή πολλαπλασιάζεται με τον εαυτό του \( x \) φορές, δημιουργεί τη μοναδική συνάρτηση, εκτός φυσικά από τη μηδενική, της οποίας η παράγωγος συνάρτηση είναι ίδια με την αρχική. Όμως, καθώς η παράγωγος μιας συνάρτησης δηλώνει το ρυθμό μεταβολής της αρχικής συνάρτησης, η \( e^x \) μας λέει από μόνη της σε κάθε σημείο του πεδίου ορισμού της με ποιον ρυθμό μεταβάλλεται! Επειδή η μεταβολή της \( e^x \) είναι αυξανόμενη, όσο αυξάνεται η τιμή της σε ένα σημείο, τόσο αυξάνεται και ο ρυθμός με τον οποίο αυξάνεται η τιμή της στο ίδιο σημείο! Μάλιστα, η παράγωγος της παραγώγου της \( e^x \) είναι και πάλι \( e^x \). Συνεπώς με τον ίδιο ρυθμό μεταβάλλεται και ο ρυθμός μεταβολής της \( e^x \). Συνεχίζοντας, με τον ίδιο ρυθμό μεταβάλλεται και ο ρυθμός μεταβολής του ρυθμού μεταβολής της \( e^x \) και πάει λέγοντας! Με ένα σμπάρο άπειρα τριγώνια δηλαδή! Γιατί όμως αυτό συμβαίνει μόνο με την εκθετική συνάρτηση \( e^x \);
Ας αναζητήσουμε τη συνάρτηση \( f:\mathbb{R} \rightarrow \mathbb{R} \) με παραγώγους κάθε τάξης, για την οποία ισχύει ότι σε κάθε σημείο \( x \) του πεδίου ορισμού της, \( f'(x) = f(x) \). Από τον Διαφορικό Λογισμό, ισχύει στοιχειωδώς ότι αν γνωρίζουμε την τιμή της \( f \) σε κάποιο σημείο \( t_0 \), τότε μπορούμε να εκτιμήσουμε την τιμή της \( f \) σε κάποιο «γειτονικό» σημείο \( t \) με τον τύπο
\[ f(t) = f(t_0) + f'(t_0) (t-t_0)\,\,\,\,\,\,\,\,\,\,(5) \]
Δηλαδή για να φτάσουμε στο \( f(t) \), ξεκινάμε από το \( f(t_0) \) και «μετακινούμαστε» στο διάστημα \( t-t_0 \) κατά το ρυθμό μεταβολής \( f'(t_0) \). Αυτό θυμίζει το ανάλογο συμπέρασμα της ευθύγραμμης ομαλής κίνησης στη φυσική, σύμφωνα με το οποίο αν τη χρονική στιγμή \( t_0 \) βρισκόμαστε στη θέση \( x(t_0) \), τότε τη χρονική στιγμή \( t \) η νέα μας θέση θα είναι \( x(t) = x(t_0) + u(t_0) (t-t_0) \), όπου \( u(t_0) \) είναι η ταχύτητά μας τη χρονική στιγμή \( t_0 \). Χωρίς περιορισμο της γενικότητας, στα επόμενα θεωρούμε ότι \( t>t_0 \). Για να πετύχουμε ακριβέστερη εκτίμηση, χρησιμοποιούμε την εξής διαμέριση του διαστήματος \( [t_0,t] \):
\[ [t_0,t_0+\frac{t-t_0}{n}], \, [t_0+\frac{t-t_0}{n},t_0+\frac{2(t-t_0)}{n}], \, \dots, \, [t_0+\frac{(n-1)(t-t_0)}{n},t] \]
Χωρίζουμε δηλαδή το διάστημα \( [t_0,t] \) σε \( n \) ίσα τμήματα και εφαρμόζουμε την (5) σε κάθε τμήμα. Προφανώς, όσο μεγαλύτερο είναι το \( n \), τόσο ακριβέστερη είναι και η προσέγγιση της τιμής \( f(t) \). Με αυτόν τον τρόπο κατασκευάζουμε μια ακολουθία συναρτήσεων \( f_n \), η οποία σε καθένα από τα \( n \) υποδιαστήματα του \( [t_0,t] \) ορίζεται ως εξής:\[ [t_0,t_0+\frac{t-t_0}{n}]: \,\,\,\,\,\,\, f_n(t_0+\frac{t-t_0}{n}) = \]
\[ f(t_0) + f'(t_0) \frac{t-t_0}{n} = f(t_0) + f(t_0) \frac{t-t_0}{n} = \]
\[ f(t_0) \left( 1 + \frac{t-t_0}{n} \right) \]
\[ f(t_0) + f'(t_0) \frac{t-t_0}{n} = f(t_0) + f(t_0) \frac{t-t_0}{n} = \]
\[ f(t_0) \left( 1 + \frac{t-t_0}{n} \right) \]
\[ [t_0+\frac{t-t_0}{n},t_0+\frac{2(t-t_0)}{n}]: \,\,\,\,\,\, f_n(t_0+\frac{2(t-t_0)}{n}) = \]
\[ f(t_0+\frac{t-t_0}{n}) + f'(t_0+\frac{t-t_0}{n}) \frac{t-t_0}{n} = \]
\[ f(t_0+\frac{t-t_0}{n}) + f(t_0+\frac{t-t_0}{n}) \frac{t-t_0}{n}= \]
\[ f(t_0+\frac{t-t_0}{n}) \left( 1 + \frac{t-t_0}{n} \right) = f(t_0) \left( 1 + \frac{t-t_0}{n} \right)^2 \]
\[ f(t_0+\frac{t-t_0}{n}) + f'(t_0+\frac{t-t_0}{n}) \frac{t-t_0}{n} = \]
\[ f(t_0+\frac{t-t_0}{n}) + f(t_0+\frac{t-t_0}{n}) \frac{t-t_0}{n}= \]
\[ f(t_0+\frac{t-t_0}{n}) \left( 1 + \frac{t-t_0}{n} \right) = f(t_0) \left( 1 + \frac{t-t_0}{n} \right)^2 \]
\[ \vdots \]
\[ [t_0+\frac{(n-2)(t-t_0)}{n},t_0+\frac{(n-1)(t-t_0)}{n}]: \,\,\,\,\,\, f_n(t_0+\frac{(n-1)(t-t_0)}{n}) = \]
\[ f(t_0+\frac{(n-2)(t-t_0)}{n}) + f'(t_0+\frac{(n-2)(t-t_0)}{n}) \frac{t-t_0}{n} = \]
\[ f(t_0+\frac{(n-2)(t-t_0)}{n}) + f(t_0+\frac{(n-2)(t-t_0)}{n}) \frac{t-t_0}{n} = \]
\[ f(t_0+\frac{(n-2)(t-t_0)}{n}) \left( 1 + \frac{t-t_0}{n} \right) = f(t_0) \left( 1 + \frac{t-t_0}{n} \right)^{n-1} \]
\[ f(t_0+\frac{(n-2)(t-t_0)}{n}) + f'(t_0+\frac{(n-2)(t-t_0)}{n}) \frac{t-t_0}{n} = \]
\[ f(t_0+\frac{(n-2)(t-t_0)}{n}) + f(t_0+\frac{(n-2)(t-t_0)}{n}) \frac{t-t_0}{n} = \]
\[ f(t_0+\frac{(n-2)(t-t_0)}{n}) \left( 1 + \frac{t-t_0}{n} \right) = f(t_0) \left( 1 + \frac{t-t_0}{n} \right)^{n-1} \]
\[ [t_0+\frac{(n-1)(t-t_0)}{n},t]: \,\,\,\,\,\, f_n(t) = \]
\[ f(t_0+\frac{(n-1)(t-t_0)}{n}) + f'(t_0+\frac{(n-1)(t-t_0)}{n}) \frac{t}{n} = \]
\[ f(t_0+\frac{(n-1)(t-t_0)}{n}) + f(t_0+\frac{(n-1)(t-t_0)}{n}) \frac{t-t_0}{n} = \]
\[ f(t_0+\frac{(n-1)(t-t_0)}{n}) \left( 1 + \frac{t-t_0}{n} \right) = f(t_0) \left( 1 + \frac{t-t_0}{n} \right)^n\,\,\,\,\,\,\,\,\,\,(6) \]
\[ f(t_0+\frac{(n-1)(t-t_0)}{n}) + f'(t_0+\frac{(n-1)(t-t_0)}{n}) \frac{t}{n} = \]
\[ f(t_0+\frac{(n-1)(t-t_0)}{n}) + f(t_0+\frac{(n-1)(t-t_0)}{n}) \frac{t-t_0}{n} = \]
\[ f(t_0+\frac{(n-1)(t-t_0)}{n}) \left( 1 + \frac{t-t_0}{n} \right) = f(t_0) \left( 1 + \frac{t-t_0}{n} \right)^n\,\,\,\,\,\,\,\,\,\,(6) \]
Ας πάρουμε για παράδειγμα \( n=2 \). Επίσης, χάριν απλότητας θέτουμε \( t_0=0 \). Αυτό σημαίνει ότι χωρίζουμε το διάστημα \( [0,t] \) στα δύο ίσα μέρη \( [0,\frac{t}{2}] \) και \( [\frac{t}{2},t] \). Στην περίπτωση αυτή, με μια αδρή προσέγγιση παίρνουμε:
\[ f_2(t)=f(0) \left(1 + \frac{t}{2}\right)^2 \]
Φυσικά όσο μεγαλύτερο είναι το πλήθος \( n \) των υποδιαστημάτων, τόσο καλύτερη γίνεται και η προσέγγιση της τιμής \( f(t) \). Μάλιστα στο όριο, καθώς το \( n \) τείνει στο άπειρο, θα λάβουμε την ακριβή τιμή του \( f(t) \). Δηλαδή:
\[ f(t) = f_{\infty}(t) = \lim_{n \rightarrow \infty} \Big[f(0) \left( 1 + \frac{t}{n} \right)^n\Big] = f(0) \cdot \lim_{n \rightarrow \infty} \left( 1 + \frac{t}{n} \right)^n \]
Όμως, για δεδομένο \( t \), ισχύει:
\[ \lim_{n \rightarrow \infty} \left( 1 + \frac{t}{n} \right)^n = \lim_{u \rightarrow \infty} \left( 1 + \frac{t}{ut} \right)^{ut} = \Big[\lim_{u \rightarrow \infty} \left( 1 + \frac{1}{u} \right)^u\Big]^t = e^t \]
\[ e = \lim_{u \rightarrow \infty} \left( 1 + \frac{1}{u} \right)^u \]
και ιδού γιατί εμφανίζεται ο αριθμός \( e \)! Συνοψίζοντας, υπό μία έννοια η εκθετική συνάρτηση \( e^t \) είναι η οικονομικότερη συνάρτηση, καθώς για την περιγραφή της δεν χρειαζόμαστε καμία επιπλέον πληροφορία για τις παραγώγους της. Η πληροφορία αυτή περικλέιεται μέσα στην ίδια τη συνάρτηση. Κατά κάποιον τρόπο θα λέγαμε ότι η επιδημία δείχνει να ενστερνίζεται την αρχή της οικονομίας που πρότεινε ο William του Occam!
Η αρχή της οικονομικότερης εκδοχής άλλωστε απαντάται σε πληθώρα από φυσικά φαινόμενα. Παράδειγμα αποτελεί το σφαιρικό σχήμα της σταγόνας. Με βάση τη γενίκευση ενός θεωρήματος της Διαφορικής Γεωμετρίας, που φέρει το όνομα «ισοπεριμετρική ανισότητα», δεδομένου του όγκου μιας ποσότητας νερού, η σφαίρα είναι το σχήμα με τη μικρότερη επιφάνεια που φέρει την ποσότητα αυτή. Έτσι, θα λέγαμε ότι η φύση κουβαλάει το δικό της «ξυράφι» δείχνοντας την προτίμησή της στις σφαίρες έναντι των άλλων σχημάτων.
Η αρχή της οικονομίας όμως κάνει την εμφάνισή της και μέσω της εφαρμογής των ίδιων μαθηματικών εργαλείων σε εντελώς διαφορετικά προβλήματα. Εξηγώ.
Ας επιστρέψουμε στον τύπο (6), ο οποίος εκφράζει την \( n \)-οστή προσέγγιση της \( f(t) \), τον οποίο για ευκολία ξαναγράφουμε παρακάτω, για \( t_0=0 \):
Η αρχή της οικονομικότερης εκδοχής άλλωστε απαντάται σε πληθώρα από φυσικά φαινόμενα. Παράδειγμα αποτελεί το σφαιρικό σχήμα της σταγόνας. Με βάση τη γενίκευση ενός θεωρήματος της Διαφορικής Γεωμετρίας, που φέρει το όνομα «ισοπεριμετρική ανισότητα», δεδομένου του όγκου μιας ποσότητας νερού, η σφαίρα είναι το σχήμα με τη μικρότερη επιφάνεια που φέρει την ποσότητα αυτή. Έτσι, θα λέγαμε ότι η φύση κουβαλάει το δικό της «ξυράφι» δείχνοντας την προτίμησή της στις σφαίρες έναντι των άλλων σχημάτων.
Η αρχή της οικονομίας όμως κάνει την εμφάνισή της και μέσω της εφαρμογής των ίδιων μαθηματικών εργαλείων σε εντελώς διαφορετικά προβλήματα. Εξηγώ.
Ας επιστρέψουμε στον τύπο (6), ο οποίος εκφράζει την \( n \)-οστή προσέγγιση της \( f(t) \), τον οποίο για ευκολία ξαναγράφουμε παρακάτω, για \( t_0=0 \):
\[ f_n(t) = (1+\frac{t}{n})^n \]
\[ f_n(t) = 1 + n \frac{t}{n} + \binom{n}{2} \frac{t^2}{n^2} + \binom{n}{3} \frac{t^3}{n^3} + \dots + \binom{n}{n-1} \frac{t^{t-1}}{n^{t-1}} + \frac{t^n}{n^n}= \]
\[ 1 + t + \frac{n!}{(n-2)! n^2} \frac{t^2}{2!} + \frac{n!}{(n-3)! n^3} \frac{t^3}{3!} + \dots + \frac{n!}{2! n^{n-1}} \frac{t^{n-1}}{(n-1)!} + \frac{n!}{n^n} \frac{t^n}{n!}= \]
\[ \alpha_0 \frac{t^0}{0!} + \alpha_1 \frac{t^1}{1!} + \alpha_2 \frac{t^2}{2!} + \dots + \alpha_{n-1} \frac{t^{n-1}}{(n-1)!} + \alpha_n \frac{t^n}{n!} = \sum_{k=0}^n \alpha_k \frac{t^k}{k!}\,\,\,\,\,\,\,\,\,\,(7) \]
όπου θέσαμε
\[ \alpha_k = \frac{n!}{(n-k)! n^k}\,\,\,\,\,\,\,\,\,\,(8) \]
Η σχέση (7) ουσιαστικά αποτελεί το ανάπτυγμα Taylor της \( f_n(t) \) με συντελεστές \( \alpha_k \). Από τη σχέση (8) όμως, για κάθε \( k \), ο συντελεστής \( \alpha_k \) εκφράζει την πιθανότητα σε ένα πλήθος \( n \) διαφορετικών αντικειμένων να επιλέξουμε με επανάθεση \( k \) από αυτά και όλα τα αντικείμενα που θα επιλέξουμε να είναι διαφορετικά μεταξύ τους. Η πρόταση αυτή μπορεί να μην βγάζει ιδιαίτερο νόημα, αν όμως θέσουμε \( n=365 \), τότε το \( \alpha_k \) μας δίνει την πιθανότητα ανάμεσα σε \( k \) τυχαίους ανθρώπους, όλοι να έχουν τα γενέθλιά τους σε διαφορετικές μέρες. Ισοδύναμα, το \( 1-\alpha_k \) μας δίνει την πιθανότητα ανάμεσα σε \( k \) τυχαίους ανθρώπους, δύο τουλάχιστον να έχουν γενέθλια την ίδια μέρα. Καταλήγουμε δηλαδή στο γνωστό πρόβλημα των γενεθλίων. Καθώς το πρόβλημα των γενεθλίων θα μπορούσε να είναι από μόνο του το θέμα μιας άλλης ανάρτησης, να αναφέρουμε απλώς ότι ανάμεσα σε 23 άτομα, η πιθανότητα δύο τουλάχιστον από αυτά να έχουν την ίδια μέρα γενέθλια είναι λίγο πάνω από \( 50\% \)! Επειδή το αποτέλεσμα αυτό πηγαίνει κόντρα στη διαίσθηση, το πρόβλημα των γενεθλίων καλείται συχνά και παράδοξο.
Κλείνοντας, αξίζει να τονίσουμε ότι αν στη σχέση (7) πάρουμε το όριο για \( n \rightarrow \infty \), επειδή για κάθε \( k \)
Κλείνοντας, αξίζει να τονίσουμε ότι αν στη σχέση (7) πάρουμε το όριο για \( n \rightarrow \infty \), επειδή για κάθε \( k \)
\[ \lim_{n \rightarrow \infty} \alpha_k = \lim_{n \rightarrow \infty} \frac{n!}{(n-k)! n^k} = 1 \]
λαμβάνουμε το γνωστό από την ανάλυση ανάπτυγμα του Taylor της \( e^t \):\[ e^t = 1+t+\frac{t^2}{2!}+\frac{t^3}{3!}+\dots \]
Στο άρθρο αυτό είδαμε κάποιες συγκεκριμένες ενδιαφέρουσες περιπτώσεις εφαρμογής του ξυραφιού του Occam. Η λίστα ωστόσο είναι ατελείωτη. Μάλιστα, εγώ έχω βρει έναν ιδιαίτερο τρόπο να εφαρμόζω το ξυράφι του Occam στο πρόσωπό μου. Τα τελευταία χρόνια έχω κόψει το ξύρισμα και με αυτόν τον τρόπο κάνω οικονομία στα ξυράφια μου.
2 Το Ockham είναι ένα μικρό χωριό στην κομητεία του Surray στην νοτιοανατολική Αγγλιά, το οποίο στο προσωνύμιο του William εκλατινίστηκε σε Occam.
[1] Διαφορικές Εξισώσεις, Θωμάς Κυβεντίδης, 2004, ISBN: 960-8183-40-5