Είναι κοινώς αποδεκτό ότι μια επιτυχημένη αντιμετώπιση οποιασδήποτε ασθένειας έχει σαν θεμέλιο την έγκαιρη και ακριβή διάγνωση. Η διάγνωση του καρκίνου όταν αναφερόμαστε σε ασθένειες όπως διαφορετικές μορφές καρκίνου, ή άλλες (καταληκτικές ή μη) ασθένειες, είναι μια ατελής διαδικασία και βασίζεται συχνά στη χρήση (βιο)-δεικτών γνωστοί και ως διαγνωστικοί έλεγχοι/τεστ. Αυτά τα τεστ μπορεί να αφορούν μεταξύ άλλων σε μια εξέταση αίματος ή σε οπτικά μέσα όπως ακτινογραφίες/(f)ΜRΙ/CT scan κλπ. Έτσι μπορεί να γίνει ποσοτικοποίηση των διαφόρων παραγόντων που μπορεί να είναι δεικτικοί για την ύπαρξη της ασθένειας, για παράδειγμα συγκέντρωση αντισωμάτων/πρωτεϊνών σε συγκεκριμένη ποσότητα αίματος, ή διαστάσεις ύποπτων απεικονίσεων όταν μιλάμε για οπτικοποίηση, πχ μέγεθος και μορφολογία όγκου/κύστης κλπ. Όλα τα προηγούμενα παραδείγματα αφορούν σε διαγνωστικούς ελέγχους που δεν είναι δίτιμοι, δλδ δεν προσφέρουν σαν αποτέλεσμα μια θετική/αρνητική μέτρηση με βάση την οποία θα κάνουμε εκτίμηση υπάρξης ή μη ύπαρξης της ασθένειας. Αντίθετα προσφέρουν μια μέτρηση η οποία πρέπει να αξιολογηθεί σαν ύποπτη ή όχι.
Χρειάζεται προσοχή όταν κάποιος προσπαθεί να ερμηνεύσει ποσοτικά την ακρίβεια κάποιου τεστ. Χαρακτηριστικό παράδειγμα είναι ένα απλό δίτιμο τεστ εγκυμοσύνης που ισχυρίζεται στην συσκευασία του ή διαφημίζεται ότι μπορεί να έχει κάποια συγκεκριμένη ακρίβεια α%. Ένα τέτοιο ποσοστό δεν δίνει κάποια κατανοητή πληροφορία παρόλο που η ενδιαφερόμενη μπορεί να το θεωρήσει φοβερά αξιόπιστο εξαιτίας του μεγάλου ποσοστού. Με λίγη παραπάνω σκέψη είναι εύκολο να διαπιστώσει κανείς ότι αυτό το ποσοστό μπορεί να αναφέρεται σε ένα πλήθος γεγονότων: α) Εκφράζει την πιθανότητα να βγει τo τεστ θετικό δεδομένης της εγκυμοσύνης? β) Εκφράζει την πιθανότητα να βγει αρνητικό δεδομένης της ανυπαρξίας εγκυμοσύνης? γ) Εκφράζει την πιθανότητα της εγκυμοσύνης δεδομένου του θετικού αποτελέσματος? δ) Εκφράζει την πιθανότητα της ανυπαρξίας εγκυμοσύνης δεδομένου του αρνητικού αποτελέσματος? Όλα τα παραπάνω ερωτήματα εξετάζουν πολύ διαφορετικά πράγματα και αυτό είναι κατανοητό αν σκεφτεί κανείς την ακόλουθη ακραία κατάσταση σαν παράδειγμα: Ας φανταστούμε ένα τεστ εγκυμοσύνης που βγάζει πάντα θετικό αποτέλεσμα. Ένα τέτοιο τεστ καταλαβαίνουμε όλοι ότι είναι αναξιόπιστο, ωστόσο είναι προφανές ότι η πιθανότητα να βγει θετικό δεδομένης της εγκυμοσύνης είναι 100%. Φυσικά, η πιθανότητα να βγει αρνητικό ενώ δεν υπάρχει εγκυμοσύνη είναι 0%. Και όλα αυτά ενώ την ενδιαφερόμενη μάλλον την απασχολούν τα τελευταία δύο ερωτήματα (δλδ τα γ και δ). Από αυτό το παράδειγμα είναι κατανοητό ότι η ακρίβεια ενός δίτιμου διαγνωστικού ελέγχου δε μπορεί να συνοψιστεί σε ένα ποσοστό. Ακόμα και αν υποθέσει κανείς ότι το ποσοστό αυτό αναφέρεται στην πιθανότητα ότι το τεστ “έχει δίκιο” τα προαναφερόμενα ποσοστά σε κάθε ερώτημα ξεχωριστά μπορεί να είναι διαφορετικά το ένα από το άλλο. Αν και τα τεστ εγκυμοσύνης είναι σήμερα αξιόπιστα, το προηγούμενο παράδειγμα μπορεί να καταδείξει τη σημασία της ερμηνείας των αποτελεσμάτων όταν μιλάμε για σοβαρές ασθένειες.
Τα πράγματα γίνονται αρκετά πιο πολύπλοκα κατα την αξιολόγηση τεστ τα οποία δίνουν μετρήσεις σε μια κλίμακα ή ποσοτικοποιούν κάτι (όπως γίνεται συνήθως σε μια αιματολογική εξέταση), και όχι απλώς ένα δίτιμο αποτέλεσμα. Η τυπική στατιστική μεθοδολογία που εφαρμόζεται για να εξεταστεί η ακρίβεια τέτοιων τεστ είναι η τεχνική ROC (receiver operating characteristic) που πρωτοχρησιμοποιήθηκε στον δεύτερο παγκόσμιο πόλεμο για στρατιωτικούς σκοπούς και συγκεκριμένα για την αξιοπιστία των ραντάρ τα οποία εγγενώς υπάγονται σε μια κατηγορία “διαγνωστικού ελέγχου”. Αυτό επειδή προσπαθούν να ανιχνεύσουν επιτυχώς την ύπαρξη “εχθρού” αντί για “ασθένειας”.
Σήμερα υπάρχει παγκόσμιο ενδιαφέρον για την εύρεση κατάλληλων βιοδεικτών με σκοπό την έγκαιρη διάγνωση διαφορετικών μορφών καρκίνου. Σαν αποτέλεσμα η Βιοστατιστική παίζει ηγετικό ρόλο ως κλάδος σε αυτήν την αναζήτηση. Όσον αφορά στη διάγνωση, η προαναφερθείσα τεχνική ROC εξελίσσεται συνεχώς τα τελευταία χρόνια έτσι ώστε να μπορεί να παρέχει έγκυρες εκτιμήσεις όταν πρόκειται για την ακρίβεια τέτοιων βιοδεικτών οι οποίοι μπορεί να επηρεάζονται από το προφίλ ενός ασθενή-τα ιδιαίτερα χαρακτηριστικά του, από τη χρονική στιγμή της μέτρησης καθώς και από πλήθος άλλων παραγόντων ελεγχόμενων η μη. Με την ίδια τεχνική μπορεί κανείς να βρει και κρίσιμα όρια απόφασης τα οποία υπαγορεύουν πότε κάποιο άτομο θα πρέπει να θεωρείται ότι νοσεί ή όχι. Ο ρόλος του ερευνητή βιοστατιστικού είναι διττός σε τέτοιου είδους έρευνες. Από τη μία να ενημερώνεται και να κάνει χρήση γνωστών στατιστικών μεθοδολογιών ώστε να μπορεί να ανιχνεύει ποιοι βιοδείκτες είναι αυτοί που καταδεικνύουν την ύπαρξη της ασθένειας και ποιοι είναι άχρηστοι, πως μεταβάλλονται στο χρόνο, ποια είναι τα ιδιαίτερα εξατομικευμένα χαρακτηριστικά ενός ατόμου που επηρεάζουν την αξιοπιστία των βιοδεικτών κλπ. Από την άλλη ασχολείται με το να αναπτύσσει καινούργιες και να εξελίσσει υπάρχουσες μαθηματικές/στατιστικές μεθοδολογίες, ώστε να μπορούν να αναλυθούν δεδομένα που μέχρι σήμερα δε μπορούσαν να αναλυθούν με κατάλληλο τρόπο. Όλα αυτά τα μαθηματικά εργαλεία είναι θεμελιώδους και κρίσιμης σημασίας μιας και τα αποτελέσματα που προσφέρουν (όπως όρια απόφασης για διάγνωση, ακρίβεια των τεστ, τρόπος που επηρεάζει το προφίλ πχ ηλικία, κάπνισμα κλπ) ανακοινώνονται, ύστερα από κάποιες διαδικασίες επαλήθευσης, στο ιατρικό/κλινικό προσωπικό ώστε αυτοί με τη σειρά τους να μπορέσουν να λάβουν αποφάσεις για τον τρόπο αντιμετώπισης ενός ασθενή σε μια κλινική.
Στο MD Anderson Cancer Center (MDACC) του πανεπιστημίου του Τέξας υπάρχει σημαντική δραστηριοποίηση στη διάγνωση του καρκίνου όσο και την έγκαιρη πρόγνωση. Είναι δύο διαφορετικά πράγματα μιας και κατά τη διαδικασία της πρόγνωσης το ενδιαφέρον δεν έγκειται στο να εκτιμήσουμε αν κάποιος είναι ασθενής ή υγιής στην παρούσα στιγμή, αλλά στο να προβλέψουμε μέσω μαθηματικών μοντέλων αν θα νοσήσει στο μέλλον, δεδομένου ότι σήμερα δε νοσεί. Αυτό αποτελεί τόσο βιολογικά όσο και μαθηματικά μία πρόκληση. Υπάρχουν ήδη ενδιαφέρουσες εξελίξεις που αφορούν στον καρκίνο του προστάτη, του παγκρέατος και του πνεύμονα.
https://www.youtube.com/watch?v=yJvCNikoeUc
Αξιοσημείωτο για τον καρκίνο του προστάτη είναι ότι ο μέχρι σήμερα πολύ διαδεδομένος βιοδείκτης PSΑ (prostate specific antigen) που χρησιμοποιείται ευρέως για τη λήψη αποφάσεων (screening) δεν έχει την επιθυμητή αξιοπιστία. Πιο συγκεκριμένα οδηγεί σε “υπερδιάγνωση” που σημαίνει ότι συχνά παρέχει αυξημένες μετρήσεις σε άτομα που δε νοσούν οδηγώντας τους κλινικούς να αποφασίζουν επιθετικότερες τεχνικές (πχ βιοψία) ενώ δε θα έπρεπε (βλέπε [1]). Αυτό συμβαίνει επειδή το PSA μπορεί να αυξηθεί και εξαιτίας άλλων παραγόντων που δεν έχουν σχέση με την ασθένεια. Πρόσφατα αποτελέσματα που δημοσιεύονται στο περιοδικό Journal of the American Statistical Association (JAMA oncology) σε συνεργασία με το πανεπιστήμιο του Michigan δείχνουν ότι αυτό το φαινόμενο αντιμετωπίζεται αν η διάγνωση βασιστεί ταυτοχρόνως σε 2 επιπλέον βιοδείκτες που πρέπει να συνδυαστούν με το PSA (βλέπε [2, 3]). Ερευνητικό ενδιαφέρον επίσης έχει και το πρόβλημα εύρεσης μαθηματικά βέλτιστου τρόπου με τον οποίο θα μπορεί κανείς να συνδυάζει βιοδείκτες ώστε να επιτυγχάνεται καλύτερη διάγνωση, κρατώντας την ίδια στιγμή χαμηλά τα ποσοστά των “εσφαλμένα θετικών”, έτσι ώστε επιπλέον να αποφεύγεται και η “υπερδιάγνωση”. Η ανάπτυξη αυτής της τεχνικής η οποία βρίσκεται σε εξέλιξη θα μας δώσει την πολυτέλεια να συνδυάζουμε καταλληλότερα βιοδείκτες, με σκοπό την αποφυγή της υπερδιάγνωσης. Ταυτόχρονα, θα μας επιτρέπει να συνδυάζουμε ακόμα και βιοδείκτες πολύ διαφορετικής φύσεως σχετιζόμενους είτε με πρωτεϊνες είτε με RNA είτε με μεταβολίτες κ.ά.
Όσον αφορά στον καρκίνο του παγκρέατος τα αποτελέσματα είναι αξιοσημείωτα. Ο μέχρι σήμερα διαδεδομένος δείκτης CA19.9, αν συνδυαστεί με 2 ακόμα πρωτεϊνικούς δείκτες παρέχει σημαντικά καλύτερη διάγνωση κάνοντάς την εξαιρετικά ακριβή (και καλύτερη από την ακρίβεια που προσφέρει ο δείκτης CA19.9 από μόνος του). Τα αποτελέσματα αυτής της έρευνας στο MDACC επαληθεύονται και σε ανεξάρτητη μελέτη που διεξήχθη στην Ευρώπη και δημοσιεύονται στο περιοδικό Journal of the National Cancer Institute (βλέπε [4]). Πιο συγκεκριμένα, η εξίσωση που αναπτύξαμε σε πληθυσμούς της Αμερικής δόθηκε στον International Agency for Research of Cancer (IARC) o oποίος ύστερα από χρήση της ίδιας εξίσωσης σε Ευρωπαικούς πληθυσμούς επαλήθευσε την ικανότητά της να διαγνώσκει ασθενείς από υγιείς με καλύτερη ακρίβεια από τον παραδοσιακό βιοδείκτη CA19.9.
Για τη διάγνωση που αφορά στον καρκίνο του πνεύμονα ένας συνδυασμός βιοδεικτών μπορεί να επιτύχει αρκετά ακριβή διάγνωση πρώιμου σταδίου του καρκίνου του πνεύμονα που αφορά σε ασυμπτωματικά άτομα. Τα αποτελέσματα επίσης επαληθεύτηκαν με τον ίδιο τρόπο που περιγράφηκε πιο πανω και σε Ευρωπαϊκούς πληθυσμούς στους οποίους συμμετείχε και η Ελλάδα, ωστόσο δεν είναι ακόμα ανακοινώσιμα για γραφειοκρατικούς λόγους. Τα ευρήματα είναι ιδιαίτερης σημασίας μιας και αυτοί οι βιοδείκτες αφορούν σε μη επεμβατικές εξετάσεις αίματος και μπορούν να γίνονται και προληπτικά. Με βάση αυτήν την αιματολογική εξέταση θα ειναι δυνατόν να αποφασίζεται ή όχι η μετέπειτα χρήση CT scan. Έτσι θα βελτιωθεί η διαδικασία λήψης αποφάσεων μιας και το CT scan είναι επεμβατικό εξαιτίας της ακτινοβολίας. Επίσης αν βασιστούμε μόνο σε CT scan είναι αρκετά συχνό να παρατηρούνται καλοήθεις όγκοι/όζοι, οι οποίοι ωστόσο πρέπει να αξιολογηθούν. Συχνά η αξιολόγηση αυτή γίνεται με βιοψία ή ακόμα διενεργείται και χειρουργείο για να αφαιρεθούν. Αυτές οι διαδικασίες μπορεί να προκαλέσουν φοβερό στρες στους ασθενείς οι οποίοι εκτίθενται πλέον και σε κινδύνο λόγω αυτών των διαδικασιών. Επιπλέον εξετάζεται και η ανάπτυξη μαθηματικού μοντέλου διάγνωσης (απο αιματολογικούς δείκτες) το οποίο θα έπεται του CT scan.
Στόχος αυτών των ερευνών είναι να εισαχθούν καλύτεροι τρόποι διάγνωσης για τις αναφερόμενες ασθένειες. Σκοπός είναι να αντικαταστήσουν τους παραδοσιακούς τρόπους με τους οποίους γίνεται η διάγνωση (ή οι αποφάσεις σχετιζόμενες με το screening) σήμερα στις κλινικές, έτσι ώστε οι κλινικές αποφάσεις να είναι αποτελεσματικότερες ταυτόχρονα τόσο για τους ασθενείς που χρήζουν αντιμετώπισης όσο και για τα άτομα που πραγματικά δε νοσούν ή που χρήζουν απλώς παρακολούθησης.
Ενθαρρυντικά αποτελεσμάτα σε έρευνες τέτοιου είδους, έχουν σαν συνέπεια προφανή οφέλη μιας και επιτυγχάνεται είτε η πρόβλεψη της ασθένειας πριν την εκδήλωσή της, είτε η ανίχνευση σε πρώιμο στάδιο. Σαν αποτέλεσμα ανοίγουν νέοι δρόμοι αντιμετώπισης και κατανόησης του μηχανισμού της εξέλιξης της ασθένειας στον οργανισμό.
Εκτός των προαναφερομένων τεχνικών και αποτελεσμάτων που είναι ήδη διαθέσιμα, αναμένεται να υπάρξουν ραγδαίες εξελίξεις οφειλόμενες στην συνεισφορά της ανάπτυξης αλγορίθμων τεχνητής νοημοσύνης και deep learning. Ένας σημαντικός άθλος τέτοιων τεχνικών είναι η επιτυχία αντίστοιχου αλγορίθμου στο κινέζικο παιχνίδι Go, ο οποίος κέρδισε τους κατά κόσμον καλύτερους παίκτες Lee Sedol και Ke Jie το 2016 και 2017 αντίστοιχα. Ένα τέτοιο επίτευγμα δεν πρέπει να συγκρίνεται με την νίκη του συστήματος Deep Blue σε βάρος του πρωταθλητή στο σκάκι Garry Kasparov το 1997, μιας και το σκάκι είναι ένα παιχνίδι που μπορεί να κερδιθεί χρησιμοποιώντας απλώς υπολογιστική δύναμη (δλδ χρησιμοποιώντας κάθε φορά την προϋπολογισμέμη αντίστοιχη βέλτιστη κίνηση για κάθε κίνηση του αντιπάλου). Στην περίπτωση του παιχνιδιού Go οι δυνατές κινήσεις είναι αδύνατο να υπολογιστούν από τις μηχανές μιας και είναι πολλαπλάσιες αυτών στο σκάκι. Σαν αποτέλεσμα, το παιχνίδι Go εμπεριέχει αρκετή διαίσθηση. Η νίκη του AlphaGo έναντι των πρωταθλητών του είδους, που από αρκετούς θεωρούνταν το δισκοπότηρο της τεχνητής νοημοσύνης, αποτελεί απόδειξη ότι οι μηχανές μπορούν να μάθουν μιας και οι κινήσεις δεν είναι προγραμματισμένες. Αυτό φυσικά εμπεριέχει ένα ντόμινο εξελίξεων σε πολλούς τομείς. Συγκεκριμένα αντίστοιχος αλγόριθμος ο οποίος προσπαθούσε να “μαντέψει” τι απεικονίζεται σε ψηφιακά πειραγμένες/παραμορφωμένες εικόνες το 2011 είχε ποσοστό σφαλμάτων 26% ενω στις ίδιες εικόνες οι άνθρωποι είχαν ποσοστό σφαλμάτων 5%. Το 2016 το ποσοστό σφαλμάτων των μηχανών είναι 3%, δλδ μικρότερο από αυτό των ανθρώπων. Ένα παράδειγμα δυνατότητας χρήσης τέτοιων τεχνολογιών αφορά στην οφθαλμολογία, μιας και για συγκεκριμένες παθήσεις η ικανότητα ενός οφθαλμίατρου να τις αναγνωρίζει δεν έχει την επιθυμητή ακρίβεια. Οι δυνατότητες τέτοιων τεχνολογιών γενικότερα σε διαγνώσεις που έχουν να κάνουν με ανάλυση εικόνας είναι προφανείς. Φυσικά όλες αυτές οι μέθοδοι, όπως και κάθε άλλο νέο διαγνωστικό τεστ οποιουδήποτε είδους, πρέπει να αξιολογηθεί μέσω ROC ή άλλων κατάλληλων στατιστικών τεχνικών που ενδεχομένως να χρειαστεί να εφευρεθούν ή να επαναπροσδιορισθούν.
Dept. of Biostatistics, MD Anderson Cancer Center, The University of Texas
Αναφορές:
[1] Klotz L. Prostate cancer overdiagnosis and overtreatment. Current Opinion in Endocrinology, Diabetes and Obesity 2013;20(3):204–209.
[2] Tomlins SA, Day JR, Lonigro RJ, Hovelson DH, Siddiqui J, Kunju LP, Dunn RL, Meyer S, Hodge P, Groskopf J, Wei JT,Chinnaiyan AM. Urine TMPRSS2:ERG Plus PCA3 for Individualized Prostate Cancer Risk Assessment. Eur Urol. 2016 Jul;70(1):45-53. doi: 10.1016/j.eururo.2015.04.039. Epub 2015 May 16.
[3] M Sanda, Z Feng, D Howard, S Tomlins, L Sokoll, D Chan, M Regan, J Groskopf, J Chipman, D Patil, S Salami, D Scherr, J Kagan, S Srivastava, I Thompson, J Siddiqui, J Fan, A Joon, LΕ Bantis, M Rubin, A Chinnayian, J Wei, and the EDRN PCA3 Study Group. Testing Urine for TMPRSS2:ERG and PCA3 RNA to Refine Prostate Cancer Detection, JAMA Ocology, doi:10.1001/jamaoncol.2017.0177Published online May 18, 2017.
[4] Capello M, Bantis LΕ, Scelo G, Zhao Y, Li P, Dhillon D, Patel N, Kundnani D, Wang H, Abbruzzese J, Maitra A, Tempero M, Brand R, Forestova L, Fabianova E, Holcatova I, Janout V, Firpo M, Mulvihill S, Katz M, Brennan P, Feng Z, Taguchi A, Hanash S. Sequential validation of blood-based protein biomarker candidats for early-stage pancreatic cancer. JNCI 2017, 109(4):1-9.
34 ιατρικές μελέτες για το ότι η κάνναβη θεραπεύει τον καρκίνο