Τι Είναι Η "Δημοσιογραφία Δεδομένων";

Η δημοσιογραφία δεδομένων έχει μακρά και ενδιαφέρουσα ιστορία. Σε αυτό το άρθρο κοιτάμε τις ρίζες αυτής της πρακτικής και περιγράφουμε το πώς η διαΝΕΟσις φιλοδοξεί να συνεισφέρει σε αυτόν τον τομέα.

Στη διαΝΕΟσις βασιζόμαστε σε μία μεγάλη ποικιλία πηγών για να εξάγουμε τα συμπεράσματα που παρουσιάζουμε στις σελίδες μας. Συνεντεύξεις, κείμενα νόμων, έρευνα πεδίου, επεξεργασία και ανάλυση στοιχείων, όλα είναι εργαλεία τα οποία μας δίνουν κομμάτια του παζλ που προσπαθούμε να συναρμολογήσουμε σε κάθε άρθρο ή μελέτη μας. Μια τέτοια πηγή είναι και τα δημόσια δεδομένα, δηλαδή μεγάλες συλλογές πληροφοριών που συντηρούνται από δημόσιους και ιδιωτικούς οργανισμούς και προσφέρονται σε ερευνητές ή στο ευρύ κοινό. Το αντικείμενο και η μορφή τους ποικίλλει, αλλά κοινό τους χαρακτηριστικό είναι η ανάγκη για επεξεργασία προκειμένου να προσφέρουν χρήσιμα συμπεράσματα. Με αυτή την έννοια, αποτελούν μία ακόμη πηγή που χρειάζεται γνώση στο χειρισμό της και την επεξεργασια των πληροφοριών που μας παρέχει.

Η επεξεργασία δημόσιων πηγών δεδομένων για την εξαγωγή ιστοριών και συμπερασμάτων είναι ένας τομέας που γνωρίζει ιδιαίτερη άνθηση στις μέρες μας. Πολλά newsrooms έχουν ομάδες αφοσιωμένες στη συλλογή, επεξεργασία και παρουσίαση πολύπλοκων συνόλων δεδομένων, με ικανότητες και γνώσεις που συνδυάζουν προγραμματισμό, δημοσιογραφία, στατιστική και design. Αν και η χρήση υπολογιστών και γραφικών μεθόδων κάνει την δημοσιογραφία δεδομένων να φαντάζει νέα εξέλιξη, στην πραγματικότητα η ιστορία της εξερεύνησης αριθμητικών πληροφοριών για την εξαγωγή συμπερασμάτων είναι τόσο παλιά όσο η ίδια η δημοσιογραφία.

Στις 22 Δεκεμβρίου του 1848, για παράδειγμα, ο δημοσιογράφος Χόρας Γκρίλι δημοσίευσε στην New York Tribune μία έρευνα βασισμένη εξ' ολοκλήρου στα δεδομένα χιλιομετρικών αποστάσεων μεταξύ πόλεων των ΗΠΑ. Το αντικείμενο της έρευνάς του ήταν να αποδείξει την ανεπάρκεια ενός απαρχαιωμένου νόμου που καθόριζε την αποζημίωση των βουλευτών ανάλογα με την απόσταση που ταξίδευαν και την σπατάλη που προέκυπτε από αυτήν. Το πρώτο φύλλο του Manchester Guardian, στις 5 Μαΐου 1821, περιλάμβανε έναν πίνακα που έδειχνε τις λάθος εκτιμήσεις του αριθμού μαθητών από τους υπέρμαχους των αλλαγών στο εκπαιδευτικό σύστημα.

Σε ένα αντίστοιχο παράδειγμα της εποχής μας, η Αργεντίνικη εφημερίδα LaNacion έκανε μία εκτεταμένη έρευνα για τα έξοδα των βουλευτών της χώρας την περίοδο 2004-2013. Αφού ξεπέρασε μία σωρεία προβλημάτων στην ψηφιακή επεξεργασία των αιτημάτων δαπανών και των αντίστοιχων αποδείξεων, κατάφερε να δημιουργήσει μία διεξοδική βάση δεδομένων, ανάλυση της οποίας έδειξε αρκετές καταχρήσεις δημοσίου χρήματος από τους αξιωματούχους της χώρας.

Επίσης συναφής είναι η προσπάθεια του International Consortium of Investigative Journalists για την ανάλυση των δεδομένων των Swiss Leaks.

Μία ακόμη περίπτωση δημοσιογραφικού έργου βασισμένου σε δεδομένα είναι η ανάλυση της Detroit Free Press για το κοινωνικό προφιλ των συμμετεχόντων στις εξεγέρσεις του Ντιτρόιτ το 1967. Εκεί, ο δημοσιογράφος Φίλιπ Μέγιερ έκανε μία δημογραφική ανάλυση των πολιτών του Ντιτρόι και βρήκε πως, σε αντίθεση με την κοινή πεποίθηση, οι αναταραχές δεν είχαν ρατσιστικά αίτια και δεν προέρχονταν από αφροαμερικανούς. Για τη δουλειά αυτή, η Detroit Free Press έλαβε το βραβείο Pulitzer.

Υπάρχουν πολλά ακόμη παραδείγματα ιστοριών που βασίζονται σε δεδομένα, και δεν είναι όλες ειδησεογραφικού ενδιαφέροντος. Η ProPublica έχει δημιουργήσει ένα site στο οποίο συγκεντρώνει τις επιδοτήσεις που λαμβάνουν οι γιατροί των ΗΠΑ από φαρμακευτικές εταιρείες (σημείωση: στις ΗΠΑ τέτοιες χρηματοδοτήσεις και δώρα είναι υποχρεωμένες οι εταιρείες να τις δηλώνουν). Με αυτό τον τρόπο, οι πολίτες μπορούν να δουν αν ο γιατρός τους συνταγογραφεί προκειμένου να εξυπηρετήσει τα συμφέροντα του ασθενή ή της φαρμακοβιομηχανίας.

Dollars For Docs

 

Χρησιμοποιώντας τεχνικές γραφικής αναπαράστασης και design, πολλά newsrooms έχουν δημοσιεύσει γραφικά που κάνουν πολύπλοκη πληροφορία εύκολα αντιληπτή και κατανοητή από ένα ευρύ κοινό. Χαρακτηριστικό παράδειγμα είναι η προσπάθεια των New York Times για την αναπαράσταση του προϋπολογισμού των ΗΠΑ ή αυτή του Mother Jones για την επεξήγηση της λειψυδρίας στην Καλιφόρνια των ΗΠΑ.

Τέλος, τα δεδομένα μπορούν να χρησιμεύσουν και για να ειπωθούν ανθρώπινες ιστορίες. Το Journalism++, μια ΜΚΟ με παρουσία σε όλη την Ευρώπη, έχει δημιουργήσει μία βάση δεδομένων με όλους τους θανάτους προσφύγων στη Μεσόγειο.

Στη διαΝΕΟσις ασχολούμαστε με τα δεδομένα με δύο διαφορετικούς τρόπους. Ο ένας είναι η συλλογή, κατηγοριοποίηση και παρουσίαση πηγών από όλο τον κόσμο με στοιχεία και δείκτες που αφορούν την Ελλάδα. Το αποτέλεσμα το ονομάζουμε "Μετρώντας την Ελλάδα" και είναι διαθέσιμο για όλους στις σελίδες μας.

Επειδή όμως δεν είναι όλα τα στοιχεία που χρειαζόμαστε διαθέσιμα, ορισμένες φορές πρέπει να δημιουργήσουμε προγράμματα τα οποία συγκεντρώνουν μεγάλους όγκους δεδομένων, τα οποία στη συνέχεια επεξεργαζόμαστε για να απαντήσουμε τα ερωτήματά μας. Χαρακτηριστικό παράδειγμα αυτού είναι η ιστορία με τα νούμερα του ΕΣΠΑ. Ο κώδικας των προγραμμάτων αυτών είναι ανοικτός και διαθέσιμος προς χρήση σε οποιονδήποτε ενδιαφέρεται.

Στο μέλλον η διαΝΕΟσις σκοπεύει να αναπτύξει μια σειρά από εργαλεία που θα συγκεντρώνουν, θα επεξεργάζονται και να εξάγουν πληροφορίες από βάσεις δεδομένων. Ο κώδικας των εργαλείων, τα αποτελέσματα των επεξεργασιών αλλά και τα ίδια τα datasets θα παρέχονται φυσικά δημόσια και δωρεάν, ώστε να μπορεί να τα εξελίξει, τα να επεξεργαστεί ή να τα χρησιμοποιήσει όποιος ερευνητής το επιθυμεί.

Μπορείτε να δείτε την πλήρη συλλογή του "Μετρώντας Την Ελλάδα" εδώ.

Ένα άρθρο βασισμένο σχεδόν αποκλειστικά σε δεδομένα είναι τα "Νούμερα Του ΕΣΠΑ".