Μπορεί μια εφαρμογή να βοηθήσει την τεχνητή νοημοσύνη να «μιλήσει» καλύτερα φλαμανδικά; Αυτή είναι η αποστολή του Maarallee, μιας νέας πλατφόρμας που ανέπτυξαν το Κέντρο Επιστημών Πολιτών Scivil και το Καθολικό Πανεπιστήμιο της Λουβένης (KU Leuven). Το όνομα προέρχεται από μια καθημερινή φλαμανδική φράση που σημαίνει περίπου «έλα τώρα!», και αντικατοπτρίζει το πνεύμα της συμμετοχής: πολίτες από κάθε γωνιά της Φλάνδρας μπορούν να δώσουν τη φωνή τους για να εκπαιδεύσουν ένα πιο «ανθρώπινο» μοντέλο τεχνητής νοημοσύνης.
Η ιδέα είναι απλή: οι χρήστες της εφαρμογής ηχογραφούν σύντομες φράσεις —όπως μια περιγραφή ενός παραδοσιακού πιάτου ή μια απλή πρόταση— χρησιμοποιώντας τη φυσική τους προφορά και τοπικό ιδίωμα. Όλες αυτές οι ηχογραφήσεις βοηθούν τους ερευνητές να δημιουργήσουν ένα σύστημα αναγνώρισης φωνής (RVA) που κατανοεί τα φλαμανδικά όπως πραγματικά ομιλούνται, με τις διαφορετικές αποχρώσεις, διαλέκτους και επιρροές.
«Οι περισσότερες τεχνητές νοημοσύνες εκπαιδεύονται με βάση το ολλανδικό πρότυπο των Κάτω Χωρών ή ακόμα και τα αγγλικά μοντέλα», εξηγεί ο Isaak Vandermaesen από την Scivil. «Αυτό σημαίνει ότι δυσκολεύονται να αναγνωρίσουν τον φυσικό λόγο ενός Φλαμανδού, ιδιαίτερα αν έχει έντονη τοπική προφορά ή μιλάει με ιδιωματισμούς».
Η ομάδα του Maarallee στοχεύει να διορθώσει αυτή την ανισορροπία συλλέγοντας πραγματικές φωνές από ανθρώπους κάθε ηλικίας και περιοχής. Οι ερευνητές δίνουν ιδιαίτερη έμφαση στη συμμετοχή γυναικών, ηλικιωμένων και κατοίκων του Λιμβούργου, ομάδες που συνήθως υποεκπροσωπούνται στα δεδομένα εκπαίδευσης του ΑΙ.
Η διαδικασία είναι διπλή: το AI προσπαθεί να μεταγράψει τα φλαμανδικά ηχογραφήματα, και στη συνέχεια εθελοντές βελτιώνουν ή διορθώνουν τις μεταγραφές, παράγοντας έτσι πολύτιμα δεδομένα για τη βελτίωση του συστήματος.
«Χωρίς τη συμμετοχή του κοινού, η τεχνολογία αυτή θα παραμείνει προσβάσιμη μόνο σε λίγους», τονίζει ο Vandermaesen. «Αν θέλουμε ο ψηφιακός μας βοηθός ή το GPS μας να καταλαβαίνει έναν Φλαμανδό που προφέρει το “Turnhout” με τοπική προφορά, πρέπει όλοι να συμβάλουμε».
Ο Hugo Van Hamme, ειδικός στην επεξεργασία ομιλίας στο KU Leuven, εξηγεί ότι για ένα πραγματικά αξιόπιστο σύστημα φωνητικής αναγνώρισης χρειάζονται χιλιάδες ώρες καταγραφών. «Χωρίς φωνές από ανθρώπους που μιλούν διαλέκτους ή των οποίων τα φλαμανδικά δεν είναι μητρική γλώσσα, τα μοντέλα δεν μπορούν να είναι δίκαια ούτε ακριβή».
Η συλλογή αυτών των φωνητικών δεδομένων δεν αφορά μόνο την έρευνα. Οι εφαρμογές της φωνητικής τεχνολογίας επεκτείνονται ραγδαία — από τα εκπαιδευτικά εργαλεία και τα μέσα ενημέρωσης, μέχρι τα συστήματα υποστήριξης για άτομα με αναπηρία ή τον αυτόματο υποτιτλισμό.
Όπως σημειώνει η ομάδα του Scivil, όσο περισσότεροι συμμετέχουν, τόσο πιο “έξυπνη” και δίκαιη θα γίνει η τεχνητή νοημοσύνη. Οι δημιουργοί της πλατφόρμας καλούν πολίτες, σχολεία, βιβλιοθήκες και τοπικούς συλλόγους να κατεβάσουν την εφαρμογή και να συνεισφέρουν τη φωνή τους.
Η εφαρμογή Maarallee είναι ήδη διαθέσιμη στο Play Store, ενώ σύντομα θα κυκλοφορήσει και στο App Store. Όσοι θέλουν να πάρουν μέρος μπορούν να επισκεφθούν την ιστοσελίδα maarallee.be και να ξεκινήσουν τη δική τους ηχογράφηση — γιατί η γλώσσα της τεχνητής νοημοσύνης πρέπει να περιλαμβάνει όλες τις φωνές.