Ερευνητές στο Εργαστήριο Επιστήμης Υπολογιστών και Τεχνητής Νοημοσύνης του MIT (CSAIL) ανέπτυξαν σύστημα τεχνητής νοημοσύνης που μπορεί να αποκρυπτογραφήσει μια «νεκρή γλώσσα» χωρίς να χρειάζεται να γνωρίζει τη σχέση της με άλλες γλώσσες, ενώ μπορεί να προσδιορίσει με ακρίβεια τις γλωσσικές οικογένειες.

Για να επιβεβαιώσει την αποτελεσματικότητα του συστήματος, η ομάδα εφάρμοσε τον αλγόριθμό της στην Ιβηρική γλώσσα, λαμβάνοντας υπόψη τα Βασκικά. Όμως, ενώ τα Βασκικά και τα Λατινικά ήταν πιο κοντά στην Ιβηρική γλώσσα συγκριτικά με άλλες, ήταν αρκετά διαφορετικά για να θεωρηθούν σχετικά.

Απώτερος στόχος της ομάδας είναι να μπορεί το σύστημα να αποκρυπτογραφήσει τις νεκρές γλώσσες, χρησιμοποιώντας μόνο μερικές χιλιάδες λέξεις. Με επικεφαλής την καθηγήτρια του MIT Regina Barzilay ειδική στην επεξεργασία φυσικών γλωσσών, το έργο αξιοποιεί διάφορες αρχές που βασίζονται σε γνώσεις από την ιστορική γλωσσολογία.

Για παράδειγμα, ενώ μια δεδομένη γλώσσα σπάνια προσθέτει ή διαγράφει έναν ολόκληρο ήχο, είναι πιθανό να υπάρξουν ορισμένες αντικαταστάσεις. Μια λέξη που περιέχει το γράμμα «p» στη μητρική γλώσσα μπορεί να αλλάξει σε «b» στη μετεξελιγμένη γλώσσα.

Η Barzilay και η διδακτορική φοιτήτρια στο MIT Jiaming Luo ανέπτυξαν έναν αλγόριθμο αποκρυπτογράφησης που μπορεί να χειριστεί τον τεράστιο αριθμό πιθανών μετασχηματισμών μιας γλώσσας, ενώ μαθαίνει να ενσωματώνει γλωσσικούς ήχους σε έναν πολυδιάστατο χώρο όπου οι διαφορές στην προφορά αντικατοπτρίζονται στην απόσταση μεταξύ των αντίστοιχων διανυσμάτων.

Αυτός ο σχεδιασμός επιτρέπει στο σύστημα να συλλάβει μοτίβα αλλαγής γλώσσας και να τα εκφράζει ως υπολογιστικούς περιορισμούς. Το μοντέλο που προκύπτει μπορεί να χωρίσει τις λέξεις μιας αρχαίας γλώσσας και να τις χαρτογραφήσει σε διάφορες αντίστοιχες σημερινές ενεργές γλώσσες.

Το έργο βασίζεται σε μια εργασία που επιμελήθηκαν η Barzilay και η Luo πέρυσι όταν αποκρυπτογράφησαν τις «νεκρές γλώσσες» Ugaritic και Γραμμική B. Ωστόσο, μια βασική διαφορά μεταξύ των δυο έργων είναι ότι η ομάδα γνώριζε ότι οι δυο αυτές γλώσσες σχετίζονται με πρώιμες μορφές εβραϊκών και ελληνικών, αντίστοιχα.

Μελλοντικά, η ομάδα ελπίζει να επεκτείνει την έρευνά της πέρα ​​από τη σύνδεση κειμένων με σχετικές λέξεις σε μια γνωστή γλώσσα. Η νέα προσέγγιση θα περιλαμβάνει τον προσδιορισμό σημασιολογικής έννοιας των λέξεων, ακόμη και αν δεν ξέρουν πώς να τις διαβάσουν οι ερευνητές.

«Για παράδειγμα, μπορεί να εντοπίσουμε όλες τις αναφορές σε άτομα ή τοποθεσίες στο έγγραφο, οι οποίες στη συνέχεια μπορούν να διερευνηθούν περαιτέρω υπό το φως των γνωστών ιστορικών στοιχείων», εξηγεί η Barzilay. «Αυτές οι μέθοδοι αναγνώρισης οντοτήτων χρησιμοποιούνται συνήθως σε διάφορες εφαρμογές επεξεργασίας κειμένου και είναι πολύ ακριβείς, αλλά το βασικό ερευνητικό ερώτημα είναι αν η εργασία είναι εφικτή χωρίς δεδομένα εκπαίδευσης στην εκάστοτε αρχαία γλώσσα».

Το έργο υποστηρίχθηκε εν μέρει από το Intelligence Advanced Research Projects Activity (IARPA).

ΠΗΓΗ: MIT