Σάββατο 1 Ιουνίου 2024

Μηχανική μετάφραση και τεχνητή νοημοσύνη στον υποτιτλισμό

 

Εδώ και λίγα χρόνια, στη βιομηχανία του υποτιτλισμού εφαρμόζεται όλο και περισσότερο το postediting. Σε περίπτωση που δεν ξέρετε τι είναι το postediting, είναι η επιμέλεια μηχανικής μετάφρασης (γνωστής και ως MT, machine translation). Οι εταιρείες υποτιτλισμού στρέφονται στο postediting, προφανώς με την ελπίδα να εξοικονομήσουν χρόνο και τελικά και χρήμα, μειώνοντας τις αμοιβές των υποτιτλιστών. Το βασικό σκεπτικό είναι ότι, από τη στιγμή που δεν χρειάζεται να μεταφράσεις “από το μηδέν” αλλά “απλώς ελέγχεις” ένα “έτοιμο κείμενο”, χρειάζεσαι λιγότερο χρόνο, επομένως θα αμειφθείς λιγότερο.

Είναι όμως πράγματι έτσι;

Όπως το βλέπω εγώ, αυτή η εικασία προκύπτει από την εντύπωση ότι η μετάφραση απαιτεί περισσότερο χρόνο επειδή πρέπει να γράψεις ο ίδιος το κείμενο: πρέπει να κινήσεις τα δάκτυλά σου, πρέπει να πληκτρολογήσεις τις λέξεις – και θεωρείται δεδομένο ότι αυτό παίρνει πιο πολύ χρόνο από μια απλή ανάγνωση του κειμένου.

Όμως για να διορθώσεις ένα κείμενο, δεν αρκεί μια απλή ανάγνωση. Χρειάζεται και σκέψη – διεξοδική και σοβαρή σκέψη.

Και ακριβώς η σκέψη είναι το πιο χρονοβόρο κομμάτι στη μετάφραση.

Επειδή αυτό ακριβώς είναι η ουσία της μετάφρασης. Είναι η σκέψη. Δεν είναι το γράψιμο. Το να γράψεις απλώς ένα κείμενο με το πληκτρολόγιο, όπως σε μια υπαγόρευση, λέγεται δακτυλογράφηση, όχι μετάφραση. Όταν μεταφράζουμε αφιερώνουμε χρόνο στην ανάγνωση, την κατανόηση, την αφομοίωση, την εξέταση του συγκειμένου, και ύστερα δημιουργούμε μια φράση στη γλώσσα-στόχο, λαμβάνοντας υπόψη μας όλους τους εμπλεκόμενους παράγοντες και, στην περίπτωση των υποτίτλων, όλους τους τεχνικούς περιορισμούς. Τις περισσότερες φορές, αναδιατυπώνουμε για να προσαρμόσουμε το κείμενο στους περιορισμούς της έκτασης ή της ταχύτητας ανάγνωσης ή για να συμμορφωθούμε με τις κατευθυντήριες γραμμές. Διαβάζουμε και ξαναδιαβάζουμε, ακούμε και ξανακούμε, για να βεβαιωθούμε ότι έχουμε κατανοήσει όλο το περιεχόμενο και έχουμε δημιουργήσει έναν απρόσκοπτο διάλογο. Είναι μια διαδικασία περίπλοκη, πολύ χρονοβόρα, και απέχει πολύ από την απλή δακτυλογράφηση.

Όμως, ίσως πει κάποιος, αν έχεις τη φράση έτοιμη μπροστά σου, αρκεί μια ματιά για να την ελέγξεις και να πας παρακάτω, σωστά;

Λάθος.

Διότι για κάθε φράση χρειάζεται να αφιερώσουμε τον ίδιο ακριβώς χρόνο σκέψης όπως εάν μεταφράζαμε από το μηδέν. Δεν μπορούμε να εμπιστευτούμε τη μηχανική μετάφραση να κατανοήσει και να αφομοιώσει το περιεχόμενο και όλους τους πολύπλοκους εμπλεκόμενους παράγοντες. Πρέπει επομένως να δώσουμε την πλήρη προσοχή μας σε κάθε φράση, ακριβώς σαν να μεταφράζαμε.

Ωστόσο, θα επέμενε ίσως κάποιος, αφού διαβάσεις και σκεφτείς τη φράση, αν είναι σωστή, τότε τουλάχιστον δεν χρειάζεται να δακτυλογραφήσεις. Αυτό δεν σου εξοικονομεί πολύ χρόνο;

Όχι ιδιαίτερα.

Βλέπετε, είμαστε επαγγελματίες. Αυτό σημαίνει ότι δακτυλογραφούμε πολύ γρήγορα. Προσωπικά, δακτυλογραφώ πιο γρήγορα απ’ όσο σκέφτομαι. Δακτυλογραφώ κάθε μέρα εδώ και πολλά χρόνια. Με την εξάσκηση τελειοποιούμαστε και τα δάκτυλά μου είναι τόσο γρήγορα, που δεν χάνω σχεδόν καθόλου χρόνο στη δακτυλογράφηση: γράφω καθώς σκέφτομαι. Οπότε, όχι, οι έτοιμες δακτυλογραφημένες φράσεις δεν με βοηθούν να εξοικονομήσω πολύ χρόνο. Τις περισσότερες φορές, καθόλου.

Μάλιστα, πολλές φορές, όταν μια φράση χρειάζεται διόρθωση, έστω και μια μικρή διόρθωση, όπως το σβήσιμο μιας λέξης ή λίγων γραμμάτων, στην πραγματικότητα είναι πολύ πιο γρήγορο να σβήσεις ολόκληρη τη φράση και να την ξαναγράψεις, παρά να αφιερώσεις χρόνο για να μπεις μέσα στον υπότιτλο και να επεξεργαστείς τη φράση, σβήνοντας λίγα γράμματα, αλλάζοντας τη σειρά των λέξεων, πηγαίνοντας πέρα δώθε με το ποντίκι ή με τα βέλη.

Καλά, ίσως να έλεγε κάποιος, ωστόσο η μηχανική μετάφραση είναι μεγάλη βοήθεια, έτσι δεν είναι; Σου προσφέρει έτοιμες λύσεις στις οποίες μπορείς να βασιστείς, έτσι δεν είναι;

Σπάνια.

Και όταν το κάνει, αυτό μπορεί στην πραγματικότητα να έχει αρνητική επίπτωση. Μπορεί να δώσει μια μέτρια λύση η οποία, επειδή προσφέρεται έτοιμη, τρυπώνει στο μυαλό μας και καταλαμβάνει τον διανοητικό χώρο απ’ όπου θα προέκυπτε κανονικά η μετάφρασή μας. Έτσι δεν μας αφήνει να σκεφτούμε κάποια άλλη λύση, ενδεχομένως πιο ταιριαστή. Η διανοητική διεργασία της μετάφρασης παρεμποδίζεται. Κατά μια έννοια, γινόμαστε διανοητικά νωθροί.

Και τις περισσότερες φορές, οι λύσεις που παρέχονται είναι απλώς ανεπαρκείς και πρέπει να τις επεξεργαστούμε, ή κατάφωρα εσφαλμένες και πρέπει να τις αντικαταστήσουμε. Και αυτό, προφανώς, δεν μας βοηθά ούτε μας εξοικονομεί χρόνο.

 

Μηχανική έναντι ανθρώπινης μετάφρασης

Για μια στιγμή! Ίσως πει κάποιος, τι γίνεται με τη διόρθωση των ανθρώπινων μεταφράσεων; Κι αυτή αμείβεται λιγότερο από τη μετάφραση, πολύ λιγότερο!* Κι όμως, δεν σε βλέπω να παραπονιέσαι γι’ αυτό! Αυτό δεν είναι τόσο χρονοβόρο όσο το postediting;

Όχι, δεν είναι.

Διότι στην ανθρώπινη μετάφραση, μπορείς να είσαι βέβαιος ότι ο μεταφραστής έχει ακούσει και έχει κατανοήσει τον διάλογο με σφαιρικό και ολοκληρωμένο τρόπο, όπως ακριβώς θα έκανες κι εσύ, ως άνθρωπος. Και η μηχανική μετάφραση, όσο καλή κι αν είναι, δεν μπορεί να το κάνει αυτό.

Υπάρχουν πολλοί σημαντικοί παράγοντες που η μηχανική μετάφραση δεν μπορεί να λάβει υπόψη.

Στην περίπτωση του υποτιτλισμού, ο πιο προφανής είναι η εικόνα. Η μηχανική μετάφραση δεν μπορεί να δει τη δράση στην οθόνη. Η μηχανική μετάφραση δεν μπορεί να ξέρει ποιος μιλά ούτε σε ποιον απευθύνεται. Η μηχανική μετάφραση δεν μπορεί να αντιληφθεί το ύφος του διαλόγου, το επίπεδο ύφους, τους τύπους ευγενείας. Η μηχανική μετάφραση δεν μπορεί να κατανοήσει τη συνέχεια και τη συνοχή.

Θα δώσω μερικά απλά αλλά σημαντικά παραδείγματα.

Γραμματικό φύλο

Πολλές γλώσσες έχουν έμφυλους γραμματικούς τύπους και χρησιμοποιούν άρθρα εκεί όπου άλλες γλώσσες όπως τα αγγλικά, δεν χρησιμοποιούν (π.χ. η φράση “Cameron paid” μπορεί να μεταφραστεί στα ελληνικά είτε με αρσενικό είτε με θηλυκό άρθρο, ως “πλήρωσε ο Κάμερον” ή ως “πλήρωσε η Κάμερον”). Σε πολλές περιπτώσεις, η μηχανική μετάφραση δεν έχει τρόπο να επιλέξει μεταξύ αρσενικού και θηλυκού στην περίπτωση, λόγου χάρη, ενός επωνύμου, όπως στο παράδειγμά μου. Εάν η μηχανική μετάφραση χρησιμοποιήσει λάθος φύλο, τότε ο επιμελητής πρέπει να το διορθώσει σε όλο το αρχείο. Αυτό δεν είναι καθόλου απλό, διότι δεν πρόκειται για γραμματικό ούτε για ορθογραφικό λάθος και δεν το πιάνουν οι αυτόματοι διορθωτές κειμένου. Είναι πολύ εύκολο να παραβλέψεις ένα «αυτός» αντί για ένα «αυτή», διότι είναι απολύτως φυσικό και γραμματικά σωστό. Επιπλέον, ο επιμελητής πρέπει να εντοπίσει όλα τα σημεία όπου εμφανίζονται επίθετα με έμφυλη κατάληξη που αναφέρονται στο άτομο αυτό, πράγμα που δεν μπορεί να γίνει με αυτόματη αναζήτηση και αντικατάσταση: πρέπει να διαβάσεις όλο το αρχείο προσεκτικά, και πάλι μπορεί να σου ξεφύγουν μερικά. Επομένως, όταν διορθώνεις μηχανική μετάφραση, πρέπει να είσαι διπλά προσεκτικός για να πιάσεις τέτοιου είδους λάθη.

Τύποι ευγενείας

Πολλές γλώσσες χρησιμοποιούν το τρίτο πρόσωπο του ενικού ή το δεύτερο του πληθυντικού ως τύπο ευγενείας. Μεταφράζοντας από τα αγγλικά προς αυτές τις γλώσσες, η μηχανική μετάφραση δεν έχει τρόπο να ξέρει αν πρέπει να χρησιμοποιηθεί τύπος ευγενείας ή όχι. Πρέπει λοιπόν να είμαστε διπλά προσεκτικοί και γι’ αυτόν τον λόγο, και ενδεχομένως να χρειαστεί να κάνουμε πολλές αλλαγές σε ρήματα και αντωνυμίες σε όλο το κείμενο. Αυτό είναι επίσης κάτι που εύκολα μπορεί κανείς να παραβλέψει, καθώς η φράση της μηχανικής μετάφρασης μπορεί να είναι απολύτως σωστή γραμματικά και επομένως μπορείεύκολα να μας διαφύγει, δημιουργώντας έτσι προβλήματα ασυνέπειας στο αρχείο μας.

Τα δύο αυτά θέματα που μόλις ανέφερα είναι ιδιαίτερα ενοχλητικά, επειδή απαιτούν τεταμένη προσοχή και μεγάλη συγκέντρωση, με αποτέλεσμα το postediting να γίνεται πιο χρονοβόρο.

Πολλαπλές σημασίες

Ένα άλλο θέμα που χρήζει ιδιαίτερης προσοχής είναι το γεγονός ότι οι περισσότερες λέξεις και φράσεις μπορούν να μεταφραστούν με περισσότερους από έναν τρόπους. Αυτό μπορεί να μοιάζει απλό και προφανές, αλλά δημιουργεί αξεπέραστα προβλήματα. Ακόμη και η απλούστερη φράση μπορεί να έχει παραπάνω από μία εκδοχές. Για παράδειγμα, η απλή αγγλική λέξη “hello”, ανάλογα με τα συμφραζόμενα, μπορεί να αποδοθεί στα ελληνικά ως “γεια”, “γεια σου”, “γεια σας”, “εμπρός;”, “είναι κανείς εδώ;”, “σύνελθε!”… Δεν μπορούμε να είμαστε σίγουροι ότι η μηχανική μετάφραση θα επιλέξει την κατάλληλη απόδοση καθώς δεν μπορεί να λάβει υπόψιν το συγκείμενο.

Ιστορικοί και πολιτιστικοί παράγοντες

Ένα ακόμη ζήτημα είναι οι πολιτιστικές αναφορές και το ιστορικό πλαίσιο, που επίσης βρίσκεται πέρα από τις αντιληπτικές δυνατότητες της μηχανικής μετάφρασης. Το όνομα “Henry” μπορεί να μεταγραφεί ως “Χένρι” ή να μεταφραστεί ως “Ερρίκος”, ανάλογα με το αν πρόκειται για ένα σύγχρονο πρόσωπο ή για μια ιστορική προσωπικότητα. Μια φράση μπορεί να είναι απόσπασμα από τις γραφές και τότε θα πρέπει να εντοπίσουμε και να αντιγράψουμε την αρχική πηγή. Και ούτω καθ’ εξής.

Θα μπορούσα να παραθέσω και άλλα παραδείγματα.

Η ουσία του πράγματος είναι ότι δεν υπάρχει τρόπος να παράσχει κανείς μια απλή, ξεκάθαρη μετάφραση μιας λέξης ή φράσης που να ταιριάζει παντού και πάντοτε. Πρέπει να ληφθούν υπόψη το γενικότερο πλαίσιο και άλλοι παράγοντες που η μηχανική μετάφραση, έτσι όπως είναι τώρα, δεν μπορεί να αντιληφθεί. Κι αυτό συμβαίνει τις περισσότερες φορές

 

Τρόπος εργασίας

Στην ανθρώπινη μετάφραση, συνήθως τα λάθη είναι σχετικά λίγα. Αυτό σημαίνει ότι χρειάζεται λιγότερος χρόνος για να την ελέγξεις και για να τα διορθώσεις. Στην περίπτωση των υποτίτλων, συνήθως αρκεί να δεις το βίντεο μια φορά, σταματώντας μόνο όποτε εντοπίζεις κάποιο λάθος – πράγμα που δεν συμβαίνει και πολύ συχνά. Έπειτα κάνεις έναν αυτόματο ορθογραφικό έλεγχο, ορισμένους τεχνικούς ελέγχους και τελείωσες. Όμως με τη μηχανική μετάφραση, αυτό δεν αρκεί. Πρέπει να διαβάσεις όλους τους υποτίτλους, έναν προς έναν, σταματώντας πολλές φορές για να επεξεργαστείς ή να ξαναγράψεις τον υπότιτλο, και όταν τελειώσεις, τότε πια μπορείς να δεις το βίντεο και να κάνεις τους ελέγχους.

Αυτό σημαίνει ότι αναγκάζεσαι να αφιερώσεις πολύ περισσότερο χρόνο στην επιμέλεια μιας μηχανικής μετάφρασης απ’ όσο θα αφιέρωνες στην επιμέλεια μιας ανθρώπινης μετάφρασης.

Και το πιο σημαντικό είναι πως όταν τελειώσεις, το αρχείο ίσως να περιέχει ακόμη κάποια λάθη.

Μα γιατί συμβαίνει αυτό; ίσως αναρωτηθείτε. Όταν επιμελείσαι μια ανθρώπινη μετάφραση, τα λάθη είναι σχετικά λίγα, οπότε απλώς τα εντοπίζεις, τα διορθώνεις και τέρμα. Πολύ σπάνια σου ξεφεύγει κάποιο λάθος. Όταν επιμελείσαι μια μηχανική μετάφραση, τα λάθη είναι τόσο πολλά, που αναγκάζεσαι να αλλάξεις τον υπότιτλο εκ βάθρων. Βασικά, πρέπει να ξαναγράψεις το κείμενο σε μεγάλο βαθμό. Από κάποιο σημείο και μετά, δεν πρόκειται πια για «επιμέλεια» κατά καμία έννοια της λέξης, πρόκειται για αναδημιουργία. Στην ουσία, το γράφεις από την αρχή. Δεν διορθώνεις απλώς το παλιό κείμενο, δημιουργείς ένα καινούριο. Και φυσικά, το καινούριο αρχείο χρειάζεται κι αυτό με τη σειρά του επιμέλεια, διότι είναι αδύνατον να δημιουργήσεις ένα τέλειο κείμενο.

Αν είναι έτσι, ίσως πείτε, γιατί να μην το επιμεληθείς εσύ ο ίδιος;

Ένας λόγος είναι ότι, όπως όλοι ξέρουμε, είναι σχεδόν αδύνατον να επιμεληθείς δική σου δουλειά. Θα πιάσεις ορισμένα λάθη, άλλα όμως θα σου ξεφύγουν στη δεύτερη και στην τρίτη ανάγνωση, όπως ακριβώς σου ξέφυγαν στην πρώτη. Το έχουμε πάθει όλοι μας κάποια στιγμή. Προκειμένου να επιμεληθείς αποτελεσματικά τη δική σου δουλειά, θα πρέπει να πάρεις όσο μεγαλύτερη απόσταση μπορείς, να αφήσεις να παρέλθει μεγάλο χρονικό διάστημα και να ασχοληθείς με άλλα πράγματα στο ενδιάμεσο. Όμως αυτό αφενός δεν είναι πάντα εφικτό, διότι οι προθεσμίες πιέζουν και πρέπει να παραδώσεις το έργο, αφετέρου σε αναγκάζει να αφιερώσεις ακόμη περισσότερο χρόνο στη δουλειά του postediting– ναι, σ’ αυτήν τη δουλειά που υποτίθεται ότι θα σου έπαιρνε λιγότερο χρόνο από τη μετάφραση!

Το να αφιερώσεις περισσότερο χρόνο αποκλείεται, φυσικά – μεταξύ άλλων επειδή δεν μπορείς να αφιερώσεις περισσότερο χρόνο σε μια δουλειά που σου αποφέρει λιγότερα χρήματα. Εξάλλου, εφόσον η όλη ιστορία με τη μηχανική μετάφραση υποτίθεται ότι εξοικονομεί χρόνο, θα ήταν γελοίο να καταλήξεις να χάνεις χρόνο.

Τι κάνουμε, λοιπόν;

Κάποιοι από εμάς απλώς αρνούμαστε να κάνουμε postediting και αποδεχόμαστε το γεγονός ότι δεν θα πάρουμε δουλειές από τις εταιρείες που είναι αποφασισμένες να δουλέψουν με μηχανική μετάφραση. Όσοι από εμάς αναλαμβάνουμε τέτοιες δουλειές, αναγκαζόμαστε να αλλάξουμε τον τρόπο εργασίας μας και να αφιερώνουμε λιγότερο χρόνο σε κάθε αρχείο, ώστε να είναι οικονομικά βιώσιμη η δουλειά. Αν δεν υπάρχει χρόνος για να διαβάσεις όλο το αρχείο και να δεις και το βίντεο, απλώς παραλείπεις το ένα από τα δύο. Το τελικό αποτέλεσμα είναι, φυσικά, η απώλεια ποιότητας.

Δεν είμαι βέβαιη αν οι μεταφραστικές εταιρείες το έχουν συνειδητοποιήσει αυτό ή όχι. Είτε το γνωρίζουν και δεν ενδιαφέρονται, είτε δεν έχουν ιδέα τι συμβαίνει.

Και ειλικρινά, δεν είμαι βέβαιη ποιο από τα δύο θα ήταν χειρότερο.

 

Τεχνικοί περιορισμοί

Τέλος, στους υποτίτλους πρέπει να λάβουμε υπόψη μας και την επίδραση των τεχνικών περιορισμών, όπως είναι ο αριθμός χαρακτήρων και η ταχύτητα ανάγνωσης. Τις περισσότερες φορές, οι φράσεις που παράγονται από τη μηχανική μετάφραση υπερβαίνουν τον επιτρεπτό αριθμό χαρακτήρων και το όριο της ταχύτητας ανάγνωσης, αναγκάζοντάς μας να επεξεργαστούμε τη φράση για να την κάνουμε πιο σύντομη. Και τις περισσότερες φορές, αυτή η επεξεργασία δεν είναι απλώς μια διαγραφή δυο τριών λέξεων. Τις περισσότερες φορές πρέπει να αναδιατυπώσουμε, δηλαδή να σκεφτούμε και να αναδημιουργήσουμε – και φυσικά να ξαναγράψουμε.

Με άλλα λόγια, πρέπει να μεταφράσουμε από το μηδέν – αφού έχουμε ήδη χάσει τον χρόνο μας διαβάζοντας και εξετάζοντας την πρόταση της μηχανικής μετάφρασης.

 

Και τώρα;

Όλοι μου οι συνάδελφοι, απ’ όσο ξέρω, δεν συμπαθούν καθόλου τη μηχανική μετάφραση, όσον αφορά τους υποτίτλους. Οι περισσότεροι αποφεύγουν το postediting, σβήνουν το κείμενο της μηχανικής μετάφρασης όταν είναι διαθέσιμο, και αποφεύγουν τις προτάσεις της μηχανικής μετάφρασης όταν προσφέρεται ως βοήθημα.

Άρα λοιπόν, η μηχανική μετάφραση είναι τελείως άχρηστη;

Όχι βέβαια! Μπορεί να είναι πολύ χρήσιμη σε άλλους τύπους μετάφρασης, όπως είναι τα νομικά ή οικονομικά κείμενα που έχουν μεγάλες επαναλήψεις ή τα ιατρικά και τεχνικά έγγραφα που έχουν εκτεταμένη ορολογία. Μπορεί να είναι χρήσιμη στο είδος του κειμένου όπου η ακρίβεια είναι κεφαλαιώδης και το ύφος είναι δευτερεύον. Όχι όμως και στη λογοτεχνία, όπου απαιτούνται ιδιαίτερα δημιουργικές λύσεις. Και οι υπότιτλοι, επιτρέψτε μου να το πω, είναι λογοτεχνία. Τα σενάρια είναι διάλογοι, όπως και τα θεατρικά έργα. Είναι ζωντανά, εκφραστικά, μοναδικά και πρέπει να αντιμετωπίζονται ανάλογα.

[ΣΧΟΛΙΑ: Έλαβα πολλά σχόλια από μεταφραστές που επεσήμαναν ότι τα ίδια ακριβώς προβλήματα υπάρχουν και σε άλλους τομείς της μετάφρασης, όπως τα νομικά, οικονομικά, ιατρικά και τεχνικά κείμενα. Παραθέτω:

Αυτές είναι επί λέξει οι σκέψεις που περνούν από το μυαλό μου όταν σκέφτομαι τη μηχανική μετάφραση – παρόλο που μεταφράζω νομικά και οικονομικά κείμενα. Γεγονός που δείχνει ότι τα ίδια θέματα υπάρχουν και σε εκείνους τους τομείς.”

Η μηχανική μετάφραση κάνει πάρα πολλά λάθη στη δικαστική ορολογία. Και το γεγονός ότι κάποια κείμενα είναι επαναλαμβανόμενα δεν έχει σημασία, διότι η μηχανική μετάφραση είναι ασυνεπής και μεταφράζει διαφορετικά τις ίδιες λέξεις σε άλλες προτάσεις …”

Συμφωνώ μαζί σου, εκτός από το κομμάτι όπου λες ότι η μηχανική μετάφραση είναι χρήσιμη για νομικά και τεχνικά έγγραφα. Μάλιστα, κάποια από αυτά τα προβλήματα υπάρχουν κι εκεί, όπως το να παίρνεις μια μετάφραση σωστή μεν, αλλά όχι για το συγκεκριμένο πλαίσιο. Κι όταν είναι θαμμένη μέσα σε πολύ κείμενο, είναι ακόμη πιο δύσκολο να την εντοπίσεις.

Όλα αυτά τα ακανθώδη σημεία που εξηγείς τόσο ωραία, εκτός από τον περιορισμό των χαρακτήρων, εφαρμόζονται με τον ίδιο ακριβώς τρόπο στην ιατρική ή στην τεχνική μετάφραση. Η αμφισημία που προκαλείται στα αγγλικά με την παράθεση ουσιαστικών χωρίς τη χρήση προθέσεων (που χρειάζονται στη γλώσσα-στόχο και που μπορεί να αλλοιώσουν πολύ το νόημα) είναι κάτι που η μηχανική μετάφραση (ή κάποιος που δεν είναι ειδικός στον τομέα) δεν μπορεί να χειριστεί χωρίς να μπλέξει. Επίσης, το γεγονός ότι η ειδική ορολογία είναι πολύ συγκεκριμένη δεν σημαίνει ότι η μηχανική μετάφραση μπορεί να την κατανοήσει, τα πράγματα δεν είναι άσπρο και μαύρο. Και δεν θα αναφέρω καν το επιχείρημα ότι οι ιατρικές μεταφράσεις επηρεάζουν ανθρώπινες ζωές, ενώ ο υποτιτλισμός αφορά μόνο την ψυχαγωγία και επομένως τα λάθη είναι πιο ανεκτά.”

Δεν έχω δει ποτέ μου κανένα κείμενο (ούτε καν οικονομικό, νομικό, ιατρικό ή τεχνικό) όπου η μηχανική μετάφραση να είναι αρκετά ακριβής και το ύφος να μην έχει σημασία.” “Και μάλιστα μεγαλύτερη σημασία, δεδομένων των δυνητικών κινδύνων.”]

Η μετάφραση δεν είναι σκέτη πληκτρολόγηση. Η μετάφραση είναι σκέψη, συναίσθημα, αντιπαραβολή, αφομοίωση, αναδημιουργία. Και ας το πάρουμε απόφαση, καμιά μηχανική μετάφραση και καμιά τεχνητή νοημοσύνη δεν στέκει στο ύψος μιας τέτοιας δουλειάς ακόμη. Όχι μέχρι να δημιουργήσουμε μια τεχνητή νοημοσύνη που δεν θα είναι μόνο πραγματικά ευφυής αλλά και ευαίσθητη, ώστε να σταθεί ως ίση πλάι στην ανθρώπινη ευφυΐα και ευαισθησία.

Ως τότε, προτιμώ την ανθρώπινη μετάφραση, ευχαριστώ.

 

...με γαρνιτούρα από ώρες και λεπτά, ευχαριστώ..

* Παρεμπιπτόντως, δεν είναι ακριβώς στο θέμα μας, αλλά η επιμέλεια ανθρώπινης μετάφρασης επίσης αξίζει καλύτερες αμοιβές. Ελάχιστες εταιρείες πληρώνουν δίκαιες αμοιβές για τη διόρθωση και την επιμέλεια. Φυσικά αυτό είναι ένα άλλο θέμα, αλλά αξίζει να το επισημάνουμε.


~ ~ ~ ~ ~ ~ ~ 

Το άρθρο αυτό δημοσιεύτηκε αρχικά στα αγγλικά με τον τίτλο MT and AI in subtitling.

Την ελληνική μετάφραση επιμελήθηκε η Αλίκη Αναγνώστη από το YourTranslator και αναρτήθηκε στο μπλογκ τους. Αλίκη, ευχαριστώ πολύ για το ενδιαφέρον, για την αναδημοσίευση και για τον κόπο.

Σάββατο 3 Φεβρουαρίου 2024

MT and AI in subtitling

In the last couple of years, postedit is being applied more and more in the subtitle industry. In case you don’t know what postedit is, it’s proofreading of MT (machine translation). Subtitling agencies are turning to postedit, obviously in hope of saving time and, ultimately, money by reducing linguists’ fees. The idea is that, since you don’t have to translate “from scratch” but are “just checking” a “ready text”, you need less time, therefore will be paid less.

But is this actually the case?

The way I see it, this assumption stems partly from the idea that translation takes longer because you actually have to write the text yourself: you have to move your fingers, you have to click away at the keyboard – and that is presumed to take longer than simply reading a text.

But in order to proofread a text, it is not enough to simply read it. You have to think – think thoroughly and think well.

And thinking is precisely what’s more time-consuming in translation.

Because that is precisely what translation is about. It’s about thinking. It’s not about writing. Simply writing a text using a keyboard, as in dictation, is called typing, not translation. When we translate, we take time to read, understand, assimilate, consider context, and then produce a phrase in the target language, taking into account all factors involved and, in the case of subtitles, all technical restrictions. More often than not, we rephrase to adapt to space or reading speed limitations or to comply with guidelines. We read and re-read, listen and re-listen, to make sure we have understood all content and have produced a seamless dialogue. It’s a complex process, a far cry from simple typing, and very time-consuming.

But one might argue, if you have the phrase readily spelt out before you, then you just need a glance to check it and then move on, right?

Wrong.

Because for each phrase, we need to devote the exact same thinking time as when translating from scratch. We cannot trust machine translation to understand and assimilate context and all the complex factors involved. We therefore have to give our full attention to each and every phrase, just as if we were translating.

Still, one might insist, once you have read the phrase and thought it out, if it is correct, then at least you don’t have to type. Does that not save you a lot of time?

Not really.

You see, we are pros. That means we type really fast. Personally, I type faster than I think. I’ve been typing every day for years and years. Practice makes perfect, and my fingers are so quick I hardly lose any time typing: I type as I think. So, no, the ready typed phrases don’t help me save much time. In most cases, not at all.

In fact, in many cases, when a phrase needs correction, even a slight correction such as erasing a word or a couple of letters, it is actually much quicker to delete the entire phrase and write over it, than take the time to click in the subtitle and edit the phrase, erasing just a few letters, changing word order, having to moving back and forth with the mouse or the arrows.

Well, one might say, machine translation is still a great help to you, is it not? It provides ready solutions for you to work on, does it not?

Rarely.

And when it does, it might actually have a negative effect. It might provide a mediocre solution which, being readily available, slips in our mind, occupying the mental space which would otherwise provide our translation, thus preventing us from coming up with another solution, maybe more apt. The mental process of translation is obstructed. In a sense, we become mentally lazy.

And most of the time, the solutions provided are simply inadequate and have to be edited, or downright wrong and have to be replaced. And this, obviously, is neither helpful nor time-saving.


MT vs human translation

Wait a moment! one might say, what about proofreading human translations? That’s also paid less than translation, far less!* And still, I don’t see you complaining about that! Is that not also as time-consuming as postedit?

No, it’s not.

Because with human translation, you can trust the linguist to have listened, heard and understood the dialogue in a comprehensive way, just like you, as a human, would do. And machine translation, however good, cannot do that.

There are many important factors that MT cannot take into account.

In the case of subtitling, the most obvious one is the image. MT cannot see the action on scene. MT cannot know who is talking or to whom they are talking. MT cannot perceive the dialogue register, formality or style. MT cannot grasp continuity and consistency.

I will give some simple yet important examples.

Gender

Many languages have gendered grammar and apply articles where other languages, such as English, do not (i.e., “Cameron paid” can be translated into Greek with a male or a female article, “πλήρωσε ο Κάμερον” or “πλήρωσε η Κάμερον”). In many cases, MT has no way of choosing between male or female in case of, say, a surname, as in my example. If MT applies the wrong gender, then the proof-reader has to correct it throughout the file. This can be very tricky, as this is not a grammatical or spelling mistake and cannot be caught by a spellchecker. It is very easy to overlook a “he” instead of a “she”, as it is perfectly natural and correct grammatically. What’s more, the proof-reader has to spot all cases of gendered adjectives referring to this person, and this cannot be done by a find and replace: you have to read through the entire file very carefully, and still, you may miss some. Therefore, when correcting MT, one has to be doubly alert for this sort of error.

Formality

Many languages have use third person singular or second person plural as a courtesy form. When translating from English into these languages, MT has no way of knowing if a courtesy form must be used or not. One has to be doubly alert for this as well, and may have to apply many changes, in verbs and pronouns, throughout the text. This, also, is very easy to overlook, as the MT phrase might be perfectly sound grammatically, and therefore can easily escape our attention, thus creating consistency problems in the file.

The two issues I just mentioned are particularly vexing, because they need extra attention and concentration, making postedit more time-consuming.

Multiple meanings

Another issue that merits special consideration, is that most words and phrases can have more than one translation. This may seem simple and obvious, but it creates insurmountable problems. Even the simplest phrase can have more than one version. For instance, the simple English word “hello”, depending on context, can be rendered into Greek as “γεια”, “γεια σου”, “γεια σας”, “εμπρός;”, “είναι κανείς εδώ;”, “σύνελθε!”… And there is no guarantee that the MT will choose the appropriate meaning, as it cannot take context into account.


Historical and cultural factors

Yet another issue are cultural references and historical context, also beyond the grasp of the MT. The name “Henry” might be transcribed as “Χένρι” or translated as “Ερρίκος”, depending on whether this is a contemporary person or a historical figure. A phrase might be a citation from the scriptures and therefore one would have to locate and copy the source. And so forth.

I could go on and on.

The fact of the matter is that there is no way to provide a simple, straightforward translation of a word or phrase that will always apply. You have to consider context and other factors that simply cannot be perceived by MT as it is now. And this is the case more often than not.


Modus operandi

In a human translation, normally there are relatively few errors. This means you need less time to go through it and correct them. In the case of subtitles, it is usually enough to watch the video once and simply stop when you spot an error – which is not very often. Then you run a spell check, some final technical checks, and you’re done. But with MT, this is not enough. You need to read through the subtitles, one by one, pausing many times to edit of rewrite, and then when you’re done, you can watch the video and do the checks.

This means you have to spend much more time editing an MT file than you would editing a human translation file.

More importantly, it means that when you’re done, the file might still contain some errors.

Why is that, you might ask? Well, when editing a human file, the errors are relatively few, so you just catch them, correct them and that’s it. Very rarely does an error escape you. When editing an MT file, the errors are so many, that you have to do a complete rehaul. Basically, you have to rewrite the file to a great measure. From a certain point onwards, this is no longer “editing” in any sense of the word, it’s recreation. Essentially, you write from scratch. You do not simply correct the old text; you are producing a new text. And of course, the new file should be proofread in its turn, because it’s impossible to create a perfect text.

If this is the case, you might say, why not proofread it yourself?

Well, for one thing, as we all know, it is next to impossible to proofread your own work You will catch some errors, but others will slip you by in the second and third reading, just as they slipped you by in the first one. It has happened to all of us at one time or another. In order to effectively proofread your own work, you would have to distance yourself as much as possible, by leaving a large time interval and occupy yourself with other things in the meantime. But this, for one thing, is not always feasible, because due dates are pressing and you have to deliver, and for another, it obliges you to dedicate yet more time to the postedit job – yes, this job that supposedly would take less time than translation!

Dedicating more time is, of course, out of the question – among other things, because you can’t afford to dedicate more time to a job that is paid less. Besides, since this entire MT thing is supposed to save time, it would be ridiculous to end up actually loosing time.

What do we do, then?

Some of us simply refuse to do postedit and accept the fact that we won’t be getting any tasks from agencies that are set on working with MT. The ones of us who accept such tasks, simply have to change their workflow and dedicate less time to each file, in order for the job to be financially sustainable. If there is no time to both read through the file and watch the video, you simply omit one of the two. The net result of this, of course, is loss of quality.

I’m not sure whether translation agencies realise this or not. They either realise it and do not care, or they have no clue what’s going on.

And frankly, I’m not sure which of the two would be worse.

 

Tech restrictions

Last but not least, in subtitles we have to consider the influence of technical restrictions, such as character count and reading speed. More often than not, the phrases provided by MT violate the word count and reading speed limit, therefore obliging us to edit the phrase and make it shorter. And most of the time, this edit does not consist in simply deleting a word or two. Most of the time, we have to rephrase, that is to rethink and recreate – not to mention rewrite.

In other words, we have to translate from scratch – after having initially wasted our time reading and considering the MT suggestion.

 

What then?

All my colleagues, as far as I know, do not care for MT at all, when it comes to subtitles. Most of them shun postedit, delete the MT text when available as an option, and avoid MT suggestions when provided as an aid.

But then, is MT completely useless?

Indeed not! It can be very useful in other types of translations, such as legal or financial documents that have long repetitions, or medical and technical documents that have extensive terminology. It can be useful in the sort of text where precision is paramount and style is secondary. But not in literature, where creative solutions are most necessary. And subtitles, let me say, are literature. Scripts are dialogues, like theatrical plays. They are alive, expressive, unique, and should be treated accordingly.

[EDIT: I have received many comments from translators who have pointed out that the exact same problems exist in other fields of translation, such as legal, financial, medical and technical. Quoting:

"This is verbatim the thoughts going through my mind when I’m thinking about MT - even though I’m a legal and financial translator. Which goes to show that the issues are the same in those fields."

"MT makes so many mistakes with court legalese. And the fact that some texts are repetitive doesn’t really matter, since MT is inconsistent and will translate the same words differently in different sentences…"

"All those pain points that you explain so well, except for the character restriction, apply exactly the same to say medical or technical. The ambiguity caused by English juxtaposing of nouns with no need for prepositions (that are needed in the target language and can alter profoundly the meaning) is something a machine (or someone who is not an expert in the field) cannot get around without asking for trouble. Plus specialized terminology being so niche is not something MT can really master, things are not so black and white. And I won’t even use the card that medical affects people’s lives while subtitling is just for entertainment so errors are more acceptable."

"I have yet not seen a text (financial, legal, medical or technical included) were MT is precise enough and style doesn't matter." "Αnd also matters more, given the potential risks and hazards."]

Translation is not just clicking away at the keyboard. Translation is thinking, feeling, weighing, assimilating, recreating. And let’s face it, no MT and no AI is up to the task – yet. Not unless we create an artificial intelligence that is not only truly intelligent but also sentient, the equal of human intelligence and sensitivity.

Till then, I’ll stick to human translation, thank you.


...with a side order of hours and minutes.


* BTW, not exactly on-topic, but editing human translation also merits better payment. Very few agencies pay a fair rate for editing and proofreading. Of course, this is another issue, but still worth noting.

~ ~ ~ ~ ~ ~ ~