29/08/18

Σύστημα αναγνώρισης φωνητικών εντολών στην Ελληνική γλώσσα

Το Ελληνικό μοντέλο για το πρόγραμμα φωνητικής αναγνώρισης και εντολών CMUsphinx

Γράφει ο Φώτης Πανταζόγλου 
Γεωλόγος – Μηχανικός Συστημάτων M.Sc.

Στα σύγχρονα υποβρύχια ρομποτικά συστήματα (ROVs, HROVs) ιδιαίτερη έμφαση δίνεται στην ικανότητα του οχήματος για λήψη δειγμάτων και στην πραγματοποίηση λεπτών χειρισμών σε περιβάλλοντα ιδιαίτερα εχθρικά για τον άνθρωπο.

Για το λόγο αυτό έχουν αναπτυχθεί μια σειρά από μηχανικοί ρομποτικοί βραχίονες με σκοπό την πραγματοποίηση όλων των παραπάνω. Ο χειρισμός των ως άνω βραχιόνων γίνεται με τη βοήθεια ειδικών χειριστηρίων και απαιτεί εξειδικευμένο προσωπικό με μεγάλη εμπειρία και ικανότητα καταναλώνοντας ταυτόχρονα αρκετό από το συνολικό χρόνο της αποστολής.
Η αναγνώριση φωνής από υπολογιστή και οι φωνητικές εντολές αποτελούν ένα από τα πιο ενδιαφέροντα νέα πεδία έρευνας και ανάπτυξης στην επιστήμη των υπολογιστών. Η ανοιχτή πλατφόρμα ανάπτυξης CMUsphinx έχει κάνει μεγάλα βήματα προόδου τα τελευταία 20 χρόνια και μας έχει προμηθεύσει με μια σειρά εργαλείων που μας επιτρέπουν συν τοις άλλοις να ασκούμε και έλεγχο σε προγραμματιζόμενες μηχανές.

Πρόκειται για μια διεθνή προσπάθεια η οποία δυστυχώς μέχρι σήμερα, δεν είχε συμπεριλάβει την Ελληνική Γλώσσα.Στα πλαίσια της Μεταπτυχιακής μου διατριβής έθεσα σαν σκοπό να αναπτύξω το Ελληνικό μοντέλο της πλατφόρμας, συνεισφέροντας έτσι στη διεθνή αυτή προσπάθεια και στη συνέχεια να παρουσιάσω έναν μηχανισμό ελέγχου μέσω φωνητικών εντολών που θα μπορούσε να έχει εφαρμογή σε ρομποτικούς βραχίονες υποβρυχίων ρομποτικών συστημάτων.

Δεδομένου ότι υπάρχει η δυνατότητα οι φωνητικές εντολές να καταλήγουν απλά σε μια σύγχρονη μηχανή μικροεπεξεργαστή και ελέγχου όπως το Raspberry Pi 3 τα αποτελέσματα της Διατριβής μπορούν να εφαρμοστούν σε μια σειρά άλλων συσκευών που συνδέονται στην παραπάνω πλατφόρμα.

Το κείμενο οι αναλυτικές πληροφορίες της διατριβής αλλά και ο κώδικας  είναι ελεύθερα προσβάσιμα με click στο αντίστοιχα εικονίδια παρακάτω.

Το Ελληνικό μοντέλο του CMUsphinx
Μεταπτυχιακή διατριβή

Πηγαίος κώδικας και βοηθητικά αρχεία

Στο video που ακολουθεί μπορεί κάποιος να δει μέρος των δοκιμών αξιολόγησης του προγράμματος που αναπτύχθηκε.


Σχετικά με τον συγγραφέα

Ο κ. Φώτης Πανταζόγλου είναι Ειδικός Τεχνικός Επιστήμονας κάτοχος Masters of Science , από το Πολυτεχνείο Χανίων και την Στρατιωτική Σχολή Ευελπίδων στην Μηχανική Συστημάτων. Έχει 25τη εμπειρία σε θέματα θαλάσσιας τεχνολογίας, νέων τεχνολογιών και έχει συμμετάσχει σε σειρά ερευνητικών αποστολών σε διάφορες θαλάσσιες περιοχές όπως ο Ατλαντικός Ωκεανός, Μεσόγειος θάλασσα και η Ερυθρά θάλασσα. Κύρια ερευνητικά του ενδιαφέροντα είναι η αυτόματη φωνητική αναγνώριση, η συνεργασία ανθρώπου-μηχανής, τα αυτόνομα υποβρύχια οχήματα, η ρομποτική και ο προγραμματισμός.