Έλληνες ερευνητές δημιούργησαν μια εφαρμογή τεχνητής νοημοσύνης που κάνει τις selfie μας τρισδιάστατες

Έλληνες ερευνητές δημιούργησαν μια εφαρμογή τεχνητής νοημοσύνης που κάνει τις selfie μας τρισδιάστατες

Μια νέα τεχνολογία που επιτρέπει τη μετατροπή μιας φωτογραφίας «σέλφι» σε τρισδιάστατο (3D) ομόιωμα, ανέπτυξαν δύο Έλληνες ερευνητές στη Βρετανία.

Χάρη στη νέα τεχνική, καθίσταται πλέον εφικτή η παραγωγή μιας τρισδιάσταστης ανακατασκευής ενός προσώπου, με αφετηρία μια τυπική δισδιάστατη εικόνα, που μπορεί να είναι «σέλφι».

Η εφαρμογή, η οποία είναι και διαδικτυακή, επιτρέπει στους χρήστες να «ανεβάζουν» μια φωτογραφία και σε λίγα δευτερόλεπτα να παίρνουν ένα 3D μοντέλο της. Περισσότεροι από 443.000 χρήστες το έχουν ήδη δοκιμάσει μέσα στο Σεπτέμβριο.

Η σχετική έρευνα, με επικεφαλής τον επίκουρο καθηγητή Γιώργο Τζιμιρόπουλο του Εργαστηρίου Υπολογιστικής Όρασης της Σχολής Επιστήμης των Υπολογιστών του Πανεπιστημίου του Νότιγχαμ και τον δρα Βασίλη Αργυρίου της Σχολής Επιστήμης των Υπολογιστών και Μαθηματικών του Πανεπιστημίου Κίνγκστον, θα παρουσιασθεί στη Διεθνή Συνδιάσκεψη Υπολογιστικής Όρασης (ICCV 2017) στη Βενετία τον Οκτώβριο.

Η τεχνολογία δεν έχει ακόμη τελειοποιηθεί, αλλά αναμένεται να βελτιωθεί στο μέλλον. Αποτελεί όμως ήδη σημαντική πρόοδο, η οποία κατέστη δυνατή χάρη στη χρησιμοποίηση των λεγόμενων «συνελικτικών νευρωνικών δικτύων», ενός πεδίου της τεχνητής νοημοσύνης που χρησιμοποιεί τη μηχανική μάθηση για να δίνει στους υπολογιστές την ικανότητα να μαθαίνουν, χωρίς να έχουν εκ των προτέρων προγραμματισθεί για το κάθε τί.

Με αυτό τον τρόπο, η ερευνητική ομάδα υπό τον Τζιμιρόπουλο «εκπαίδευσε» ένα σύστημα τεχνητής νοημοσύνης μέσα από μια τεράστια βάση δεδομένων με 2D εικόνες και 3D μοντέλα προσώπου, έτσι ώστε τελικά το σύστημα να μάθει μόνο του να ανακατασκευάζει την τρισδιάστατη γεωμετρία του προσώπου, ξεκινώντας από μια απλή δισδιάστατη εικόνα. Μάλιστα, το σύστημα είναι σε θέση να μαντέψει με αρκετή ακρίβεια τα μη ορατά μέρη του προσώπου.

«Η βασική καινοτομία είναι η απλότητα της προσέγγισής μας, η οποία έτσι παρακάμπτει τις περίπλοκες μεθόδους που συνήθως χρησιμοποιούν άλλες τεχνικές. Αντίθετα, εμείς είχαμε την ιδέα να εκπαιδεύσουμε ένα μεγάλο νευρωνικό δίκτυο με 80.000 πρόσωπα, ώστε αυτό να μάθει απευθείας να δημιουργεί την τρισδιάστατη γεωμετρία του προσώπου από μια μόνο εικόνα δύο διαστάσεων» δήλωσε ο Τζιμιρόπουλος.

Κάτι τέτοιο ακούγεται απλό, αλλά στην πραγματικότητα είναι ένα πρόβλημα με τρομερό βαθμό δυσκολίας. Όπως είπε ο δρ Αργυρίου, «το πραγματικά εντυπωσιακό με αυτή την τεχνική είναι πώς έχει κάνει τόσο απλή τη διαδικασία δημιουργίας ενός τρισδιάστατου μοντέλου προσώπου».

Οι πρακτικές εφαρμογές της νέας τεχνολογίας μπορεί να είναι ουκ ολίγες. Από την ταυτοποίηση και την αναγνώριση προσώπων και των συναισθημάτων σε αυτά για λόγους ασφαλείας, έως τα ψυχαγωγικά βιντεοπαιχνίδια (π.χ. δημιουργία ψηφιακού «αβατάρ» από το πρόσωπο του χρήστη), τη βελτίωση της επαυξημένης πραγματικότητας και τις ιατρικές εφαρμογές (π.χ. στην πλαστική χειρουργική ή στην καλύτερη κατανόηση διαταραχών όπως ο αυτισμός και η κατάθλιψη).

Δείτε το σχετικό βίντεο εδώ.

(Με πληροφορίες από ΑΠΕ-ΜΠΕ)