TECHin

"RoboCat": Η αυτοβελτιούμενη τεχνητή νοημοσύνη της Google, που χειρίζεται πολλά διαφορετικά ρομπότ


Eνώ τα ρομπότ δεν είναι άγνωστα στη δουλειά - τα πρώτα βιομηχανικά ρομπότ κυκλοφόρησαν σε εργοστάσιο αυτοκινήτων το 1961 - οι δυνατότητές τους είναι γενικά περιορισμένες. Τα περισσότερα εκτελούν μόνο μια απλή, συγκεκριμένη εργασία, ξανά και ξανά και δεν μπορούν να βγουν "έξω από το κουτί" με την προσαρμοστικότητα ενός ανθρώπου.

Ένα ρομπότ ικανό να αναλαμβάνει νέες εργασίες με σχετική ευκολία και συνέπεια —ένα ρομπότ γενικής χρήσης— θα μπορούσε να σημαίνει πιο ευέλικτο αυτοματισμό και μειωμένο κόστος συνολικά. Αλλά η δημιουργία ενός τέτοιου bot έχει αποδειχθεί απίστευτα δύσκολη. Μόλις πρόσφατα άρχισαν να διαμορφώνονται ως πραγματικοί εισερχόμενοι στο εργατικό δυναμικό.

Για να προσπαθήσει να αντιμετωπίσει το πρόβλημα, το DeepMind της Google έχει αναπτύξει έναν αυτοβελτιούμενο πράκτορα τεχνητής νοημοσύνης, που ονομάζεται RoboCat, που μαθαίνει να χειρίζεται διαφορετικούς ρομποτικούς βραχίονες και να αναλαμβάνει διαφορετικές εργασίες με μόλις 100 παραδείγματα και μπορεί να δημιουργήσει τα δικά του δεδομένα εκπαίδευσης για να βοηθήσει στην αύξηση της απόδοσης.

«Ενώ η αξιοποίηση πρόσφατων προόδων στην τεχνητή νοημοσύνη θα μπορούσε να οδηγήσει σε ρομπότ που θα μπορούσαν να βοηθήσουν με πολλούς περισσότερους τρόπους», σημειώνουν οι προγραμματιστές σε μια ανάρτηση ιστολογίου, «η πρόοδος στην κατασκευή ρομπότ γενικής χρήσης είναι πιο αργή, εν μέρει λόγω του χρόνου που απαιτείται για τη συλλογή δεδομένων εκπαίδευσης του πραγματικού κόσμου».

Η ομάδα του DeepMind ισχυρίζεται ότι το RobotCat βοηθά στην επίλυση αυτού του προβλήματος μαθαίνοντας «πολύ πιο γρήγορα» από άλλα μοντέλα. «Αυτή η ικανότητα θα βοηθήσει στην επιτάχυνση της έρευνας στη ρομποτική, καθώς μειώνει την ανάγκη για εκπαίδευση υπό την επίβλεψη του ανθρώπου και είναι ένα σημαντικό βήμα προς τη δημιουργία ενός ρομπότ γενικής χρήσης», έγραψαν.

Το RoboCat πήρε το όνομά του από το μοντέλο τεχνητής νοημοσύνης πίσω από αυτό, το Gato. Το Gato μπορεί να επεξεργαστεί ενέργειες, εικόνες και γλώσσες τόσο στον πραγματικό κόσμο, όσο και σε περιβάλλοντα προσομοίωσης. Για να ξεκινήσει το RoboCat, η ομάδα έδωσε στον Gato ένα σετ εκπαίδευσης γεμάτο με ρομποτικά χέρια που εκτελούσαν εκατοντάδες διαφορετικές εργασίες.

Μόλις δημιουργήθηκε η αρχική του εκπαίδευση, ήρθε η ώρα για την αυτοβελτιούμενη τεχνητή νοημοσύνη της RoboCat να ξεκινήσει, βελτιώνοντας τις δεξιότητές της σε μια νέα εργασία σε πέντε βήματα:

  1. Δώστε του 100 έως 1.000 παραδείγματα της νέας εργασίας ή του ρομπότ, χρησιμοποιώντας έναν ρομποτικό βραχίονα που πιλοτάρεται από άνθρωπο.
  2. Συντονίστε με ακρίβεια το RoboCat σε αυτή τη συγκεκριμένη εργασία, δημιουργώντας έναν "spin-off παράκτορα" για να συνεχίσει να αναπτύσσεται.
  3. Ο πράκτορας spin-off εξασκεί την εργασία ξανά και ξανά, φυσικά και εικονικά — κατά μέσο όρο, 10.000 φορές.
  4. Πάρτε τα δεδομένα εκπαίδευσης από το πρώτο βήμα και συνδυάστε τα με τα δεδομένα που έφτιαξε ο spin-off πράκτορας.
  5. Χρησιμοποιήστε αυτό το πολύ μεγαλύτερο σύνολο δεδομένων για να εκπαιδεύσετε το RoboCat στη νέα του εργασία.

«Ο συνδυασμός όλης αυτής της εκπαίδευσης σημαίνει ότι το πιο πρόσφατο RoboCat βασίζεται σε ένα σύνολο δεδομένων εκατομμυρίων τροχιών, τόσο από πραγματικούς όσο και από προσομοιωμένους ρομποτικούς βραχίονες, συμπεριλαμβανομένων των δεδομένων που παράγονται από τον ίδιο τον εαυτό τους», έγραψε η ομάδα.

Όλα αυτά τα ποικίλα παραδείγματα επιτρέπουν στο RoboCat να μάθει πώς να χειρίζεται έναν νέο ρομποτικό βραχίονα μέσα σε λίγες ώρες. Για παράδειγμα, η ομάδα μπόρεσε να μετακινήσει το RoboCat από έναν βραχίονα με δύο δόντια σε έναν βραχίονα με τρία σκέλη.

«Μετά από παρατήρηση 1000 επιδείξεων ελεγχόμενων από τον άνθρωπο, που συλλέχθηκαν μέσα σε λίγες ώρες, το RoboCat μπορούσε να κατευθύνει αυτόν τον νέο βραχίονα αρκετά επιδέξια, ώστε να πιάνει με επιτυχία τις ταχύτητες στο 86% των περιπτώσεων», έγραψε η ομάδα.

Με τον ίδιο αριθμό επιδείξεων, το RoboCat θα μπορούσε επίσης να μάθει πιο προηγμένες εργασίες, «οι οποίες είναι απαραίτητες για πιο περίπλοκο έλεγχο», όπως το να βγάζεις το σωστό φρούτο από ένα μπολ ή να λύνει ένα παζλ.

Ωστόσο, αυτό το ποσοστό επιτυχίας σε διαφορετικές εργασίες διέφερε πάρα πολύ, ανέφερε το TechCrunch — από 13% έως 99%

Ως τεχνητή νοημοσύνη που βελτιώνεται μόνη της, όσο περισσότερες εργασίες μαθαίνει το RoboCat, τόσο καλύτερα θα μαθαίνει νέες εργασίες. Αυτό συμβαίνει επειδή η τεχνητή νοημοσύνη έχει περισσότερη εμπειρία να αξιοποιήσει, παρόμοια με το πώς μαθαίνουν οι άνθρωποι με την πάροδο του χρόνου.

«Η ικανότητα του RoboCat να μαθαίνει δεξιότητες και να αυτοβελτιώνεται γρήγορα, ειδικά όταν εφαρμόζεται σε διαφορετικές ρομποτικές συσκευές, θα βοηθήσει να ανοίξει ο δρόμος προς μια νέα γενιά πιο χρήσιμων ρομποτικών πρακτόρων γενικής χρήσης», έγραψαν οι επιστήμονες.

Διαβαστε επισης