Ένας επιστήμονας δεδομένων κλωνοποίησε την ομαδική συνομιλία των καλύτερων φίλων του χρησιμοποιώντας AI

Ένας επιστήμονας δεδομένων κλωνοποίησε την ομαδική συνομιλία των καλύτερων φίλων του χρησιμοποιώντας AI

Όπως το θέτει ο επιστήμονας δεδομένων Izzy Miller, η ομαδική συνομιλία είναι ένα ιερό πράγμα στη σημερινή κοινωνία. Είτε βρίσκεται στο iMessage, στο WhatsApp ή στο Discord, είναι το μέρος όπου εσείς και οι καλύτεροί σας φίλοι κάνετε παρέα, τραβάτε τα σκατά και μοιράζεστε ενημερώσεις για τη ζωή, τόσο ασήμαντη όσο και σημαντική. Σε έναν κόσμο όπου όλο και περισσότερο κάνουμε μπόουλινγκ μόνοι μας, μπορούμε, τουλάχιστον, να παραπονεθούμε στην ομαδική συνομιλία για το πόσο χάλασε το μπόουλινγκ αυτές τις μέρες.

Η ομαδική μου συνομιλία είναι σανίδα σωτηρίας και άνεση και σημείο σύνδεσης, λέει ο Μίλερ Το χείλος. Και απλά σκέφτηκα ότι θα ήταν ξεκαρδιστικό και κάπως απαίσιο να το αντικαταστήσω.

Χρησιμοποιώντας την ίδια τεχνολογία που τροφοδοτεί τα chatbots όπως το Microsofts Bing και το OpenAIs ChatGPT, ο Miller δημιούργησε έναν κλώνο της ομαδικής συνομιλίας των καλύτερων φίλων του, μια συνομιλία που εκτυλίσσεται καθημερινά τα τελευταία επτά χρόνια, από τότε που αυτός και πέντε φίλοι συναντήθηκαν για πρώτη φορά στο κολέγιο. Ήταν εκπληκτικά εύκολο να γίνει, λέει: ένα έργο που χρειάστηκε μερικά Σαββατοκύριακα δουλειάς και εκατό δολάρια για να ολοκληρωθεί. Αλλά τα τελικά αποτελέσματα είναι ασυνήθιστα.

Με εξέπληξε πραγματικά ο βαθμός στον οποίο το μοντέλο έμαθε εγγενώς πράγματα για το ποιοι είμαστε, όχι μόνο για τον τρόπο που μιλάμε, λέει ο Miller. Ξέρει πράγματα για το ποιοι βγαίναμε, πού πηγαίναμε σχολείο, το όνομα του σπιτιού μας που μέναμε κ.λπ.

Και, σε έναν κόσμο όπου τα chatbots γίνονται ολοένα και πιο πανταχού παρόντα και ολοένα και πιο πειστικά, η εμπειρία της ομαδικής συνομιλίας AI μπορεί να είναι μια κοινή κοινή χρήση σύντομα.

a:hover]:text-grey-63 [&>a:hover]:shadow-underline-black darkish:[&>a:hover]:text-grey-bd darkish:[&>a:hover]:σκιά-υπογράμμιση-γκρι [&>a]:shadow-underline-grey-63 darkish:[&>a]:text-grey-bd darkish:[&>a]:shadow-underline-gray”>Εικόνα: Izzy Miller

Το έργο κατέστη δυνατό χάρη στις πρόσφατες προόδους στην τεχνητή νοημοσύνη, αλλά εξακολουθεί να μην είναι κάτι που θα μπορούσε να πετύχει κανείς. Ο Miller είναι ένας επιστήμονας δεδομένων που παίζει με αυτό το είδος τεχνολογίας για λίγο, έχω λίγο κεφάλι στους ώμους μου, λέει και αυτή τη στιγμή εργάζεται σε μια startup που ονομάζεται Hex που τυχαίνει να παρέχει εργαλεία που βοηθούν ακριβώς αυτό το είδος έργου. Ο Μίλερ περιέγραψε όλα τα τεχνικά βήματα που απαιτούνται για την αναπαραγωγή του έργου σε μια ανάρτηση ιστολογίου, όπου παρουσίασε την ομαδική συνομιλία AI και τη βάφτισε robo boys.

Η δημιουργία των robo boys ακολουθεί, όμως, ένα γνωστό μονοπάτι. Ξεκινά με ένα μεγάλο γλωσσικό μοντέλο, ή LLM ένα σύστημα εκπαιδευμένο σε τεράστιες ποσότητες κειμένου που έχουν αφαιρεθεί από τον ιστό και άλλες πηγές που έχει ευρείες αλλά ακατέργαστες γλωσσικές δεξιότητες. Στη συνέχεια, το μοντέλο βελτιώθηκε, πράγμα που σημαίνει ότι το τροφοδοτεί με ένα πιο εστιασμένο σύνολο δεδομένων προκειμένου να αναπαράγει μια συγκεκριμένη εργασία, όπως να απαντά σε ιατρικές ερωτήσεις ή να γράφει διηγήματα με τη φωνή ενός συγκεκριμένου συγγραφέα.

Ο Μίλερ χρησιμοποίησε 500.000 μηνύματα από την ομαδική συνομιλία του για να εκπαιδεύσει ένα μοντέλο AI που διέρρευσε

Σε αυτήν την περίπτωση, ο Miller βελτίωσε το σύστημα AI σε 500.000 μηνύματα που λήφθηκαν από την ομάδα του iMessage. Ταξινόμησε τα μηνύματα ανά συγγραφέα και ώθησε το μοντέλο να αντιγράψει την προσωπικότητα κάθε μέλους: Harvey, Henry, Wyatt, Kiebs, Luke και ο ίδιος ο Miller.

Είναι ενδιαφέρον ότι το μοντέλο γλώσσας που χρησιμοποίησε ο Miller για τη δημιουργία της ψεύτικης συνομιλίας έγινε από τον ιδιοκτήτη του Fb, Meta. Αυτό το σύστημα, LLaMA, είναι περίπου τόσο ισχυρό όσο το μοντέλο OpenAIs GPT-3 και αποτέλεσε αντικείμενο διαμάχης φέτος όταν διέρρευσε στο διαδίκτυο μια εβδομάδα μετά την ανακοίνωσή του. Ορισμένοι ειδικοί προειδοποίησαν ότι η διαρροή θα επέτρεπε σε κακόβουλους παράγοντες να κάνουν κατάχρηση του λογισμικού για ανεπιθύμητα μηνύματα και άλλους σκοπούς, αλλά κανείς δεν μάντευε ότι θα χρησιμοποιηθεί για αυτόν τον σκοπό.

Όπως λέει ο Miller, είναι σίγουρος ότι ο Meta θα του είχε δώσει πρόσβαση στο LLaMA αν το ζητούσε μέσω επίσημων καναλιών, αλλά η χρήση της διαρροής ήταν ευκολότερη. είδα [a script to download LLaMA] και σκέφτηκα, Ξέρεις, πιστεύω ότι αυτό θα αφαιρεθεί από το GitHub, και έτσι το αντέγραψα και το επικόλλησα και το αποθήκευσα σε ένα αρχείο κειμένου στην επιφάνεια εργασίας μου, λέει. Και μετά, ιδού, πέντε μέρες αργότερα, όταν σκέφτηκα, Ουάου, έχω αυτή την υπέροχη ιδέα, το μοντέλο είχε ζητηθεί από το DMCA από το GitHub αλλά το είχα ακόμα αποθηκευμένο.

Το έργο δείχνει πόσο εύκολο είναι να κατασκευαστεί αυτό το είδος συστήματος AI, λέει. Τα εργαλεία για να γίνουν αυτά τα πράγματα βρίσκονται σε τόσο διαφορετικό μέρος από ό,τι πριν από δύο, τρία χρόνια.

Στο παρελθόν, η δημιουργία ενός πειστικού κλώνου μιας ομαδικής συνομιλίας με έξι ξεχωριστές προσωπικότητες θα μπορούσε να είναι κάτι που θα χρειαζόταν μήνες για να το πετύχει μια ομάδα σε ένα πανεπιστήμιο. Τώρα, με λίγη εξειδίκευση και έναν μικροσκοπικό προϋπολογισμό, ένα άτομο μπορεί να φτιάξει ένα για διασκέδαση.

a:hover]:text-grey-63 [&>a:hover]:shadow-underline-black darkish:[&>a:hover]:text-grey-bd darkish:[&>a:hover]:σκιά-υπογράμμιση-γκρι [&>a]:shadow-underline-grey-63 darkish:[&>a]:text-grey-bd darkish:[&>a]:shadow-underline-gray”>Εικόνα: Izzy Miller

Μόλις το μοντέλο εκπαιδεύτηκε στα μηνύματα ομαδικών συνομιλιών, ο Μίλερ το συνέδεσε με έναν κλώνο της διεπαφής χρήστη iMessage της Apple και έδωσε στους φίλους του πρόσβαση. Οι έξι άνδρες και οι κλώνοι τεχνητής νοημοσύνης τους μπόρεσαν στη συνέχεια να συνομιλήσουν μαζί, με τα AI να αναγνωρίζονται από την έλλειψη επωνύμου.

Ο Μίλερ εντυπωσιάστηκε από την ικανότητα του συστήματος να αντιγράφει τους τρόπους του και των φίλων του. Λέει ότι ορισμένες από τις συνομιλίες έμοιαζαν τόσο αληθινές σαν μια διαφωνία σχετικά με το ποιος έπινε μπύρα Henrys που έπρεπε να ψάξει στο ιστορικό των ομαδικών συνομιλιών για να ελέγξει ότι το μοντέλο δεν αναπαρήγαγε απλώς κείμενο από τα δεδομένα προπόνησής του. (Αυτό είναι γνωστό στον κόσμο της τεχνητής νοημοσύνης ως overfitting και είναι ο μηχανισμός που μπορεί να κάνει τα chatbot να λογοκλοπούν τις πηγές τους.)

Υπάρχει κάτι τόσο ευχάριστο στο να αιχμαλωτίζεις τέλεια τη φωνή των φίλων σου, έγραψε ο Μίλερ στην ανάρτησή του στο weblog του. Δεν είναι τόσο νοσταλγία, αφού οι συζητήσεις δεν έγιναν ποτέ, αλλά είναι μια παρόμοια αίσθηση χαράς… Αυτό έχει πραγματικά προσφέρει περισσότερες ώρες βαθιάς απόλαυσης για μένα και τους φίλους μου από ό,τι θα μπορούσα να φανταστώ.

Δεν είναι τόσο νοσταλγία αφού οι συζητήσεις δεν έγιναν ποτέ, αλλά είναι μια παρόμοια αίσθηση χαράς.

Ωστόσο, το σύστημα εξακολουθεί να έχει προβλήματα. Ο Miller σημειώνει ότι η διάκριση μεταξύ των έξι διαφορετικών προσωπικοτήτων στην ομαδική συνομιλία μπορεί να θολώσει και ότι ένας σημαντικός περιορισμός είναι ότι το μοντέλο AI δεν έχει αίσθηση χρονολογίας και δεν μπορεί να διακρίνει αξιόπιστα μεταξύ γεγονότων στο παρελθόν και το παρόν (ένα πρόβλημα που επηρεάζει όλα τα chatbot σε κάποιο βαθμό). Οι προηγούμενες φίλες μπορεί να αναφέρονται σαν να ήταν νυν σύντροφοι, για παράδειγμα. όπως και παλιές δουλειές και σπίτια.

Ο Miller λέει ότι η αίσθηση του συστήματος για το τι είναι πραγματικό δεν βασίζεται σε μια ολιστική κατανόηση της συνομιλίας σχετικά με την ανάλυση ειδήσεων και ενημερώσεων, αλλά Ενταση ΗΧΟΥ των μηνυμάτων. Με άλλα λόγια, όσο περισσότερο γίνεται λόγος για κάτι, τόσο πιο πιθανό είναι να αναφερθεί από τα bots. Ένα απροσδόκητο αποτέλεσμα αυτού είναι ότι οι κλώνοι τεχνητής νοημοσύνης τείνουν να ενεργούν σαν να ήταν ακόμα στο κολέγιο, καθώς τότε ήταν πιο ενεργή η ομαδική συνομιλία.

Το μοντέλο πιστεύει ότι είναι 2017 και αν το ρωτήσω πόσο χρονών είμαστε, λέει ότι ήταν 21 και 22, λέει ο Miller. Θα πηγαίνει στις εφαπτομένες και θα λέει, Πού είσαι;, Ω, είμαι στην καφετέρια, έλα. Αυτό δεν σημαίνει ότι δεν ξέρει με ποιον βγαίνω αυτήν τη στιγμή ή πού μένω, αλλά αφημένος στην τύχη του, νομίζει ότι είμαστε οι εαυτοί μας της κολεγιακής εποχής. Σταματά για ένα δευτερόλεπτο και γελάει: Κάτι που πραγματικά συμβάλλει στο χιούμορ όλων. Είναι ένα παράθυρο στο παρελθόν.

Το έργο απεικονίζει την αυξανόμενη δύναμη των chatbots AI και, ειδικότερα, την ικανότητά τους να αναπαράγουν τους τρόπους και τις γνώσεις συγκεκριμένων ατόμων.