ARTIFICIAL INTELLIGENCE – ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ

Η Anthropic δημιουργήθηκε από πρώην υπαλλήλους της OpenAI οι οποίοι παραιτήθηκαν διότι ήρθαν σε αντίθεση με την «εμπορευματοποίηση» της.

ARTIFICIAL INTELLIGENCE – ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ

Ενημέρωση και Εξελίξεις

AI Update 2 – 20.05.2023

[Η ΤΝ είναι εδώ και θα μείνει. Ήδη επηρεάζει την ζωή μας και προβλέπεται ότι θα την επηρεάσει σε συγκλονιστικό βαθμό τα επόμενα χρόνια. Το «AI Update» της Athenian Herald, φιλοδοξεί να σας παρέχει κατά καιρούς, γρήγορη, ουσιαστική και περιεκτική ενημέρωση για τις σχετικές εξελίξεις και τους προβληματισμούς για το τεράστιο αυτό ζήτημα που, κατά γενική ομολογία, θα αλλάξει την ανθρωπότητα.]

Επιμέλεια: Ηλιάνα Θέμελη

Τεχνητή Νοημοσύνη 101: Τι είναι το ChatGPT;

Τα βασικά

Το ChatGPT είναι πρόγραμμα τεχνητής νοημοσύνης το οποίο βγήκε σε κυκλοφορία τον Νοέμβριο 2022 και έχει ήδη εκατομμύρια  χρήστες. Συγκεκριμένα, είναι ένα γλωσσικό μοντέλο που αναπτύχθηκε από την εταιρεία OpenAI και βασίζεται στην generative artificial intelligence, δηλαδή στην τεχνητή νοημοσύνη που σκοπεύει στην παραγωγή ή δημιουργία νέου περιεχομένου ή πληροφοριών.

Επιτρέπει συνομιλίες, παρέχει απαντήσεις σε διάφορες ερωτήσεις, συγγράφει κείμενα, ποιήματα, στίχους. Μάλιστα τα κείμενα που παράγει είναι πανεπιστημιακού επιπέδου. Βέβαια, υπάρχουν και επαγγελματικές δεξιότητες που μαθαίνονται σε πανεπιστήμια στις οποίες δεν μπορεί να εκπαιδευτεί το ChatGPT. Ανάμεσα σε αυτές είναι και η λογιστική. Έρευνα μεταξύ 187 πανεπιστημίων πάνω στην λογιστική έδειξε σε διαγώνισμα πανεπιστημιακού επιπέδου ότι ο μέσος φοιτητής έλαβε βαθμολογία 76,7%, ενώ ο αλγόριθμος 47,4%. Σύμφωνα με τη μελέτη, το ChatGPT σημείωσε υψηλότερη βαθμολογία από το μέσο όρο των φοιτητών στο 11,3% των ερωτήσεων, ιδίως στα λογιστικά πληροφοριακά συστήματα (accounting information systems) και στην ελεγκτική. Ωστόσο, ο αλγόριθμος δυσκολεύτηκε στις φορολογικές, οικονομικές και διαχειριστικές αξιολογήσεις, γεγονός που οι ερευνητές υποθέτουν ότι μπορεί να οφείλεται στη δυσκολία του με τις απαιτούμενες μαθηματικές διαδικασίες. Οι ερευνητές επισήμαναν επίσης ότι το ChatGPT δυσκολευόταν να απαντήσει σε ερωτήσεις υψηλότερης δυσκολίας και μερικές φορές παρείχε λανθασμένες απαντήσεις με αξιόπιστες γραπτές εξηγήσεις ή απαντούσε στην ίδια ερώτηση με διαφορετικούς τρόπους.

Ο αλγόριθμος αντλεί λεξιλόγιο και πληροφορίες από τεράστιο αριθμό δεδομένων και ταυτόχρονα «καταλαβαίνει» το νόημα κάθε λέξης στην πρόταση, το οποίο είναι και μέρος της πρωτοπορίας του. Για αυτόν τον λόγο, μπορεί να κάνει follow-up ερωτήσεις προκειμένου να μπορέσει να απαντήσει στην ερώτηση, χωρίς να χρειάζεται ο ίδιος ο χρήστης να αλλάξει την αρχική του ερώτηση. (Περισσότερα γράφαμε εδώ)

Η χρήση του είναι δωρεάν αλλά η OpenAI ανακοίνωσε ότι θα ξεκινήσει να παρέχει τις υπηρεσίες ChatGPT Plus με μηνιαία συνδρομή 20 δολαρίων στις ΗΠΑ για τους χρήστες που θέλουν συντομότερο χρόνο απόκρισης, πρόσβαση ακόμα και όταν η υπηρεσία «υπερθερμαίνεται», καθώς και γρηγορότερη πρόσβαση σε νέα features και εργαλεία.

Περιορισμοί

Ειδικοί προειδοποιούν ότι υπάρχει διαφορά στον τρόπο που οι άνθρωποι χρησιμοποιούν τη γλώσσα με τον τρόπο που το κάνουν τα γλωσσικά μοντέλα. Η ίδια η OpenAI εξηγεί στην ιστοσελίδα της ότι το ChatGPT γράφει μερικές φορές εύπιστες απαντήσεις, οι οποίες όμως είναι λανθασμένες ή παράλογες καθώς και ότι είναι περιορισμένη η πληροφόρησή του για τα γεγονότα μετά το 2021.

Κάποιες απαντήσεις του αποκαλύπτουν διακρίσεις λόγω εθνικότητας ή φύλου, κάτι που μάλλον οφείλεται σε σιωπηρές προκαταλήψεις ενσωματωμένες στην τεχνολογία που έχει χρησιμοποιηθεί για να το αναπτύξει. ο καθηγητής ψυχολογίας και νευροεπιστήμης του UC Berkeley, Steven Piantadosi, μοιράστηκε στο Twitter στις αρχές Δεκεμβρίου του 2022, πολλά από τα ανησυχητικά αποτελέσματα που ανακάλυψε κατά την εισαγωγή συγκεκριμένου κειμένου στο chatbot, όπως οι παρακάτω:

Προς το παρόν η OpenAI δεν αποκαλύπτει τις πηγές που χρησιμοποιεί για να παρέχει τις απαντήσεις, κάτι που προκαλεί πρόβλημα αξιοπιστίας των πληροφοριών του. Όμως εικάζεται ότι οι πληροφορίες προέρχονται από την ανάλυση blog όπως το Reddit και το StackOverflow. Για αυτόν τον λόγο το StackOverflow έχει ήδη ξεκινήσει να χρεώνει για τα δεδομένα του. Αξίζει να σημειωθεί ότι, σύμφωνα με εκτενές άρθρο που δημοσιεύτηκε στο medium (εδώ), το ChatGPT-3, η έκδοση που έγινε ευρέως γνωστή, εκπαιδεύτηκε σε δεδομένα 570GB, μεταξύ των οποίων το common crawl, το Wikipedia καθώς και απλές ιστοσελίδες σαν το προαναφερθέν reddit.

Το Common Crawl είναι ένα ανοικτό και δωρεάν στη χρήση σύνολο δεδομένων που περιέχει petabytes δεδομένων που συλλέγονται από το διαδίκτυο από το 2008. Για την εκπαίδευση του GPT-3 χρησιμοποιήθηκε ένα υποσύνολο αυτών των δεδομένων που καλύπτει τα έτη 2016 έως 2019. Πρόκειται για 45TB συμπιεσμένου απλού κειμένου πριν από το φιλτράρισμα και μόνο 570GB μετά.

Το WebText2 είναι το κείμενο των ιστοσελίδων από όλους τους εξερχόμενους συνδέσμους του Reddit από αναρτήσεις με 3+ upvotes. Τα Books1 & Books2 είναι δύο σώματα βιβλίων που βασίζονται στο διαδίκτυο. Οι σελίδες της Wikipedia στην αγγλική γλώσσα αποτελούν επίσης μέρος του σώματος εκπαίδευσης. Σημειώστε ότι κατά τη διάρκεια της εκπαίδευσης τα σύνολα δεδομένων τα οποία η ομάδα OpenAI θεώρησε ως υψηλότερης ποιότητας επιλέχθηκαν συχνότερα. Ως εκ τούτου, τα σύνολα δεδομένων Common Crawl και Books2 δειγματοληπτούνται λιγότερο από μία φορά κατά τη διάρκεια της εκπαίδευσης, αλλά τα υπόλοιπα σύνολα δεδομένων δειγματοληπτούνται 2-3 φορές. Αυτή η μικρή ποσότητα υπερπροσαρμογής ήταν το αντάλλαγμα για δεδομένα εκπαίδευσης υψηλότερης ποιότητας.

Το μέγεθος του συνόλου δεδομένων Common Crawl είναι υπεραρκετό για την εκπαίδευση των μεγαλύτερων μοντέλων, ωστόσο οι μη φιλτραρισμένες ή ελαφρώς φιλτραρισμένες εκδόσεις του Common Crawl τείνουν να είναι χαμηλότερης ποιότητας από τα πιο επιμελημένα σύνολα δεδομένων.

Ανταγωνισμός

Ανταγωνίζεται τις μηχανές αναζήτησης στο διαδίκτυο αφού παρέχει πολλά περισσότερα από απλά αποτελέσματα αναζήτησης. Η Microsoft, ουραγός και λιγότερο προηγμένη σε σχέση με την Google σε αλγορίθμους αναζήτησης, εικάζεται ότι επένδυσε $10δις στο OpenAI τον Φεβρουάριο του 2023, ώστε να ανταγωνιστεί την Google, την Apple και άλλους τεχνολογικούς κολοσσούς. Αυτή ήταν η 3ηεπένδυση της Microsoft στην OpenAI. Οι προηγούμενες έγιναν το 2019 ($1δις) και το 2021 ($2δις). Την ίδια ώρα η Google ανακοίνωσε την δημιουργία ενός extension (add-in) στην πλατφόρμα της ονόματι ChatGPT4Google (https://chatgpt4google.com/) δίνοντας τη δυνατότητα στους χρήστες να χρησιμοποιήσουν στο έπακρο όλες τις πτυχές του αλγορίθμου.

Παρόλα αυτά, η Google έχει επενδύσει και η ίδια σε εταιρεία που εξειδικεύεται στα μεγάλα γλωσσικά μοντέλα, την Anthropic. Επένδυσε $300εκ λίγο πριν την εκπνοή του 2022 και έλαβε το 10% της εταιρείας. Η Anthropic δημιούργησε το Claude, έναν πιθανό ανταγωνιστή του ChatGPT. Σήμερα προσφέρονται δύο εκδόσεις της Claude: Claude και Claude Instant. Η Claude είναι ένα υπερσύγχρονο μοντέλο υψηλών επιδόσεων, ενώ η Claude Instant είναι μια ελαφρύτερη, φθηνότερη και πολύ ταχύτερη επιλογή. Σκοπεύουν να παρουσιάσουν ακόμη περισσότερες ενημερώσεις τις επόμενες εβδομάδες. Ένας από τους βασικούς συνεργάτες τους, η Quora, προσέφερε την Claude στους χρήστες μέσω του Poe, της εφαρμογής AI Chat. "Οι χρήστες περιγράφουν τις απαντήσεις του Claude ως λεπτομερείς και εύκολα κατανοητές και τους αρέσει ότι οι ανταλλαγές μοιάζουν με φυσική συνομιλία", ανέφερε η Autumn Besselman, επικεφαλής του τμήματος People and Comms της Quora.

Σημειωτέον ότι η Anthropic δημιουργήθηκε από πρώην υπαλλήλους της OpenAI οι οποίοι παραιτήθηκαν διότι ήρθαν σε αντίθεση με την «εμπορευματοποίηση» της. Ειδικότερα, δεν τους άρεσε που το ChatGPT έγινε δημόσιο, χωρίς να υπάρχει επαρκής έλεγχος των παραγόμενων απαντήσεων.

Ας μην ξεχνάμε ότι η Google έχει φτιάξει και δικό της «in-house» αλγόριθμο τεχνητής νοημοσύνης όμοιο του ChatGPT τον οποίο λάνσαρε όπως όπως τον Φεβρουάριο, ύστερα από την τεράστια απήχηση του ChatGPT. Ο αλγόριθμος ονομάζεται Bard και έχει λάβει άδεια να χρησιμοποιηθεί σε 181 χώρες (συμπεριλαμβανομένων των ΗΠΑ). Η ΕΕ και ο Καναδάς δεν έχουν δώσει το «πράσινο φως» στην Google ακόμα. Σημειωτέο ότι, όταν η Google τον έδειξε στο κοινό, έκανε ένα τραγικό λάθος. Στο ερώτημα «Για ποιες νέες ανακαλύψεις από το διαστημικό τηλεσκόπιο James Webb μπορώ να μιλήσω στο 9χρονο παιδί μου;» το Bard προσέφερε τρία bullets ως απάντηση, συμπεριλαμβανομένου ενός που αναφέρει ότι το τηλεσκόπιο "τράβηξε τις πρώτες εικόνες ενός πλανήτη εκτός του δικού μας ηλιακού συστήματος". Πράγμα ψευδές, καθώς σύμφωνα με τη NASA η πρώτη φωτογραφία τραβήχτηκε το 2004.

Ακολουθήστε μας τώρα στο twitter στο @athenian_herald, στο instagram στο Athenian_Herald αλλά και στο facebook στο athenian.herald ή στην ιστοσελίδα μας.