ChatGPT και Raspberry Pi, δημιουργώντας έναν προσωπικό βοηθό φωνής χρησιμοποιώντας AI

Βοηθός GPT, chatgpt και raspberry pi

Πώς θα θέλατε να αποκτήσετε ένα προσωπικός φωνητικός βοηθός χρησιμοποιώντας ChatGPT και Raspberry Pi? Κατάφεραν να δημιουργήσουν, με πολύ λίγους πόρους, έναν προσωπικό βοηθό που αναγνωρίζει τη φωνή και επιστρέφει τις απαντήσεις με ανθρώπινη φωνή.

Από τότε που εμφανίστηκε το ChatGPT, οι διάφοροι βοηθοί στην αγορά -θα χρησιμοποιήσουμε για παράδειγμα τους πιο δημοφιλείς, Siri ή Alexa-, υστερούν. Και είναι αυτό Το ChatGPT του OpenAI κάνει κύματα σε όλο τον κόσμο με τις δυνατότητές του. Ακόμη και ορισμένοι τομείς τον φοβούνται ήδη. Θα μπορούσε να είναι απατεώνας σε ορισμένες συναλλαγές; Η συζήτηση είναι ανοιχτή και η ρύθμιση της βρίσκεται στο τραπέζι. Αφήνοντας κατά μέρος το θέμα της νομιμότητας και της χρήσης του, σε αυτό το άρθρο θα σας δείξουμε πώς κατάφεραν να δημιουργήσουν έναν προσωπικό βοηθό φωνής χρησιμοποιώντας το chatbot ChatGPT και ένα Raspberry Pi.

Τι χρειάζεται για την εκτέλεση του έργου και τη ρύθμιση του φωνητικού βοηθού μας ChatGPT;

Ο χρήστης Edwight Delgado έχει επιτύχει -με βάση το έργο άλλου χρήστη nickbild– πραγματοποιήσει το έργο με πολύ λίγους πόρους και το οποίο έχει βαφτίσει ως βοηθός gpt. Αν θέλετε να αναπαράγετε το κατόρθωμά του, αυτό που θα χρειαστείτε είναι το εξής:

  • Raspberry Pi 4
  • Ένα μικρόφωνο που συνδέεται μέσω USB ή υποδοχής 3,5 mm
  • Ένας ομιλητής

Τρόποι λειτουργίας βοηθού GPT

Οδηγός GPT, πώς λειτουργεί

Πριν σας δώσουμε όλα τα κλειδιά για να ξεκινήσετε το έργο, θα σας εξηγήσουμε πώς λειτουργεί. Πρώτα απ 'όλα, ο Edwight έχει χρησιμοποιήσει την τεχνολογία της Google GTTS -Google text-to-speech- ώστε το ChatGPT να μεταφράζει το κείμενο που λαμβάνεται σε ομιλία και έτσι να μπορούμε να το προβάλλουμε αργότερα μέσω του ηχείου που χρησιμοποιούμε για το έργο.

επίσης Το ChatGPT και το Raspberry Pi θα γίνουν καλά κατανοητά χάρη στο γεγονός ότι ο χρήστης -εσύ σε αυτήν την περίπτωση- θα μιλήσει μέσω του μικροφώνου που έχεις συνδέσει στο Raspberry Pi σου. Αυτό το μήνυμα λαμβάνεται από το βιβλιοπωλείο αναγνώρισης ομιλίας που θα μεταφράσει αυτό το προφορικό μήνυμα σε κείμενο. Στη συνέχεια θα σταλεί στο ChatGPT ώστε να μπορεί να απαντήσει και το μήνυμά σας θα μεταφραστεί επίσης αντίστροφα. Δηλαδή, με την τεχνολογία της Google, η απάντηση κειμένου θα μεταφραστεί -ή θα μετατραπεί- σε ολόκληρο μήνυμα φωνητικά, με το πιο αγνό ύφος του Alexa της Amazon ή του Siri της Apple. Όλα θα λειτουργήσουν τόσο απλά.

Ο οδηγός εγκατάστασης GPT στο Raspberry Pi

Το πρώτο πράγμα που θα πρέπει να κάνετε είναι να δημιουργήσετε το εικονικό περιβάλλον:

python 3 -m venv venv

Δεύτερον, θα πρέπει να ενεργοποιήσετε το περιβάλλον βίαιο χτύπημα o con ψάρι:

source venv/bin/activate
source venv/bin/activate.fish

Μετά από αυτό το βήμα, πρέπει να εγκαταστήσετε τα απαραίτητα πακέτα και βιβλιοθήκες ως εξής:

pip install requirements.txt

Τέλος, πρέπει μετονομάστε το αρχείο .env.example σε .env και αλλάξτε το διακριτικό του αρχείου σε αυτό της σελίδας ChatGPT. Για να λάβετε το διακριτικό, πρέπει να εισαγάγετε το Επίσημη σελίδα OpenAI και το περιεχόμενο του auth-session-token θα χρειαστεί να το αντιγράψετε στο αρχείο .env. Θα το έχεις έτοιμο.

Βοηθός διακριτικού GPT

Εικόνα από τον Edwight Delgado

Τι θα πρέπει να κάνετε για να θέσετε σε λειτουργία τον βοηθό GPT;

Αν όλα πήγαν με επιτυχία, Ο βοηθός σας GPT θα είναι πλέον έτοιμος για χρήση. Όπως έχουμε αναφέρει προηγουμένως, τώρα είναι η ώρα να εφαρμόσετε όλα όσα έχουν εγκατασταθεί και να ξεκινήσετε κάνοντας ερωτήσεις στον βοηθό GPT. Για να καλέσετε τον βοηθό -και όπως και οι άλλοι βοηθοί φωνής λειτουργούν- είναι να πείτε το όνομά του πριν από οποιαδήποτε ερώτηση. Σε αυτήν την περίπτωση, η λέξη-κλειδί για την αφύπνιση είναι GPT. Από εκείνη τη στιγμή, μπορείτε να ρωτήσετε τι προτιμάτε. Τώρα, πρώτα από όλα πρέπει εισάγετε το σενάριο για να το εκτελέσετε:

python voice_chat.py

Εκείνη ακριβώς τη στιγμή, ο Βοηθός GPT θα σας χαιρετήσει και θα σας προσφέρει τη βοήθειά του. Δηλαδή, η απάντησή σας θα είναι η εξής:

'Hola, ¿en qué puedo ayudarte?'

Θα πρέπει να περιμένετε μερικά δευτερόλεπτα και να του κάνετε την ερώτηση μέσω του μικροφώνου που είναι συνδεδεμένο στο σύστημα. Όπως σας έχουμε ξαναπεί, πρέπει πρώτα να πείτε το όνομά τους και μετά την ερώτηση που θέλετε να κάνετε. Ενα παράδειγμα:

'GPT, ¿recomiéndame un buen restaurante cerca de mi posición'

Η απάντηση του bot θα πρέπει να εμφανιστεί μέσα σε λίγα δευτερόλεπτα. Και μέσα από μια ψηφιοποιημένη ανθρώπινη φωνή. Από την άλλη πλευρά, αν θέλετε να ολοκληρώσετε την ερώτηση, Πρέπει επίσης να κλείσετε τη συνεδρία φωνητικά λέγοντας μόνο "Adiós'ή'Ευχαριστώ πολύ και αντίο'.

Στο μεταξύ, σύμφωνα με τον Nickbild, διαβεβαιώνει -σύμφωνα με την εμπειρία του- ότι η εμπειρία είναι πολύ καλύτερη από ό,τι μπορεί να ληφθεί από βοηθούς όπως το Amazon Alexa ή το Google Home. Ωστόσο, προς το παρόν, για να ξυπνήσει ο οδηγός GPT, το σενάριο πρέπει να ξεκινήσει και όχι με φωνητική εντολή. Τώρα, έχει εξασφαλίσει ότι το έργο δεν θέλει να το αφήσει έτσι και εργάζεται ήδη για να ξυπνήσει τον φωνητικό βοηθό GPT μέσω μιας εντολής στο πιο αγνό στυλ 'Γεια, GPT'. Δηλαδή, ο οδηγός συνεχίζει να λειτουργεί στο παρασκήνιο και μπορεί να κληθεί ανά πάσα στιγμή ενώ ο υπολογιστής λειτουργεί. Τέλος, σας αφήνουμε μια επίδειξη βίντεο για το πώς λειτουργεί το έργο.


Ένα σχόλιο, αφήστε το δικό σας

Αφήστε το σχόλιό σας

Η διεύθυνση email σας δεν θα δημοσιευθεί. Τα υποχρεωτικά πεδία σημειώνονται με *

*

*

  1. Υπεύθυνος για τα δεδομένα: Miguel Ángel Gatón
  2. Σκοπός των δεδομένων: Έλεγχος SPAM, διαχείριση σχολίων.
  3. Νομιμοποίηση: Η συγκατάθεσή σας
  4. Κοινοποίηση των δεδομένων: Τα δεδομένα δεν θα κοινοποιούνται σε τρίτους, εκτός από νομική υποχρέωση.
  5. Αποθήκευση δεδομένων: Βάση δεδομένων που φιλοξενείται από τα δίκτυα Occentus (ΕΕ)
  6. Δικαιώματα: Ανά πάσα στιγμή μπορείτε να περιορίσετε, να ανακτήσετε και να διαγράψετε τις πληροφορίες σας.

  1.   Παύλος dijo

    Εκτιμώ αυτήν την ανάρτηση, έκανα τα πάντα με μη αυτόματο τρόπο χρησιμοποιώντας επεκτάσεις chrome για να μπορεί να μιλάει το chat gpt, αλλά μου έλειπε κάτι πιο "βιώσιμο"

    Θα υπήρχε τρόπος μέσα στα αρχεία να αλλάξω την "ενεργοποίηση" της φωνής gpt;