ChatGPT i Raspberry Pi, construint un assistent personal per veu usant AI

GPT assistent, chatgpt i raspberry pi

Què et semblaria aconseguir un assistent personal per veu usant ChatGPT i Raspberry Pi? Han aconseguit muntar, amb molt pocs recursos, un assistent personal que reconeix la veu i torna les respostes amb veu humana.

Des que aparegués ChatGPT, els diferents assistents del mercat -posarem com a exemple els més populars, Siri o Alexa-, s'estan quedant enrere. I és que ChatGPT d'OpenAI estan donant la bomba a tot el món amb les seves capacitats. Fins i tot, alguns sectors ja el tenen por; podria ser un impostor en alguns oficis? El debat és obert i la seva regulació és a sobre de la taula. Deixant de banda, el tema de la legalitat i el seu ús, en aquest article et mostrarem com han aconseguit construir un assistent personal per veu usant el chatbot ChatGPT i una Raspberry Pi.

Què cal per dur a terme el projecte i muntar el nostre ChatGPT assistent per veu?

l'usuari Edwight Delgado ha aconseguit -basant-se en un projecte d'un altre usuari Nickbild– dur a terme el projecte amb molt pocs recursos i que ha batejat com GPT assistent. Si vols reproduir la seva gesta, el que necessitaràs és el següent:

  • Gerd Pi 4
  • Un micròfon que es connecti per USB o per jack de 3,5 mm
  • un altaveu

Maneres operandi de GPT assistent

GPT assistent, com funciona

Abans de donar-te totes les claus per posar en funcionament el projecte, t'explicarem com n'és el funcionament. En primer lloc, Edwight ha fet servir la tecnologia de Google GTTS -Google text-to-speech- perquè ChatGPT tradueixi el text rebut a veu i així poder projectar-lo, posteriorment, per l'altaveu que usem per al projecte.

Així mateix, ChatGPT i Raspberry Pi s'entendrà bé gràcies al fet que l'usuari -tu en aquest cas- parlarà pel micròfon que hagis connectat al teu Raspberry Pi. Aquest missatge és rebut per la llibreria speech_recognition que traduirà aquest missatge parlat a text. Posteriorment serà enviat a ChatGPT perquè aquest pugui respondre i, el seu missatge també serà traduït a la inversa; és a dir, amb la tecnologia de Google es traduirà –o convertirà– la resposta en text en tot un missatge per veu, al més pur estil Alexa d'Amazon o Siri d'Apple. Així de simple funcionarà tot.

La instal·lació de GPT assistent a la Raspberry Pi

El primer que has de fer és crear l'ambient virtual:

python 3 -m venv venv

En segon lloc, hauràs d'activar l'ambient a colpejar o amb peix:

source venv/bin/activate
source venv/bin/activate.fish

Després d'aquest pas, hauràs d'instal·lar els paquets i llibreries necessàries de la manera següent:

pip install requirements.txt

Finalment, hauràs anomenar el fitxer .env.example per .env i canviar el token del fitxer pel de la pàgina de ChatGPT. Per aconseguir el token, hauràs d'ingressar a la pàgina oficial d'OpenAI i el contingut del auth-session-token hauràs de copiar-lo al fitxer .env. Ja ho tindràs llest.

Token GPT assistent

Imatge d'Edwight Delgado

Què hauràs de fer per engegar el GPT assistent?

Si tot ha sortit amb èxit, el teu GPT assistent ja estarà llest per fer-se servir. Com t'hem comentat anteriorment, ara és moment que posis en pràctica tot allò instal·lat i comencis per preguntar a GPT assistent alguna pregunta. Per invocar l'assistent –i igual que funcionen els altres assistents per veu– és a dir el seu nom abans de qualsevol pregunta. En aquest cas, la paraula clau per despertar-ho és GPT. A partir d'aquell moment, ja podràs preguntar què prefereixis. Ara bé, abans de res hauràs de introduir l'script per posar-lo en funcionament:

python voice_chat.py

En aquest precís moment, GPT assistent us saludarà i us oferirà la vostra ajuda. És a dir, la resposta serà la següent:

'Hola, ¿en qué puedo ayudarte?'

Tu hauràs d'esperar pocs segons i llençar-li la pregunta a través del micròfon connectat al sistema. Com t'hem dit anteriorment, hauràs de pronunciar el seu nom en primer lloc i tot seguit la pregunta que vulguis formular. Un exemple:

'GPT, ¿recomiéndame un buen restaurante cerca de mi posición'

La resposta del bot hauria d'aparèixer en pocs segons. I mitjançant una veu humana digitalitzada. D'altra banda, si vols acabar de preguntar, la sessió l'has de tancar també per veu dient únicament 'adéuoMoltes gràcies i adéu'.

Mentrestant, segons Nickbild assegura -segons la seva experiència- que l'experiència és molt millor que el que es pot rebre d'assistents com Alexa d'Amazon o Google Home. De moment, però, per despertar l'assistent GPT cal iniciar l'script i no per una comanda de veu. Ara bé, ha assegurat que el projecte no vol deixar-ho així i ja està treballant en la manera de despertar GPT assistent per veu mitjançant una ordre al més pur estil 'Hey, GPT'. És a dir, que l'assistent segueixi funcionant en segon pla i es pugui invocar en qualsevol moment mentre l'equip estigui en marxa. Per acabar, et deixem un vídeo de demostració de com funciona el projecte.


Un comentari, deixa el teu

Deixa el teu comentari

La seva adreça de correu electrònic no es publicarà. Els camps obligatoris estan marcats amb *

*

*

  1. Responsable de les dades: Miguel Ángel Gatón
  2. Finalitat de les dades: Controlar l'SPAM, gestió de comentaris.
  3. Legitimació: El teu consentiment
  4. Comunicació de les dades: No es comunicaran les dades a tercers excepte per obligació legal.
  5. Emmagatzematge de les dades: Base de dades allotjada en Occentus Networks (UE)
  6. Drets: En qualsevol moment pots limitar, recuperar i esborrar la teva informació.

  1.   Pau va dir

    Agraeixo aquest post, estava fent tot de manera manual mitjançant extensions de chrome perquè xat gpt parlés, però em faltava alguna cosa més «viable»

    Hi ha la forma dins dels fitxers per canviar l'activació de gpt voice?