Què et semblaria aconseguir un assistent personal per veu usant ChatGPT i Raspberry Pi? Han aconseguit muntar, amb molt pocs recursos, un assistent personal que reconeix la veu i torna les respostes amb veu humana.
Des que aparegués ChatGPT, els diferents assistents del mercat -posarem com a exemple els més populars, Siri o Alexa-, s'estan quedant enrere. I és que ChatGPT d'OpenAI estan donant la bomba a tot el món amb les seves capacitats. Fins i tot, alguns sectors ja el tenen por; podria ser un impostor en alguns oficis? El debat és obert i la seva regulació és a sobre de la taula. Deixant de banda, el tema de la legalitat i el seu ús, en aquest article et mostrarem com han aconseguit construir un assistent personal per veu usant el chatbot ChatGPT i una Raspberry Pi.
Índex
Què cal per dur a terme el projecte i muntar el nostre ChatGPT assistent per veu?
l'usuari Edwight Delgado ha aconseguit -basant-se en un projecte d'un altre usuari Nickbild– dur a terme el projecte amb molt pocs recursos i que ha batejat com GPT assistent. Si vols reproduir la seva gesta, el que necessitaràs és el següent:
- Gerd Pi 4
- Un micròfon que es connecti per USB o per jack de 3,5 mm
- un altaveu
Maneres operandi de GPT assistent
Abans de donar-te totes les claus per posar en funcionament el projecte, t'explicarem com n'és el funcionament. En primer lloc, Edwight ha fet servir la tecnologia de Google GTTS -Google text-to-speech- perquè ChatGPT tradueixi el text rebut a veu i així poder projectar-lo, posteriorment, per l'altaveu que usem per al projecte.
Així mateix, ChatGPT i Raspberry Pi s'entendrà bé gràcies al fet que l'usuari -tu en aquest cas- parlarà pel micròfon que hagis connectat al teu Raspberry Pi. Aquest missatge és rebut per la llibreria speech_recognition que traduirà aquest missatge parlat a text. Posteriorment serà enviat a ChatGPT perquè aquest pugui respondre i, el seu missatge també serà traduït a la inversa; és a dir, amb la tecnologia de Google es traduirà –o convertirà– la resposta en text en tot un missatge per veu, al més pur estil Alexa d'Amazon o Siri d'Apple. Així de simple funcionarà tot.
La instal·lació de GPT assistent a la Raspberry Pi
El primer que has de fer és crear l'ambient virtual:
python 3 -m venv venv
En segon lloc, hauràs d'activar l'ambient a colpejar o amb peix:
source venv/bin/activate
source venv/bin/activate.fish
Després d'aquest pas, hauràs d'instal·lar els paquets i llibreries necessàries de la manera següent:
pip install requirements.txt
Finalment, hauràs anomenar el fitxer .env.example per .env i canviar el token del fitxer pel de la pàgina de ChatGPT. Per aconseguir el token, hauràs d'ingressar a la pàgina oficial d'OpenAI i el contingut del auth-session-token hauràs de copiar-lo al fitxer .env. Ja ho tindràs llest.
Imatge d'Edwight Delgado
Què hauràs de fer per engegar el GPT assistent?
Si tot ha sortit amb èxit, el teu GPT assistent ja estarà llest per fer-se servir. Com t'hem comentat anteriorment, ara és moment que posis en pràctica tot allò instal·lat i comencis per preguntar a GPT assistent alguna pregunta. Per invocar l'assistent –i igual que funcionen els altres assistents per veu– és a dir el seu nom abans de qualsevol pregunta. En aquest cas, la paraula clau per despertar-ho és GPT. A partir d'aquell moment, ja podràs preguntar què prefereixis. Ara bé, abans de res hauràs de introduir l'script per posar-lo en funcionament:
python voice_chat.py
En aquest precís moment, GPT assistent us saludarà i us oferirà la vostra ajuda. És a dir, la resposta serà la següent:
'Hola, ¿en qué puedo ayudarte?'
Tu hauràs d'esperar pocs segons i llençar-li la pregunta a través del micròfon connectat al sistema. Com t'hem dit anteriorment, hauràs de pronunciar el seu nom en primer lloc i tot seguit la pregunta que vulguis formular. Un exemple:
'GPT, ¿recomiéndame un buen restaurante cerca de mi posición'
La resposta del bot hauria d'aparèixer en pocs segons. I mitjançant una veu humana digitalitzada. D'altra banda, si vols acabar de preguntar, la sessió l'has de tancar també per veu dient únicament 'adéuoMoltes gràcies i adéu'.
Mentrestant, segons Nickbild assegura -segons la seva experiència- que l'experiència és molt millor que el que es pot rebre d'assistents com Alexa d'Amazon o Google Home. De moment, però, per despertar l'assistent GPT cal iniciar l'script i no per una comanda de veu. Ara bé, ha assegurat que el projecte no vol deixar-ho així i ja està treballant en la manera de despertar GPT assistent per veu mitjançant una ordre al més pur estil 'Hey, GPT'. És a dir, que l'assistent segueixi funcionant en segon pla i es pugui invocar en qualsevol moment mentre l'equip estigui en marxa. Per acabar, et deixem un vídeo de demostració de com funciona el projecte.
Un comentari, deixa el teu
Agradezco este post, estaba haciendo todo de manera manual mediante extensiones de chrome para que chat gpt hablara, pero me faltaba algo mas «viable»
Existira la forma dentro de los archivos para cambiar la «activacion» de gpt voice?