चैटजीपीटी और रास्पबेरी पाई, एआई का उपयोग करके एक व्यक्तिगत आवाज सहायक का निर्माण

जीपीटी सहायक, चैटजीपीटी और रास्पबेरी पाई

आप कैसे प्राप्त करना चाहेंगे ChatGPT का उपयोग कर व्यक्तिगत आवाज सहायक और रास्पबेरी पाई? वे बहुत कम संसाधनों के साथ, एक निजी सहायक स्थापित करने में कामयाब रहे हैं जो आवाज को पहचानता है और मानव आवाज के साथ जवाब देता है।

जब से चैटजीपीटी सामने आया है, बाजार में विभिन्न सहायक-हम सबसे लोकप्रिय सहायकों का उपयोग करेंगे, सिरी या एलेक्सा, उदाहरण के तौर पर- पिछड़ रहे हैं। और वह है OpenAI का ChatGPT अपनी क्षमताओं से दुनिया भर में धूम मचा रहा है. यहां तक ​​कि कुछ सेक्टर पहले से ही उनसे डरते हैं; क्या यह कुछ ट्रेडों में एक बहुरूपिया हो सकता है? बहस खुली है और इसका विनियमन मेज पर है। वैधता और इसके उपयोग के मुद्दे को छोड़कर, इस लेख में हम आपको यह दिखाने जा रहे हैं कि कैसे उन्होंने ChatGPT चैटबॉट और रास्पबेरी पाई का उपयोग करके एक व्यक्तिगत वॉयस असिस्टेंट बनाने में कामयाबी हासिल की है।

प्रोजेक्ट को पूरा करने और हमारे वॉइस असिस्टेंट ChatGPT को सेट करने के लिए क्या आवश्यक है?

उपभोक्ता एड्वाइट डेलगाडो किसी अन्य उपयोगकर्ता की परियोजना के आधार पर हासिल किया है nickbild- बहुत कम संसाधनों के साथ परियोजना को पूरा करें और जिसे उन्होंने बपतिस्मा दिया है जीपीटी सहायक. यदि आप उसके करतब को पुन: उत्पन्न करना चाहते हैं, तो आपको निम्नलिखित की आवश्यकता होगी:

  • रास्पबेरी पाई 4
  • एक माइक्रोफ़ोन जो USB या 3,5 मिमी जैक के माध्यम से जुड़ता है
  • वक्ता

संचालन के जीपीटी सहायक मोड

GPT विज़ार्ड, यह कैसे काम करता है

प्रोजेक्ट शुरू करने के लिए आपको सभी चाबियां देने से पहले, हम बताएंगे कि यह कैसे काम करता है। सर्वप्रथम एड्वाइट ने गूगल तकनीक का प्रयोग किया है जीटीटीएस -गूगल टेक्स्ट-टू-स्पीच- ताकि चैटजीपीटी प्राप्त टेक्स्ट को भाषण में अनुवादित कर सके और इस प्रकार बाद में, उस स्पीकर के माध्यम से इसे प्रोजेक्ट करने में सक्षम हो जिसे हम प्रोजेक्ट के लिए उपयोग करते हैं।

भी, चैटजीपीटी और रास्पबेरी पाई को अच्छी तरह से समझा जा सकता है क्योंकि इस मामले में उपयोगकर्ता-आप- उस माइक्रोफोन के माध्यम से बोलेंगे जिसे आपने अपने रास्पबेरी पाई से जोड़ा है।. यह संदेश किताबों की दुकान द्वारा प्राप्त किया गया है वाक् पहचान जो उस बोले गए संदेश को टेक्स्ट में ट्रांसलेट करेगा। इसके बाद इसे ChatGPT को भेजा जाएगा ताकि यह प्रतिक्रिया दे सके और आपके संदेश का उल्टा अनुवाद भी किया जाएगा; कहने का मतलब यह है कि Google की तकनीक के साथ, टेक्स्ट प्रतिक्रिया का अनुवाद किया जाएगा - या ध्वनि द्वारा पूरे संदेश में परिवर्तित किया जाएगा, अमेज़ॅन की एलेक्सा या ऐप्पल की सिरी की शुद्धतम शैली में। यह सब इतना आसान काम करेगा।

रास्पबेरी पाई पर जीपीटी स्थापना विज़ार्ड

सबसे पहले आपको एक आभासी वातावरण बनाना होगा:

python 3 -m venv venv

दूसरे, आपको पर्यावरण को अंदर सक्रिय करना होगा खूब जोर से पीटना साथ मछली:

source venv/bin/activate
source venv/bin/activate.fish

उस चरण के बाद, आपको आवश्यक संकुल और पुस्तकालयों को निम्नानुसार स्थापित करना होगा:

pip install requirements.txt

अंत में, आपको करना चाहिए .env.example फ़ाइल का नाम बदलकर .env कर दें और फ़ाइल के टोकन को ChatGPT पेज के टोकन में बदल दें. टोकन प्राप्त करने के लिए, आपको दर्ज करना होगा ओपनएआई आधिकारिक पृष्ठ और की सामग्री प्रमाणीकरण-सत्र-टोकन आपको इसे .env फ़ाइल में कॉपी करना होगा। आपके पास यह तैयार होगा।

जीपीटी टोकन सहायक

एड्वाइट डेलगाडो द्वारा छवि

GPT सहायक को आगे बढ़ाने के लिए आपको क्या करना होगा?

यदि सब कुछ सफलतापूर्वक चला गया है, आपका GPT सहायक अब उपयोग के लिए तैयार हो जाएगा. जैसा कि हमने पहले उल्लेख किया है, अब समय आ गया है कि सभी स्थापित चीजों को अमल में लाया जाए और GPT सहायक से कोई भी प्रश्न पूछकर शुरू किया जाए। सहायक का आह्वान करने के लिए - और अन्य ध्वनि सहायकों की तरह ही काम करते हैं - किसी भी प्रश्न से पहले उसका नाम बोलना है। इस मामले में, इसे जगाने वाला कीवर्ड GPT है। उस क्षण से, आप पूछ सकते हैं कि आपको क्या पसंद है। अब, सबसे पहले आपको चाहिए इसे चलाने के लिए स्क्रिप्ट दर्ज करें:

python voice_chat.py

ठीक उसी क्षण, GPT सहायक आपका अभिवादन करेगा और अपनी सहायता प्रदान करेगा। अर्थात आपका उत्तर निम्न होगा:

'Hola, ¿en qué puedo ayudarte?'

आपको कुछ सेकंड इंतजार करना होगा और सिस्टम से जुड़े माइक्रोफोन के जरिए उनसे सवाल पूछना होगा। जैसा कि हम आपको पहले बता चुके हैं कि आपको पहले उनका नाम बोलना चाहिए और फिर वह प्रश्न जो आप पूछना चाहते हैं। एक उदाहरण:

'GPT, ¿recomiéndame un buen restaurante cerca de mi posición'

बॉट की प्रतिक्रिया कुछ सेकंड में दिखाई देनी चाहिए। और एक डिजीटल मानव आवाज के माध्यम से। दूसरी ओर, यदि आप पूछना समाप्त करना चाहते हैं, आपको सत्र को ध्वनि द्वारा भी बंद करना होगा कह कर ही'Adios''बहुत बहुत धन्यवाद और अलविदा'.

इस बीच, निकबिल्ड के अनुसार, वह आश्वासन देता है-अपने अनुभव के अनुसार- कि अनुभव अमेज़ॅन एलेक्सा या Google होम जैसे सहायकों से प्राप्त किए जा सकने वाले अनुभव से काफी बेहतर है. हालाँकि, फिलहाल, GPT विज़ार्ड को जगाने के लिए, स्क्रिप्ट को शुरू करना होगा न कि वॉयस कमांड द्वारा। अब, उन्होंने यह सुनिश्चित कर लिया है कि परियोजना इसे इस तरह नहीं छोड़ना चाहती है और शुद्धतम शैली में कमांड के माध्यम से GPT वॉयस असिस्टेंट को जगाने के रास्ते पर पहले से ही काम कर रहा है 'अरे, जीपीटी'. यही है, विज़ार्ड पृष्ठभूमि में काम करना जारी रखता है और कंप्यूटर चलने के दौरान किसी भी समय लागू किया जा सकता है। अंत में, हम आपको एक वीडियो प्रदर्शन दिखाते हैं कि परियोजना कैसे काम करती है।


एक टिप्पणी, अपनी छोड़ो

अपनी टिप्पणी दर्ज करें

आपका ईमेल पता प्रकाशित नहीं किया जाएगा। आवश्यक फ़ील्ड के साथ चिह्नित कर रहे हैं *

*

*

  1. डेटा के लिए जिम्मेदार: मिगुएल elngel Gatón
  2. डेटा का उद्देश्य: नियंत्रण स्पैम, टिप्पणी प्रबंधन।
  3. वैधता: आपकी सहमति
  4. डेटा का संचार: डेटा को कानूनी बाध्यता को छोड़कर तीसरे पक्ष को संचार नहीं किया जाएगा।
  5. डेटा संग्रहण: ऑकेंटस नेटवर्क्स (EU) द्वारा होस्ट किया गया डेटाबेस
  6. अधिकार: किसी भी समय आप अपनी जानकारी को सीमित, पुनर्प्राप्त और हटा सकते हैं।

  1.   पाब्लो कहा

    मैं इस पोस्ट की सराहना करता हूं, मैं क्रोम एक्सटेंशन का उपयोग करके मैन्युअल रूप से सब कुछ कर रहा था ताकि चैट जीपीटी बात कर सके, लेकिन मुझे कुछ और "व्यवहार्य" याद आ रहा था

    क्या फाइलों के भीतर जीपीटी आवाज के "सक्रियण" को बदलने का कोई तरीका होगा?