ChatGPT ו-Raspberry Pi, בניית עוזר קול אישי באמצעות AI

עוזר GPT, chatgpt ו-raspberry pi

איך היית רוצה לקבל א עוזר קול אישי באמצעות ChatGPT ו פטל Pi? הם הצליחו להקים, במעט מאוד משאבים, עוזרת אישית שמזהה את הקול ומחזירה את התשובות בקול אנושי.

מאז הופעת ChatGPT, העוזרים השונים בשוק - נשתמש באלה הפופולריים ביותר, Siri או Alexa, כדוגמה - נפלו מאחור. וזהו זה ChatGPT של OpenAI מכה גלים ברחבי העולם עם היכולות שלהם. אפילו חלק מהמגזרים כבר חוששים ממנו; האם זה יכול להיות מתחזה בעסקאות מסוימות? הדיון פתוח והסדרתו על הפרק. אם נניח בצד את סוגיית החוקיות והשימוש בה, במאמר זה אנו הולכים להראות לכם כיצד הם הצליחו לבנות עוזר קול אישי באמצעות הצ'אטבוט ChatGPT ו-Raspberry Pi.

מה דרוש כדי לבצע את הפרויקט ולהגדיר את העוזר הקולי שלנו ChatGPT?

המשתמש אדווייט דלגדו השיג -מבוסס על פרויקט של משתמש אחר nickbild– לבצע את הפרויקט במעט מאוד משאבים ושאותו הטביל עוזר gpt. אם אתה רוצה לשחזר את ההישג שלו, מה שתצטרך זה את הדברים הבאים:

  • פטל Pi 4
  • מיקרופון שמתחבר באמצעות USB או שקע 3,5 מ"מ
  • דובר

מצבי פעולה של עוזר GPT

אשף GPT, איך זה עובד

לפני שניתן לך את כל המפתחות להתחיל את הפרויקט, נסביר איך זה עובד. קודם כל, אדווייט השתמש בטכנולוגיה של גוגל GTTS -גוגל טקסט לדיבור- כך ש-ChatGPT יתרגם את הטקסט שהתקבל לדיבור וכך יוכל להקרין אותו, מאוחר יותר, דרך הרמקול שאנו משתמשים בו לפרויקט.

גם, ChatGPT ו-Raspberry Pi יובנו היטב הודות לעובדה שהמשתמש - אתה במקרה זה - ידבר דרך המיקרופון שחיברת ל-Raspberry Pi שלך. הודעה זו מתקבלת בחנות הספרים זיהוי_דיבור אשר יתרגם את ההודעה המדוברת לטקסט. לאחר מכן הוא יישלח ל-ChatGPT כדי שיוכל להגיב וההודעה שלך תתורגם גם היא לאחור; כלומר, בטכנולוגיה של גוגל, תגובת הטקסט תתורגם -או תומר- להודעה שלמה בקול, בסגנון הטהור ביותר של אלקסה של אמזון או סירי של אפל. הכל יעבוד כל כך פשוט.

אשף ההתקנה של GPT ב-Raspberry Pi

הדבר הראשון שתצטרך לעשות הוא ליצור את הסביבה הוירטואלית:

python 3 -m venv venv

שנית, תצטרך להפעיל את הסביבה בה לחבוט או עם דג:

source venv/bin/activate
source venv/bin/activate.fish

לאחר שלב זה, עליך להתקין את החבילות והספריות הדרושות באופן הבא:

pip install requirements.txt

לבסוף, אתה חייב שנה את שם הקובץ .env.example ל-.env ושנה את האסימון של הקובץ לזה של דף ChatGPT. כדי לקבל את האסימון, עליך להזין את העמוד הרשמי של OpenAI והתוכן של Auth-Session-Token תצטרך להעתיק אותו לקובץ .env. יהיה לך מוכן.

עוזר אסימון GPT

תמונה מאת אדווייט דלגדו

מה תצטרכו לעשות כדי להפעיל את עוזר ה-GPT?

אם הכל עבר בהצלחה, עוזר ה-GPT שלך יהיה מוכן כעת לשימוש. כפי שציינו בעבר, עכשיו זה הזמן ליישם את כל מה שהותקן ולהתחיל לשאול את עוזר ה-GPT כל שאלה. להזעיק את העוזר - ובדיוק כמו שעוזרות הקול האחרות עובדות - זה לומר את שמו לפני כל שאלה. במקרה זה, מילת המפתח להעיר אותו היא GPT. מאותו רגע, אתה יכול לשאול מה אתה מעדיף. עכשיו, קודם כל אתה חייב הזן את הסקריפט כדי להפעיל אותו:

python voice_chat.py

ברגע המדויק, GPT Assistant יקבל את פניך ויציע את עזרתו. כלומר, התשובה שלך תהיה הבאה:

'Hola, ¿en qué puedo ayudarte?'

תצטרכו להמתין מספר שניות ולשאול אותו את השאלה דרך המיקרופון המחובר למערכת. כפי שאמרנו לכם בעבר, עליכם לומר תחילה את שמם ולאחר מכן את השאלה שאתם רוצים לשאול. דוגמה:

'GPT, ¿recomiéndame un buen restaurante cerca de mi posición'

תגובת הבוט אמורה להופיע תוך מספר שניות. ובאמצעות קול אנושי דיגיטאלי. מצד שני, אם אתה רוצה לסיים לשאול, עליך גם לסגור את הפגישה בקול אומר רק'עדיוס'אוֹ'תודה רבה ולהתראות'.

בינתיים, לפי ניקבילד, הוא מבטיח -לפי ניסיונו- זאת החוויה הרבה יותר טובה ממה שניתן לקבל מעוזרים כמו Amazon Alexa או Google Home. עם זאת, לעת עתה, כדי להעיר את אשף GPT, יש להפעיל את הסקריפט ולא בפקודה קולית. כעת, הוא הבטיח שהפרויקט לא ירצה להשאיר אותו כך כבר עובדים על הדרך להעיר את העוזרת הקולית GPT באמצעות פקודה בסגנון הכי טהור "היי, GPT". כלומר, האשף ממשיך לעבוד ברקע וניתן להפעיל אותו בכל עת בזמן שהמחשב פועל. לבסוף, אנו משאירים לכם הדגמת וידאו של איך הפרויקט עובד.


תגובה, השאר את שלך

השאירו את התגובה שלכם

כתובת הדוא"ל שלך לא תפורסם. שדות חובה מסומנים *

*

*

  1. אחראי לנתונים: מיגל אנחל גטון
  2. מטרת הנתונים: בקרת ספאם, ניהול תגובות.
  3. לגיטימציה: הסכמתך
  4. מסירת הנתונים: הנתונים לא יועברו לצדדים שלישיים אלא בהתחייבות חוקית.
  5. אחסון נתונים: מסד נתונים המתארח על ידי Occentus Networks (EU)
  6. זכויות: בכל עת תוכל להגביל, לשחזר ולמחוק את המידע שלך.

  1.   פול דיג'ו

    אני מעריך את הפוסט הזה, עשיתי הכל באופן ידני באמצעות הרחבות כרום כדי ש-chat gpt יוכל לדבר, אבל היה חסר לי משהו יותר "כדאי"

    האם תהיה דרך בתוך הקבצים לשנות את ה"הפעלה" של gpt voice?