ChatGPT 和 Raspberry Pi,使用 AI 构建个人语音助手

GPT助手、chatgpt和树莓派

您想如何获得 使用 ChatGPT 的个人语音助手和 Raspberry Pi的? 他们设法用很少的资源建立了一个个人助理,可以识别声音并用人声回答问题。

自从 ChatGPT 出现以来,市场上的不同助手——我们将使用最流行的助手,例如 Siri 或 Alexa——都落后了。 就是这样 OpenAI 的 ChatGPT 正在世界范围内掀起波澜. 甚至一些部门已经害怕他; 会不会是某些行业的冒名顶替者? 辩论是公开的,其监管已摆在桌面上。 撇开合法性及其使用问题不谈,在本文中,我们将向您展示他们如何使用 ChatGPT 聊天机器人和 Raspberry Pi 成功构建个人语音助手。

执行该项目并设置我们的语音助手 ChatGPT 需要什么?

用户 埃德怀特·德尔加多 已实现 - 基于另一个用户的项目 尼克比尔德– 用很少的资源执行这个项目,他已经洗礼为 gpt助手. 如果你想重现他的壮举,你需要的是:

  • 树莓派4
  • 通过 USB 或 3,5 毫米插孔连接的麦克风
  • 演讲者

GPT助手操作模式

GPT 向导,它是如何工作的

在为您提供启动项目的所有关键之前,我们将解释它是如何工作的。 首先,Edwight 使用了 Google 技术 GTTS -谷歌文本转语音-这样 ChatGPT 就可以将收到的文本翻译成语音,从而能够稍后通过我们用于该项目的扬声器进行投影。

同时, ChatGPT 和 Raspberry Pi 将被很好地理解,因为用户(在本例中是您)将通过您连接到 Raspberry Pi 的麦克风讲话. 书店收到此消息 语音识别 这会将语音消息翻译成文本。 随后它将被发送到 ChatGPT,以便它可以响应,您的消息也将被反向翻译; 也就是说,借助谷歌的技术,文本响应将通过语音翻译或转换为完整的消息,采用亚马逊 Alexa 或苹果 Siri 最纯粹的风格。 一切都会这么简单。

Raspberry Pi 上的 GPT 安装向导

您要做的第一件事是创建虚拟环境:

python 3 -m venv venv

其次,你必须激活环境 打坏鱼露:

source venv/bin/activate
source venv/bin/activate.fish

在那一步之后,您必须安装必要的包和库,如下所示:

pip install requirements.txt

最后,你必须 将 .env.example 文件重命名为 .env 并将文件的令牌更改为 ChatGPT 页面的令牌. 要获取令牌,您必须输入 OpenAI 官方页面 和内容 身份验证会话令牌 您需要将其复制到 .env 文件中。 你会准备好的。

GPT代币助手

图片由埃德怀特·德尔加多拍摄

您需要做什么才能启动并运行 GPT 助手?

如果一切顺利, 您的 GPT 助手现在可以使用了. 正如我们之前提到的,现在是时候将所有安装的东西付诸实践,并开始向 GPT 助手询问任何问题。 要调用助手 - 就像其他语音助手的工作一样 - 就是在任何问题之前说出他的名字。 在这种情况下,唤醒它的关键字是 GPT。 从那一刻起,你可以问你喜欢什么。 现在,首先你必须 输入脚本运行它:

python voice_chat.py

就在那一刻,GPT Assistant 会问候你并提供帮助。 也就是说,您的答案将如下所示:

'Hola, ¿en qué puedo ayudarte?'

您将不得不等待几秒钟,然后通过连接到系统的麦克风向他提问。 正如我们之前告诉过你的,你必须先说出他们的名字,然后再说出你想问的问题。 一个例子:

'GPT, ¿recomiéndame un buen restaurante cerca de mi posición'

机器人的响应应该会在几秒钟内出现。 并通过数字化的人声。 另一方面,如果你想结束提问, 您还必须通过语音关闭会话 只说'一路平安'要么'非常感谢,再见“。

与此同时,根据 Nickbild 的说法,他保证——根据他的经验—— 体验比从亚马逊 Alexa 或 Google Home 等助手那里获得的体验要好得多. 但是,目前,要唤醒 GPT 向导,必须启动脚本,而不是通过语音命令。 现在,他已经确保该项目不想就这样离开,并且 已经在研究最纯粹的命令唤醒GPT语音助手的方法 '嘿,GPT'. 也就是说,该向导继续在后台工作,并且可以在计算机运行时随时调用。 最后,我们为您留下了该项目如何运作的视频演示。


发表评论,留下您的评论

发表您的评论

您的电子邮件地址将不会被发表。 必填字段标有 *

*

*

  1. 负责数据:MiguelÁngelGatón
  2. 数据用途:控制垃圾邮件,注释管理。
  3. 合法性:您的同意
  4. 数据通讯:除非有法律义务,否则不会将数据传达给第三方。
  5. 数据存储:Occentus Networks(EU)托管的数据库
  6. 权利:您可以随时限制,恢复和删除您的信息。

  1.   保罗

    我很欣赏这篇文章,我正在使用 chrome 扩展手动完成所有操作,以便聊天 gpt 可以说话,但我错过了一些更“可行”的东西

    文件中是否有办法更改 gpt 语音的“激活”?