Ubo Pod, el asistente de IA abierto con Raspberry Pi, visión y voz

  • Asistente de IA abierto basado en Raspberry Pi 4/5 con visión, voz y sensores
  • Hardware modular con privacidad fĆ­sica, IR, pantalla, LED y amplia conectividad
  • Software open-source, WebUI sin código y mĆ”s de 50 proveedores de IA
  • CampaƱa en Kickstarter con precios desde 109 $ sin incluir la Raspberry Pi

Asistente de IA abierto Ubo Pod

En un panorama dominado por altavoces inteligentes cerrados, aparece una alternativa que cambia las reglas: un asistente de IA de código abierto pensado para quienes quieren comprender y controlar lo que sucede bajo el capó. Ese hueco lo cubre Ubo Pod, un dispositivo que combina Raspberry Pi 4 o 5, voz, visión por computador y sensores, todo en una carcasa modular y reparable que no depende de servicios propietarios para funcionar.

La propuesta va mucho mÔs allÔ de pedir música o el tiempo. Ubo Pod integra micrófonos, altavoces, pantalla, cÔmara, sensores y hasta emisor y receptor de infrarrojos para hablar con modelos de lenguaje, reconocer lo que ve y, de paso, controlar tu tele o cualquier equipo compatible. Puedes elegir entre IA en la nube o totalmente local para priorizar la privacidad, y si te apetece experimentar, ofrece un entorno perfecto para desarrollar tus propias experiencias con voz, visión y herramientas.

QuƩ es Ubo Pod y quƩ pretende

La edición para desarrolladores, bautizada Developer Edition (DE), es el corazón del proyecto. Su misión es reemplazar las ā€œcajas negrasā€ tipo Amazon Echo o Google Nest con hardware abierto y software libre, sin ataduras a una plataforma concreta. AsĆ­, el mismo equipo habilita reconocimiento de voz (speech-to-text), sĆ­ntesis (text-to-speech), modelos de lenguaje y visión (LLMs/VLMs), llamadas a herramientas (tool calling) y diversos mecanismos de activación.

Ubo Pod no solo busca ser hackeable; también quiere ser cómodo para quien no quiera programar. Incluye una interfaz grÔfica embebida en su pequeña pantalla y una WebUI para configurarlo sin escribir código. Eso permite seleccionar servicios de IA, ajustar opciones y activar funciones desde el propio dispositivo o desde el navegador, con un enfoque prÔctico y claro.

La filosofía abierta se nota en todo el diseño. Tanto el software como el hardware son open-source, con repositorios públicos del código de la app Ubo y de las placas y archivos mecÔnicos. Si deseas auditar, modificar o contribuir, tienes el plano completo del sistema, algo inusual en este tipo de asistentes de consumo.

DiseƱo y hardware: modular, ampliable y reparable

El chasis de Ubo Pod es compacto y pensado para durar. Mide 130 x 99 x 52 mm y pesa unos 340 gramos, con un interior preparado para la Raspberry Pi 4 o la Raspberry Pi 5 y una gestión térmica activa que ayuda a mantener el rendimiento estable. La carcasa modular facilita sustituir componentes, ampliar el equipo y, si hace falta, repararlo sin dramas.

En el frontal destaca una pantalla IPS en color de 1,54 pulgadas con 240 x 240 píxeles. Aunque pequeña, la pantalla permite mostrar estado, menús y una interfaz embebida para configurar y consultar información al vuelo. A su lado, una cÔmara integrada de 5 MP aporta visión por computador. En la variante Ubo Pro 4 se admite ademÔs el uso de los módulos oficiales de cÔmara de Raspberry Pi V1 y V2; y en Ubo Pro 5 también se soporta el Raspberry Pi Camera Module 3, ampliando las posibilidades de visión.

El apartado acústico viene bien equipado para conversaciones naturales. Cuenta con doble micrófono estéreo con captura de audio de hasta 48 KHz, y altavoces estéreo con reproducción de hasta 48 KHz y distorsión muy contenida (<0,1% THD). En la documentación se mencionan 1 W por canal y en otra descripción se habla de 2 W por altavoz; en cualquier caso, el sistema estÔ orientado a la voz clara y a la interacción en escritorio o salón. Para usos externos, integra una salida de línea (WM8960) con 40 mW a 16 Ω, detección de inserción de jack, THD de -75 dB a 20 mW y SNR de 90 dB con carga de 16 Ω.

Para la interacción fĆ­sica, la unidad incluye un teclado con 7 botones de silicona ā€œsoft-touchā€ y un botón de encendido dedicado. AdemĆ”s, luce un anillo LED con 27 diodos RGB direccionables (SK6812), compatible con NeoPixel, perfecto para seƱales visuales, estados o efectos.

En conectividad, hereda lo mejor de la Raspberry. Dispone de Gigabit Ethernet, WiFi 5, Bluetooth 5.0, dos USB 3.0 y dos USB 2.0 en la SBC, por lo que no vas a echar en falta puertos para aƱadir perifƩricos o acelerar flujos de trabajo.

Uno de sus puntos diferenciales para el hogar es el control por infrarrojos. Integra receptor IR con alcance de hasta 5 metros (TSOP75238) y cuatro emisores IR de 940 nm de alta potencia y velocidad (VSMB10940), con patrón omnidireccional. Esto abre la puerta a manejar televisores, barras de sonido u otros equipos que acepten comandos IR, ya sea reenviando señales desde un mando universal o emitiéndolas por voz.

El sensorado también es completo. Trae un sensor de temperatura PCT2075 (precisión ±1 °C entre -25 °C y +100 °C) y un sensor de luz ambiental VEML7700, capaz de medir de 0 a 120 kilolux con resolución fina de 0,0036 lx/ct. Estos datos ambientales pueden integrarse en automatizaciones o en respuestas contextuales del asistente.

En almacenamiento, de serie incluye una tarjeta microSD de 32 GB preinstalada con el sistema operativo. La versión Ubo Pro 5 suma una ranura M.2 PCIe para SSD NVMe o para añadir un acelerador de IA, una mejora interesante si prevés correr modelos locales exigentes o guardar grandes bases de datos y memorias.

Hardware modular Ubo Pod

Privacidad real: cortina física y corte de micrófonos por hardware

MÔs allÔ del discurso, la privacidad se materializa en elementos físicos. La cÔmara se puede bloquear con una cortina de privacidad física, para que quede completamente tapada cuando no la quieras usar. Los micrófonos, por su parte, cuentan con un interruptor de desconexión por hardware, de manera que puedas silenciarlos sin confiar solo en software.

Esa apuesta se complementa con la arquitectura de software. Ubo Pod permite trabajar con servicios en la nube o de forma totalmente local, manteniendo el control de tus datos y ajustando el equilibrio entre comodidad y privacidad según el caso. Si quieres un asistente que no suba audio ni imÔgenes a servidores externos, puedes configurarlo para que todo ocurra en tu red o en el propio dispositivo.

Software abierto, WebUI sin código y mÔs de 50 proveedores de IA

Bajo el capó corre Raspberry Pi OS y la Ubo App, escrita en Python y publicada en GitHub. No necesitas comprar el aparato para probar la experiencia: la app se puede instalar en una Raspberry Pi 4 o 5, de modo que puedas experimentar con el software antes de decidirte por el hardware completo.

La compatibilidad con proveedores de IA es amplia. Ubo Pod soporta mÔs de 50 servicios para reconocimiento de voz, síntesis de voz, memoria, visión y modelos de lenguaje. Esa lista abarca opciones en la nube y soluciones locales/on-premise, y puedes seleccionarlas desde la pantalla integrada o vía la interfaz web.

Si prefieres elegir tú los modelos, también puedes. Es posible apuntar a direcciones de API de modelos populares como Gemini, ChatGPT o Claude, o utilizar Ollama para correr LLMs en el propio hardware, con lo que la latencia baja y los datos no salen de casa.

Para desarrollar extensiones, hay una API gRPC pensada para que en pocas líneas de código puedas añadir capacidades. Entre los ejemplos prÔcticos se incluyen un asistente de notas de voz (Memo) con memoria y contexto, generación de imÔgenes a partir de voz, descripción de imÔgenes mediante VLMs, o el control del televisor con el emisor IR mediante comandos de voz.

La capa de interacción se completa con varias formas de activar el asistente y con llamadas a herramientas (tool calling). En conjunto, ofrece un flujo conversacional rico que no se limita a respuestas de texto, sino que puede ejecutar acciones, leer sensores, mostrar información en la pantalla o iluminar el anillo LED según el estado.

Visión y control por infrarrojos: el hogar bajo tu voz

La cÔmara integrada y la compatibilidad con módulos oficiales de Raspberry Pi convierten a Ubo Pod en un dispositivo con visión propia. El sistema puede reconocer códigos, caracteres, gestos u objetos, lo que abre la puerta a casos de uso tan variados como leer un código en pantalla, detectar un gesto de confirmación o describir una escena.

El control universal mediante infrarrojos es otro punto fuerte orientado a la vida diaria. Puedes ā€œenseƱarleā€ comandos de tu mando favorito para que el asistente los reproduzca, o bien pedirle por voz que envĆ­e seƱales directamente a otros aparatos (como la tele o el aire acondicionado). Es el tipo de integración que hace que un asistente aporte utilidad inmediata desde el primer dĆ­a.

Experiencia de uso sin complicaciones… y lista para trastear

Aunque es un dispositivo para desarrolladores, no te obliga a serlo. Llega funcional desde el primer arranque y puedes limitarte a configurarlo desde su WebUI sin escribir una sola línea de código. De ahí en adelante, tú decides si te quedas con la experiencia bÔsica, o si entras en harina y creas tus propias apps, modelos o integraciones.

Quien disfrute ā€œlevantando el capĆ³ā€ encontrarĆ” un terreno de juego ideal. La modularidad del hardware y el software abierto facilitan sustituir componentes, aƱadir almacenamiento M.2 en el Pro 5 o probar aceleradores de IA. Y si te asusta romper algo, siempre puedes quedarte con lo que viene de serie: el potencial de personalización estĆ” ahĆ­ para cuando te apetezca.

Modelos, especificaciones clave y diferencias

La familia Ubo se articula en torno a las variantes que abrazan Raspberry Pi 4 o Raspberry Pi 5. Ubo Pro 4 y Ubo Pro 5 comparten la base (pantalla IPS 1,54ā€ 240Ɨ240, cĆ”mara 5 MP, doble micro y doble altavoz, IR, sensores, anillo LED, teclado de 7 botones), pero difieren en algunos puntos importantes.

En cÔmaras oficiales, Ubo Pro 4 soporta los módulos Raspberry Pi V1 y V2, mientras que Ubo Pro 5 añade compatibilidad con la Camera Module 3. La versión Pro 5 da otro salto con la ranura M.2 PCIe para SSD NVMe o aceleradores de IA, ideal para almacenamiento rÔpido o para descargar cómputo del procesador cuando ejecutes modelos locales.

Ambas comparten la base de conectividad de la SBC: Ethernet Gigabit, WiFi 5, Bluetooth 5.0, dos USB 3.0 y dos USB 2.0. En audio, ademÔs del sistema de altavoces estéreo y los micrófonos, la salida de línea WM8960 con detección de jack añade flexibilidad para equipos externos. El paquete se completa con tarjeta microSD de 32 GB preinstalada con el sistema operativo.

Precios, disponibilidad y la realidad del crowdfunding

El proyecto ha llegado a la comunidad mediante Kickstarter con un objetivo de financiación de 25.000 dólares. Las recompensas parten de 109 dólares para Ubo Pro 4 y 129 dólares para Ubo Pro 5. Es importante tener en cuenta que ninguna de estas versiones incluye la Raspberry Pi en la caja: deberÔs aportar tu propia SBC. Tampoco estÔn incluidos los gastos de envío.

Como en cualquier campaƱa de micromecenazgo, conviene tener presentes los riesgos. En uno de los avisos se recuerda que ā€œapoyar no es lo mismo que comprarā€: respaldar un proyecto no garantiza la entrega. SĆ© prudente, revisa la información, y valora el riesgo antes de comprometer tu dinero.

La pƔgina oficial de la campaƱa es: https://www.kickstarter.com/projects/ubopod/ubo-pod-hackable-personal-ai-assistant. El equipo anima a difundir el proyecto y a sumarse si te atrae la propuesta tƩcnica.

Estado del proyecto y mensaje del creador

El impulsor del Ubo Pod ha compartido que, a los dos días de lanzar la campaña, ya rozaba el 40% del objetivo. Pide un pequeño empujón para cruzar la meta y agradece la difusión, en especial entre perfiles técnicos a quienes les entusiasme el concepto.

Hay un aspecto poco común en el crowdfunding: se fabricó un lote pequeño por adelantado y existe algo de inventario listo para enviar de inmediato a los primeros patrocinadores. Esa decisión refleja los años de trabajo invertidos en el hardware y el software, y la pasión detrÔs del proyecto.

El objetivo declarado del creador es claro: dar poder a desarrolladores para construir experiencias interactivas con voz, visión y sensores con facilidad. También expresa su hartazgo con los dispositivos de grandes corporaciones: cerrados, atados a servicios y, en su opinión, poco respetuosos con los derechos del consumidor.

En cuanto a la visibilidad, solicita sugerencias para amplificar el alcance. Conoce las agencias de marketing de pago, pero ha decidido no tomar ese camino por ahora, apostando en su lugar por la comunidad y el boca a boca.

Configuración y flujo de trabajo (sin convertirlo en un tutorial)

Ubo Pod estÔ pensado para que pases de cero a útil en poco tiempo. La interfaz web guía la selección de proveedores de IA (voz, texto, visión, memoria) y la configuración bÔsica, mientras que la GUI integrada en pantalla permite ciertos ajustes sin necesidad de abrir el navegador.

Para quienes quieran evaluar antes de invertir en el hardware, la Ubo App puede instalarse en una Raspberry Pi 4/5 ā€œpeladaā€. AsĆ­ puedes comprobar compatibilidades, explorar el ecosistema y valorar quĆ© modelo te conviene mĆ”s o si te basta con correrlo en tu propia placa.

En escenarios de privacidad estricta, puedes optar por opciones locales o on-premise, evitando que el audio y las imƔgenes salgan de tu red. Y si buscas potencia o modelos especƭficos de terceros, tienes a tu alcance proveedores en la nube y la posibilidad de apuntar a APIs de Gemini, ChatGPT o Claude, entre otros.

Casos prƔcticos y demos ya disponibles

MÔs allÔ de la teoría, ya hay ejemplos funcionales que muestran de qué es capaz. Memo, el asistente de notas, mantiene memoria y contexto en la conversación, lo que lo hace ideal para capturar recordatorios o ideas sin perder el hilo.

En el apartado visual, puedes generar imÔgenes a partir de una instrucción de voz y obtener descripciones de imÔgenes mediante modelos de visión-lenguaje (VLMs). La precisión y utilidad dependerÔn de los proveedores y modelos que selecciones, pero la infraestructura estÔ preparada.

Para el salón, el control IR brilla con luz propia. Es perfectamente viable decirle al asistente que cambie de canal, ajuste el volumen o apague la tele, siempre que el equipo reciba órdenes por infrarrojos. En combinación con la detección ambiental (temperatura y luz), puedes crear comportamientos contextuales sencillos.

Por quƩ elegir un asistente abierto

Los asistentes cerrados ofrecen comodidad, pero a cambio de control y flexibilidad. Con Ubo Pod, eliges proveedores, decides dónde se procesan tus datos y puedes inspeccionar el código. Para muchos, esto no es un detalle, sino la diferencia entre usar una herramienta y ā€œser usadoā€ por ella.

AdemÔs, el hardware no estÔ soldado en una placa propietaria de un solo proveedor. El uso de Raspberry Pi te permite actualizar, reparar o reaprovechar componentes, algo especialmente valioso en un contexto de rÔpida obsolescencia tecnológica.

Limitaciones a considerar

Como todo proyecto de hardware abierto, hay matices importantes. Las recompensas no incluyen la Raspberry Pi, así que deberÔs sumar ese coste y disponibilidad. En audio, según la documentación, verÔs cifras que mencionan 1 W por canal y también 2 W por altavoz; si el volumen mÔximo es crucial para ti, valora el contexto de uso (escritorio o estancia pequeña) o el uso de la salida de línea con altavoces externos.

Por otro lado, es un proyecto en evolución. La lista de proveedores de IA, las funciones y el rendimiento local dependen de la comunidad, de las dependencias y de la Pi que montes (4 o 5). La buena noticia es que, al ser abierto, podrÔs adaptar y mejorar con el tiempo.

Ubo Pod encaja en un nicho que cada vez pide mĆ”s voz y mĆ”s control: gente que quiere un asistente Ćŗtil, con visión y sensores, pero sin renunciar a la privacidad y a la posibilidad de hurgar cuando le apetezca. Con hardware modular, software abierto, compatibilidad con mĆ”s de 50 proveedores de IA, opciones locales y una WebUI sin código, el proyecto pone en manos de la comunidad una alternativa real a las cajas negras del mercado. Si te late la idea, la campaƱa en Kickstarter —con precios que parten en 109 $ para el Pro 4 y 129 $ para el Pro 5, sin incluir la Raspberry Pi ni el envĆ­o— es el punto de partida para apoyar y, si eres de los primeros, incluso recibir unidades del lote inicial ya fabricado.