Ubo Pod, el asistente de IA abierto con Raspberry Pi, visión y voz

  • Asistente de IA abierto basado en Raspberry Pi 4/5 con visión, voz y sensores
  • Hardware modular con privacidad física, IR, pantalla, LED y amplia conectividad
  • Software open-source, WebUI sin código y más de 50 proveedores de IA
  • Campaña en Kickstarter con precios desde 109 $ sin incluir la Raspberry Pi

Asistente de IA abierto Ubo Pod

En un panorama dominado por altavoces inteligentes cerrados, aparece una alternativa que cambia las reglas: un asistente de IA de código abierto pensado para quienes quieren comprender y controlar lo que sucede bajo el capó. Ese hueco lo cubre Ubo Pod, un dispositivo que combina Raspberry Pi 4 o 5, voz, visión por computador y sensores, todo en una carcasa modular y reparable que no depende de servicios propietarios para funcionar.

La propuesta va mucho más allá de pedir música o el tiempo. Ubo Pod integra micrófonos, altavoces, pantalla, cámara, sensores y hasta emisor y receptor de infrarrojos para hablar con modelos de lenguaje, reconocer lo que ve y, de paso, controlar tu tele o cualquier equipo compatible. Puedes elegir entre IA en la nube o totalmente local para priorizar la privacidad, y si te apetece experimentar, ofrece un entorno perfecto para desarrollar tus propias experiencias con voz, visión y herramientas.

Qué es Ubo Pod y qué pretende

La edición para desarrolladores, bautizada Developer Edition (DE), es el corazón del proyecto. Su misión es reemplazar las “cajas negras” tipo Amazon Echo o Google Nest con hardware abierto y software libre, sin ataduras a una plataforma concreta. Así, el mismo equipo habilita reconocimiento de voz (speech-to-text), síntesis (text-to-speech), modelos de lenguaje y visión (LLMs/VLMs), llamadas a herramientas (tool calling) y diversos mecanismos de activación.

Ubo Pod no solo busca ser hackeable; también quiere ser cómodo para quien no quiera programar. Incluye una interfaz gráfica embebida en su pequeña pantalla y una WebUI para configurarlo sin escribir código. Eso permite seleccionar servicios de IA, ajustar opciones y activar funciones desde el propio dispositivo o desde el navegador, con un enfoque práctico y claro.

La filosofía abierta se nota en todo el diseño. Tanto el software como el hardware son open-source, con repositorios públicos del código de la app Ubo y de las placas y archivos mecánicos. Si deseas auditar, modificar o contribuir, tienes el plano completo del sistema, algo inusual en este tipo de asistentes de consumo.

Diseño y hardware: modular, ampliable y reparable

El chasis de Ubo Pod es compacto y pensado para durar. Mide 130 x 99 x 52 mm y pesa unos 340 gramos, con un interior preparado para la Raspberry Pi 4 o la Raspberry Pi 5 y una gestión térmica activa que ayuda a mantener el rendimiento estable. La carcasa modular facilita sustituir componentes, ampliar el equipo y, si hace falta, repararlo sin dramas.

En el frontal destaca una pantalla IPS en color de 1,54 pulgadas con 240 x 240 píxeles. Aunque pequeña, la pantalla permite mostrar estado, menús y una interfaz embebida para configurar y consultar información al vuelo. A su lado, una cámara integrada de 5 MP aporta visión por computador. En la variante Ubo Pro 4 se admite además el uso de los módulos oficiales de cámara de Raspberry Pi V1 y V2; y en Ubo Pro 5 también se soporta el Raspberry Pi Camera Module 3, ampliando las posibilidades de visión.

El apartado acústico viene bien equipado para conversaciones naturales. Cuenta con doble micrófono estéreo con captura de audio de hasta 48 KHz, y altavoces estéreo con reproducción de hasta 48 KHz y distorsión muy contenida (<0,1% THD). En la documentación se mencionan 1 W por canal y en otra descripción se habla de 2 W por altavoz; en cualquier caso, el sistema está orientado a la voz clara y a la interacción en escritorio o salón. Para usos externos, integra una salida de línea (WM8960) con 40 mW a 16 Ω, detección de inserción de jack, THD de -75 dB a 20 mW y SNR de 90 dB con carga de 16 Ω.

Para la interacción física, la unidad incluye un teclado con 7 botones de silicona “soft-touch” y un botón de encendido dedicado. Además, luce un anillo LED con 27 diodos RGB direccionables (SK6812), compatible con NeoPixel, perfecto para señales visuales, estados o efectos.

En conectividad, hereda lo mejor de la Raspberry. Dispone de Gigabit Ethernet, WiFi 5, Bluetooth 5.0, dos USB 3.0 y dos USB 2.0 en la SBC, por lo que no vas a echar en falta puertos para añadir periféricos o acelerar flujos de trabajo.

Uno de sus puntos diferenciales para el hogar es el control por infrarrojos. Integra receptor IR con alcance de hasta 5 metros (TSOP75238) y cuatro emisores IR de 940 nm de alta potencia y velocidad (VSMB10940), con patrón omnidireccional. Esto abre la puerta a manejar televisores, barras de sonido u otros equipos que acepten comandos IR, ya sea reenviando señales desde un mando universal o emitiéndolas por voz.

El sensorado también es completo. Trae un sensor de temperatura PCT2075 (precisión ±1 °C entre -25 °C y +100 °C) y un sensor de luz ambiental VEML7700, capaz de medir de 0 a 120 kilolux con resolución fina de 0,0036 lx/ct. Estos datos ambientales pueden integrarse en automatizaciones o en respuestas contextuales del asistente.

En almacenamiento, de serie incluye una tarjeta microSD de 32 GB preinstalada con el sistema operativo. La versión Ubo Pro 5 suma una ranura M.2 PCIe para SSD NVMe o para añadir un acelerador de IA, una mejora interesante si prevés correr modelos locales exigentes o guardar grandes bases de datos y memorias.

Hardware modular Ubo Pod

Privacidad real: cortina física y corte de micrófonos por hardware

Más allá del discurso, la privacidad se materializa en elementos físicos. La cámara se puede bloquear con una cortina de privacidad física, para que quede completamente tapada cuando no la quieras usar. Los micrófonos, por su parte, cuentan con un interruptor de desconexión por hardware, de manera que puedas silenciarlos sin confiar solo en software.

Esa apuesta se complementa con la arquitectura de software. Ubo Pod permite trabajar con servicios en la nube o de forma totalmente local, manteniendo el control de tus datos y ajustando el equilibrio entre comodidad y privacidad según el caso. Si quieres un asistente que no suba audio ni imágenes a servidores externos, puedes configurarlo para que todo ocurra en tu red o en el propio dispositivo.

Software abierto, WebUI sin código y más de 50 proveedores de IA

Bajo el capó corre Raspberry Pi OS y la Ubo App, escrita en Python y publicada en GitHub. No necesitas comprar el aparato para probar la experiencia: la app se puede instalar en una Raspberry Pi 4 o 5, de modo que puedas experimentar con el software antes de decidirte por el hardware completo.

La compatibilidad con proveedores de IA es amplia. Ubo Pod soporta más de 50 servicios para reconocimiento de voz, síntesis de voz, memoria, visión y modelos de lenguaje. Esa lista abarca opciones en la nube y soluciones locales/on-premise, y puedes seleccionarlas desde la pantalla integrada o vía la interfaz web.

Si prefieres elegir tú los modelos, también puedes. Es posible apuntar a direcciones de API de modelos populares como Gemini, ChatGPT o Claude, o utilizar Ollama para correr LLMs en el propio hardware, con lo que la latencia baja y los datos no salen de casa.

Para desarrollar extensiones, hay una API gRPC pensada para que en pocas líneas de código puedas añadir capacidades. Entre los ejemplos prácticos se incluyen un asistente de notas de voz (Memo) con memoria y contexto, generación de imágenes a partir de voz, descripción de imágenes mediante VLMs, o el control del televisor con el emisor IR mediante comandos de voz.

La capa de interacción se completa con varias formas de activar el asistente y con llamadas a herramientas (tool calling). En conjunto, ofrece un flujo conversacional rico que no se limita a respuestas de texto, sino que puede ejecutar acciones, leer sensores, mostrar información en la pantalla o iluminar el anillo LED según el estado.

Visión y control por infrarrojos: el hogar bajo tu voz

La cámara integrada y la compatibilidad con módulos oficiales de Raspberry Pi convierten a Ubo Pod en un dispositivo con visión propia. El sistema puede reconocer códigos, caracteres, gestos u objetos, lo que abre la puerta a casos de uso tan variados como leer un código en pantalla, detectar un gesto de confirmación o describir una escena.

El control universal mediante infrarrojos es otro punto fuerte orientado a la vida diaria. Puedes “enseñarle” comandos de tu mando favorito para que el asistente los reproduzca, o bien pedirle por voz que envíe señales directamente a otros aparatos (como la tele o el aire acondicionado). Es el tipo de integración que hace que un asistente aporte utilidad inmediata desde el primer día.

Experiencia de uso sin complicaciones… y lista para trastear

Aunque es un dispositivo para desarrolladores, no te obliga a serlo. Llega funcional desde el primer arranque y puedes limitarte a configurarlo desde su WebUI sin escribir una sola línea de código. De ahí en adelante, tú decides si te quedas con la experiencia básica, o si entras en harina y creas tus propias apps, modelos o integraciones.

Quien disfrute “levantando el capó” encontrará un terreno de juego ideal. La modularidad del hardware y el software abierto facilitan sustituir componentes, añadir almacenamiento M.2 en el Pro 5 o probar aceleradores de IA. Y si te asusta romper algo, siempre puedes quedarte con lo que viene de serie: el potencial de personalización está ahí para cuando te apetezca.

Modelos, especificaciones clave y diferencias

La familia Ubo se articula en torno a las variantes que abrazan Raspberry Pi 4 o Raspberry Pi 5. Ubo Pro 4 y Ubo Pro 5 comparten la base (pantalla IPS 1,54” 240×240, cámara 5 MP, doble micro y doble altavoz, IR, sensores, anillo LED, teclado de 7 botones), pero difieren en algunos puntos importantes.

En cámaras oficiales, Ubo Pro 4 soporta los módulos Raspberry Pi V1 y V2, mientras que Ubo Pro 5 añade compatibilidad con la Camera Module 3. La versión Pro 5 da otro salto con la ranura M.2 PCIe para SSD NVMe o aceleradores de IA, ideal para almacenamiento rápido o para descargar cómputo del procesador cuando ejecutes modelos locales.

Ambas comparten la base de conectividad de la SBC: Ethernet Gigabit, WiFi 5, Bluetooth 5.0, dos USB 3.0 y dos USB 2.0. En audio, además del sistema de altavoces estéreo y los micrófonos, la salida de línea WM8960 con detección de jack añade flexibilidad para equipos externos. El paquete se completa con tarjeta microSD de 32 GB preinstalada con el sistema operativo.

Precios, disponibilidad y la realidad del crowdfunding

El proyecto ha llegado a la comunidad mediante Kickstarter con un objetivo de financiación de 25.000 dólares. Las recompensas parten de 109 dólares para Ubo Pro 4 y 129 dólares para Ubo Pro 5. Es importante tener en cuenta que ninguna de estas versiones incluye la Raspberry Pi en la caja: deberás aportar tu propia SBC. Tampoco están incluidos los gastos de envío.

Como en cualquier campaña de micromecenazgo, conviene tener presentes los riesgos. En uno de los avisos se recuerda que “apoyar no es lo mismo que comprar”: respaldar un proyecto no garantiza la entrega. Sé prudente, revisa la información, y valora el riesgo antes de comprometer tu dinero.

La página oficial de la campaña es: https://www.kickstarter.com/projects/ubopod/ubo-pod-hackable-personal-ai-assistant. El equipo anima a difundir el proyecto y a sumarse si te atrae la propuesta técnica.

Estado del proyecto y mensaje del creador

El impulsor del Ubo Pod ha compartido que, a los dos días de lanzar la campaña, ya rozaba el 40% del objetivo. Pide un pequeño empujón para cruzar la meta y agradece la difusión, en especial entre perfiles técnicos a quienes les entusiasme el concepto.

Hay un aspecto poco común en el crowdfunding: se fabricó un lote pequeño por adelantado y existe algo de inventario listo para enviar de inmediato a los primeros patrocinadores. Esa decisión refleja los años de trabajo invertidos en el hardware y el software, y la pasión detrás del proyecto.

El objetivo declarado del creador es claro: dar poder a desarrolladores para construir experiencias interactivas con voz, visión y sensores con facilidad. También expresa su hartazgo con los dispositivos de grandes corporaciones: cerrados, atados a servicios y, en su opinión, poco respetuosos con los derechos del consumidor.

En cuanto a la visibilidad, solicita sugerencias para amplificar el alcance. Conoce las agencias de marketing de pago, pero ha decidido no tomar ese camino por ahora, apostando en su lugar por la comunidad y el boca a boca.

Configuración y flujo de trabajo (sin convertirlo en un tutorial)

Ubo Pod está pensado para que pases de cero a útil en poco tiempo. La interfaz web guía la selección de proveedores de IA (voz, texto, visión, memoria) y la configuración básica, mientras que la GUI integrada en pantalla permite ciertos ajustes sin necesidad de abrir el navegador.

Para quienes quieran evaluar antes de invertir en el hardware, la Ubo App puede instalarse en una Raspberry Pi 4/5 “pelada”. Así puedes comprobar compatibilidades, explorar el ecosistema y valorar qué modelo te conviene más o si te basta con correrlo en tu propia placa.

En escenarios de privacidad estricta, puedes optar por opciones locales o on-premise, evitando que el audio y las imágenes salgan de tu red. Y si buscas potencia o modelos específicos de terceros, tienes a tu alcance proveedores en la nube y la posibilidad de apuntar a APIs de Gemini, ChatGPT o Claude, entre otros.

Casos prácticos y demos ya disponibles

Más allá de la teoría, ya hay ejemplos funcionales que muestran de qué es capaz. Memo, el asistente de notas, mantiene memoria y contexto en la conversación, lo que lo hace ideal para capturar recordatorios o ideas sin perder el hilo.

En el apartado visual, puedes generar imágenes a partir de una instrucción de voz y obtener descripciones de imágenes mediante modelos de visión-lenguaje (VLMs). La precisión y utilidad dependerán de los proveedores y modelos que selecciones, pero la infraestructura está preparada.

Para el salón, el control IR brilla con luz propia. Es perfectamente viable decirle al asistente que cambie de canal, ajuste el volumen o apague la tele, siempre que el equipo reciba órdenes por infrarrojos. En combinación con la detección ambiental (temperatura y luz), puedes crear comportamientos contextuales sencillos.

Por qué elegir un asistente abierto

Los asistentes cerrados ofrecen comodidad, pero a cambio de control y flexibilidad. Con Ubo Pod, eliges proveedores, decides dónde se procesan tus datos y puedes inspeccionar el código. Para muchos, esto no es un detalle, sino la diferencia entre usar una herramienta y “ser usado” por ella.

Además, el hardware no está soldado en una placa propietaria de un solo proveedor. El uso de Raspberry Pi te permite actualizar, reparar o reaprovechar componentes, algo especialmente valioso en un contexto de rápida obsolescencia tecnológica.

Limitaciones a considerar

Como todo proyecto de hardware abierto, hay matices importantes. Las recompensas no incluyen la Raspberry Pi, así que deberás sumar ese coste y disponibilidad. En audio, según la documentación, verás cifras que mencionan 1 W por canal y también 2 W por altavoz; si el volumen máximo es crucial para ti, valora el contexto de uso (escritorio o estancia pequeña) o el uso de la salida de línea con altavoces externos.

Por otro lado, es un proyecto en evolución. La lista de proveedores de IA, las funciones y el rendimiento local dependen de la comunidad, de las dependencias y de la Pi que montes (4 o 5). La buena noticia es que, al ser abierto, podrás adaptar y mejorar con el tiempo.

Ubo Pod encaja en un nicho que cada vez pide más voz y más control: gente que quiere un asistente útil, con visión y sensores, pero sin renunciar a la privacidad y a la posibilidad de hurgar cuando le apetezca. Con hardware modular, software abierto, compatibilidad con más de 50 proveedores de IA, opciones locales y una WebUI sin código, el proyecto pone en manos de la comunidad una alternativa real a las cajas negras del mercado. Si te late la idea, la campaña en Kickstarter —con precios que parten en 109 $ para el Pro 4 y 129 $ para el Pro 5, sin incluir la Raspberry Pi ni el envío— es el punto de partida para apoyar y, si eres de los primeros, incluso recibir unidades del lote inicial ya fabricado.