Ubo Pod Developer Edition: todo lo que necesitas saber

  • Asistente de IA abierto con Raspberry Pi, voz, visión, sensores e IR
  • Privacidad real: obturador físico y corte de micrófonos por hardware
  • Compatibilidad con más de 50 proveedores y WebUI sin código; local o nube
  • Modelos Pro 4/Pro 5; ranura M.2 en Pro 5; precios desde 109 $ en Kickstarter

Asistente de IA abierto para el hogar

En un mercado repleto de altavoces inteligentes cerrados, por fin asoma una alternativa que pone el control en manos del usuario: un asistente de IA que se entiende y se repara. Así se presenta Ubo Pod Developer Edition (DE), un dispositivo abierto sobre Raspberry Pi 4 o 5 que combina voz, visión por computador y sensores en un chasis modular que no necesita servicios propietarios para funcionar.

La idea no se limita a preguntar por el tiempo o poner música. Ubo Pod aglutina micrófonos, altavoces, una pantalla a color, cámara, sensorado ambiental y un sistema de infrarrojos (emisor y receptor) para conversar con modelos de lenguaje, interpretar lo que ve y, además, manejar equipos del salón por voz. Tú eliges si tiras de IA en la nube o si todo ocurre de forma local, priorizando la privacidad, y si te gusta trastear, el entorno está pensado para experimentar con voz, visión y herramientas sin pelearte con la base.

Qué es Ubo Pod Developer Edition y cuál es su propósito

La Developer Edition es el núcleo del proyecto. Su ambición es sustituir las “cajas negras” tipo Echo o Nest por un asistente construible y auditable con hardware abierto y software libre, libre de ataduras a servicios cerrados. Con el mismo equipo habilitas reconocimiento automático del habla (STT), síntesis de voz (TTS), modelos de lenguaje y de visión (LLMs/VLMs), llamadas a herramientas (tool calling) y disparadores de activación para distintos escenarios.

La gracia es que no obliga a programar. Incluye una interfaz gráfica en su pantalla integrada y una WebUI para configurarlo sin tocar código, de manera que puedas elegir proveedores de IA, ajustar opciones y activar funciones directamente desde el dispositivo o desde el navegador.

La apertura atraviesa todo el diseño. Tanto la aplicación Ubo como el hardware están publicados con licencias abiertas y repositorios públicos, incluidas las placas y los archivos mecánicos. Si te apetece auditar, modificar o contribuir, tienes el sistema “a la vista”, algo poco frecuente en este tipo de asistentes domésticos.

Diseño y hardware: modular, ampliable y reparable

El chasis es compacto y pensado para perdurar. Mide 130 × 99 × 52 mm, pesa alrededor de 340 gramos y está preparado para alojar Raspberry Pi 4 o Raspberry Pi 5, con gestión térmica activa para mantener el rendimiento estable en sesiones largas.

En el frontal manda una pantalla IPS a color de 1,54 pulgadas con 240 × 240 píxeles. Aunque no es grande, permite visualizar estados, menús y una pequeña GUI integrada para realizar ajustes o consultar información en el momento, sin necesidad de irte al ordenador.

Justo al lado incorpora una cámara de 5 MP que da entrada a la visión por computador. En la variante Ubo Pro 4 se pueden usar las cámaras oficiales Raspberry Pi V1 y V2; en Ubo Pro 5, además, se suma compatibilidad con el Camera Module 3, ampliando las opciones de captura y enfoque.

El apartado de audio está preparado para conversaciones naturales. Dispone de doble micrófono estéreo con captura de hasta 48 kHz y altavoces estéreo con reproducción hasta 48 kHz con una distorsión muy contenida (<0,1% THD). En la documentación aparecen referencias a 1 W por canal y también a 2 W por altavoz; en cualquier caso, el sistema está pensado para voz clara en escritorio o salón.

Si prefieres sacar el sonido a otros equipos, hay una salida de línea basada en el códec WM8960. Entrega 40 mW a 16 Ω, detecta la inserción de jack, declara THD de -75 dB a 20 mW y alcanza 90 dB SNR con carga de 16 Ω, lo que aporta flexibilidad para barras de sonido, amplificadores o altavoces activos.

Para el control físico del equipo, el frontal monta un pequeño teclado. Son 7 botones de silicona de tacto suave y un botón de encendido dedicado, suficientes para manejar menús o tener accesos directos a funciones.

La parte “visual” se refuerza con un anillo de luz. Integra 27 LEDs RGB direccionables (SK6812, compatibles con NeoPixel), ideales para mostrar estados, animaciones o retroalimentación durante conversaciones.

En conectividad hereda lo bueno de la Raspberry. Ofrece Ethernet Gigabit, WiFi 5, Bluetooth 5.0, dos puertos USB 3.0 y dos USB 2.0 desde la propia SBC, con margen de sobra para periféricos o aceleradores externos.

Uno de los rasgos diferenciales para el hogar es el infrarrojo. Incluye receptor IR con alcance de hasta 5 metros (TSOP75238) y cuatro emisores IR de 940 nm de alta potencia (VSMB10940) con patrón prácticamente omnidireccional, lo que le permite aprender y reenviar órdenes a televisores, barras de sonido o aire acondicionado.

El sensorado ambiental también viene completo de serie. Incorpora un sensor de temperatura PCT2075 (precisión ±1 °C entre -25 °C y +100 °C) y un sensor de luz ambiental VEML7700, capaz de medir de 0 a 120 kilolux con resolución fina de 0,0036 lx/ct.

En almacenamiento, el paquete base trae la tarjeta lista para arrancar. Se incluye una microSD de 32 GB preinstalada con el sistema operativo, de modo que puedas empezar a usarlo nada más encenderlo.

Si das el salto al modelo superior, hay premio. Ubo Pro 5 añade una ranura M.2 PCIe para SSD NVMe o para montar un acelerador de IA, algo muy útil para ejecutar modelos locales exigentes o guardar memorias y bases de conocimiento sin preocuparte por el espacio.

  • Pantalla IPS 1,54” (240×240) para interfaz embebida y estados
  • Cámara 5 MP y soporte oficial de cámaras Raspberry (según modelo)
  • Doble micro + altavoces estéreo optimizados para voz
  • IR RX/TX para control universal del salón
  • Sensores de temperatura y luz con precisión y amplio rango

Privacidad tangible y control de datos

Más allá de intenciones, hay medidas físicas. La cámara se puede tapar con una cortina de privacidad para que quede ciega cuando no la necesites. Y los micrófonos cuentan con un interruptor de corte por hardware, lo que te permite silenciarlos sin fiarlo todo al software.

La arquitectura de software acompaña esa filosofía. Puedes trabajar en modo totalmente local o apoyarte en servicios en la nube, modulando el equilibrio entre comodidad y privacidad según cada caso. Si no quieres que salgan audios o imágenes de tu red, lo configuras para operar en local.

Software abierto, WebUI y compatibilidad con más de 50 proveedores de IA

El sistema base corre sobre Raspberry Pi OS y la Ubo App. La aplicación está escrita en Python y publicada en GitHub, con lo que no hace falta comprar el aparato para probarla: se puede instalar en una Raspberry Pi 4 o 5 que ya tengas.

La compatibilidad de servicios es amplia y variada. Ubo Pod admite más de 50 proveedores para reconocimiento de voz, TTS, memoria, visión y LLMs, con opciones tanto en la nube como on‑premise/local que se eligen desde la pantalla o desde la interfaz web.

Si prefieres decidir tú cada modelo, también puedes. Es posible apuntar a endpoints de APIs populares como Gemini, ChatGPT o Claude, o echar mano de Ollama para ejecutar LLMs en local, reduciendo latencia y manteniendo los datos en casa.

Para ampliar capacidades sin complicarte, hay una API pensada para desarrolladores. El sistema expone una API gRPC que permite crear módulos o integraciones con pocas líneas de código, facilitando añadir funciones a medida de cada proyecto.

La capa conversacional no se queda en responder con texto. El soporte de tool calling y los distintos mecanismos de activación permiten encadenar acciones, leer sensores, mostrar datos en la pantalla o iluminar el anillo LED según el estado.

Visión por computador e infrarrojos: el hogar bajo tu voz

La cámara integrada y el soporte de módulos oficiales hacen que el dispositivo “vea”. Puede reconocer códigos, caracteres, gestos y objetos, abriendo la puerta a escenarios como leer un código en pantalla, detectar una seña de confirmación o describir una escena para darte contexto.

El control universal por infrarrojos es el otro gran aliado para el día a día. Puedes enseñarle comandos de tu mando favorito para que los reproduzca o directamente pedirle por voz que envíe señales a la tele, la barra de sonido o el aire acondicionado.

Experiencia de uso sencilla… y lista para trastear

Aunque la DE es para perfiles técnicos, no te obliga a programar. Arranca funcional y puedes limitarte a configurarla desde la WebUI sin escribir nada de código si no te apetece. Enchufar, ajustar cuatro cosas y a funcionar.

Si te gusta levantar el capó, el terreno es ideal. El hardware modular y el software abierto permiten cambiar piezas, añadir almacenamiento M.2 en Pro 5 o probar aceleradores de IA. Y si no quieres complicarte, te quedas con lo que viene y punto.

Modelos, especificaciones clave y diferencias

La familia gira en torno a Raspberry Pi 4 o 5, con dos variantes principales. Ubo Pro 4 y Ubo Pro 5 comparten base (pantalla IPS 1,54” 240×240, cámara 5 MP, doble micro y altavoz, IR, sensores, anillo LED, teclado de 7 botones), pero difieren en algunos puntos.

  • Cámaras oficiales: Pro 4 admite los módulos Raspberry Pi V1 y V2; Pro 5 suma compatibilidad con Camera Module 3.
  • Almacenamiento y aceleración: Pro 5 integra ranura M.2 PCIe para SSD NVMe o acelerador de IA.
  • Conectividad: ambos heredan Ethernet Gigabit, WiFi 5, Bluetooth 5.0, 2×USB 3.0 y 2×USB 2.0.
  • Audio: altavoces estéreo y salida de línea WM8960 con detección de jack.
  • Sistema: microSD de 32 GB preinstalada para arrancar sin complicaciones.

Precios, disponibilidad y realidades del crowdfunding

El proyecto está en Kickstarter con un objetivo de financiación de 25.000 dólares. Las recompensas arrancan en 109 $ para Ubo Pro 4 y 129 $ para Ubo Pro 5. Ten en cuenta que ninguna incluye la Raspberry Pi en la caja, y los envíos van aparte.

Como siempre en micromecenazgo, conviene ser prudente. Apoyar no es lo mismo que comprar: respaldar un proyecto no garantiza la entrega. Revisa la información, sopesa riesgos y decide cuánto te compensa implicarte.

Puedes consultar la campaña en la página oficial. Entra en Kickstarter de Ubo Pod para ver detalles, niveles y plazos antes de participar.

Estado del proyecto y mensaje del creador

Según su impulsor, a los dos días de abrir campaña ya rozaba casi el 40% de la meta. Pide un empujón final y agradece la difusión, sobre todo entre perfiles técnicos a los que les entusiasme un asistente abierto y hackeable.

Hay un detalle poco común en campañas así: se fabricó un lote pequeño por adelantado y hay algo de inventario listo para enviar a los primeros patrocinadores, reflejando los años de trabajo en hardware y software detrás de la propuesta.

El objetivo del creador es cristalino. Dar poder a desarrolladores para construir experiencias de voz, visión y sensores sin fricciones, y plantar cara a dispositivos cerrados que, en su opinión, no respetan lo suficiente al consumidor ni su derecho a reparar o elegir servicios.

En visibilidad, el equipo pide ideas. Conocen las agencias de marketing de pago, pero de momento apuestan por comunidad y boca a boca, buscando un crecimiento más orgánico.

Configuración y flujo de trabajo (sin convertirlo en un tutorial)

El dispositivo está pensado para pasar de cero a útil en poco tiempo. La interfaz web te guía en la elección de proveedores de IA (voz, texto, visión, memoria) y en la configuración básica, y la GUI de la pantalla permite ajustes rápidos sin salir del equipo.

Si quieres probar antes de invertir en el hardware, no hay problema. La Ubo App se puede instalar en una Raspberry Pi 4 o 5 “pelada”, de modo que compruebes compatibilidades, rendimiento y si te encaja el ecosistema.

Para escenarios de máxima privacidad, hay margen de maniobra. Puedes optar por opciones locales u on‑premise para que audio e imagen no salgan de tu red. Y si necesitas potencia extra o modelos comerciales concretos, tienes a mano proveedores en la nube y la posibilidad de apuntar a APIs como Gemini, ChatGPT o Claude.

Casos prácticos y demos disponibles

Ya hay ejemplos reales que enseñan lo que puede hacer. Memo, el asistente de notas por voz, mantiene memoria y contexto en la conversación, ideal para capturar recordatorios o ideas sin perder el hilo.

En visión, la cosa va más allá de “ver”. Puedes generar imágenes a partir de instrucciones de voz y describir fotos mediante VLMs, con resultados que dependerán de los modelos y proveedores elegidos, pero con la infraestructura lista.

Para el salón, el IR brilla con luz propia. Es perfectamente viable pedirle que cambie de canal, suba volumen o apague la tele, siempre que tu equipo reciba comandos por infrarrojos. Y si lo combinas con los sensores de luz y temperatura, es fácil crear automatizaciones contextuales sencillas.

Motivos para elegir un asistente abierto

Los asistentes cerrados son muy cómodos, pero tienen peajes. Con Ubo Pod decides qué servicios usas, dónde se procesan tus datos y puedes inspeccionar el código, lo que para muchos marca la diferencia entre usar una herramienta o “ser usado” por ella.

El hardware, además, no está soldado en una placa propietaria. Al apoyarse en Raspberry Pi, es posible actualizar, reparar o reutilizar componentes, algo valioso cuando la obsolescencia aprieta y quieres alargar la vida útil de tus dispositivos.

Limitaciones y matices a considerar

No todo es perfecto, y conviene tenerlo claro. Ninguna recompensa incluye la Raspberry Pi, así que debes sumar su coste y disponibilidad a la ecuación de compra. Y en audio verás cifras que hablan de 1 W por canal y también de 2 W por altavoz; si el volumen máximo es crítico, mejor valorar el contexto (escritorio o estancia pequeña) o usar la salida de línea con altavoces externos.

Es un proyecto vivo que evoluciona. La lista de proveedores, las funciones y el rendimiento local dependen de la comunidad, de las dependencias y de si montas una Pi 4 o 5. La cara positiva es que, al ser abierto, siempre podrás adaptar y mejorar con el tiempo.

Se trata de una alternativa que aporta control, privacidad y capacidad de personalización sin sacrificar utilidad. Un asistente de IA con visión, sensores e infrarrojos, hardware modular y compatibilidad con más de 50 servicios que aterriza vía crowdfunding con precios de entrada contenidos y un enfoque radicalmente abierto.