La MaixCAM2 es una cámara inteligente modular diseñada para creadores, investigadores y entusiastas de la inteligencia artificial en el borde (edge AI). Basada en el chip SoC Axera AX630, este dispositivo combina capacidades de procesamiento de IA con captura de vídeo de alta resolución, ofreciendo hasta 4K a 30 fps junto con una Unidad de Procesamiento Neural (NPU) capaz de 3,2 TOPS en INT8 y hasta 12,8 TOPS en INT4, lo que permite ejecutar modelos de visión por computadora y aprendizaje automático directamente en el dispositivo sin necesidad de conectarse a la nube. Su modularidad, pantalla táctil integrada, múltiples opciones de expansión y entorno de desarrollo amigable lo convierten en una herramienta versátil para aplicaciones que van desde visión artificial hasta modelos de lenguaje visual‑multimodal.

Un vistazo técnico a la MaixCAM2

La MaixCAM2 parte de una propuesta interesante: integrar capacidades de IA en una cámara compacta y adecuada para prototipos o proyectos avanzados. En su corazón está el Axera AX630 SoC, un sistema en un chip con CPU dual‑core ARM Cortex‑A53 a 1,2 GHz y una NPU que ofrece hasta 3,2 TOPS de rendimiento en INT8, ampliable a 12,8 TOPS con precisión INT4 — esto significa que puede ejecutar tanto redes de inferencia clásicas como modelos más recientes basados en arquitecturas Transformer directamente en el hardware. Esta potencia de cómputo permite, por ejemplo, ejecutar un modelo YOLO11n a más de 113 fps en resolución 640×640, comparable a dispositivos mucho más costosos con 33 TOPS de NPU como algunos modelos de NVIDIA Jetson Orin Nano.

El sensor principal es un módulo 8 MP con capacidad de vídeo 4K a 30 fps que se conecta a través de una interfaz MIPI CSI de 4 carriles. La cámara incorpora un sensor de tamaño 1/1,8 pulgadas, que es hasta un 80 % más grande que el de la Raspberry Pi Camera o un 10‑20 % mayor que sensores típicos de cámaras de acción, lo que se traduce en mejor captación de luz y mayor calidad de imagen en condiciones difíciles. Además, el dispositivo ofrece Wi‑Fi 6, BLE 5.4, pantalla táctil de 2,4 pulgadas, almacenamiento interno con eMMC de 32 GB y ranura microSD, así como conexiones PMOD para sensores adicionales como cámaras térmicas o módulos Time‑of‑Flight (ToF).

¿Qué se puede hacer con una MaixCAM2?

La MaixCAM2 se orienta a proyectos donde la captura visual se combina con procesamiento inteligente en el borde. Gracias a su NPU capaz de manejar modelos entrenados de detección, segmentación o reconocimiento, es posible ejecutar aplicaciones localmente: detección de objetos en tiempo real, análisis de escenas con modelos de visión‑lenguaje (VLM) o incluso integraciones con modelos de lenguaje local (LLM) adaptados al contexto visual. La cámara viene con más de 40 aplicaciones de IA preinstaladas, incluyendo distintos modelos de visión como Yolov11n o modelos VLM como Qwen3‑VL‑2B, y permite añadir nuevas desde la tienda MaixHub o desarrollar las propias mediante el entorno MaixPy y el IDE MaixVision.

Por ejemplo, en una aplicación de seguridad o monitorización, el sistema puede ejecutar un modelo de detección de personas con una latencia suficientemente baja para identificar eventos en vivo, o incluso integrar modelos que relacionen texto y contenido visual para consultas complejas. El soporte a interfaces de expansión PMOD posibilita conectar sensores de temperatura, profundidad o cámaras térmicas, ampliando el rango de sensores y capacidades más allá de la cámara principal.

Aspectos de hardware y expansión

Desde la perspectiva del hardware, la MaixCAM2 destaca por su modularidad. La inclusión de dos conectores PMOD de 2,54 mm permite integrar módulos adicionales como cámaras térmicas de resoluciones que pueden llegar hasta 640×480 con super‑resolución por IA, así como sensores ToF de hasta 100×100 para cálculo de profundidad. Además de Wi‑Fi 6 y Bluetooth, el dispositivo incorpora un conector Ethernet de seis pines compatible con un adaptador FPC‑RJ45 opcional, lo que abre posibilidades para despliegues más fiables en entornos con red cableada.

Finalmente, aunque la cámara consume aproximadamente 2,5 W durante cargas de IA intensivas (excluyendo sensores adicionales), su diseño incluye gestión de batería Li‑ion con control de carga y descarga, y una batería RTC para reloj en tiempo real, lo que permite usos autónomos o en sistemas embebidos sin fuente de alimentación continua.

Comparación con otras plataformas de visión e IA

Si bien existen otras plataformas que integran capacidades de IA en dispositivos similares, la MaixCAM2 destaca por su equilibrio entre potencia, precio y facilidad de uso. Por ejemplo, kits como el M5Stack LLM630 Compute Kit, que también utiliza variantes del SoC Axera AX630C con 3,2 TOPS de NPU y soporte para visión y modelos de lenguaje en el borde, se orientan más a plataformas de desarrollo general con puertos más amplios y soporte para interfaces de cámara/display, pero no vienen en formato de cámara lista para usar. Más información: M5Stack LLM630 Compute Kit.

La MaixCAM2, en cambio, se presenta como un punto medio entre un sistema embebido completo y un módulo de cámara inteligente: con salida de vídeo integrada, pantalla táctil y almacenamiento incluidos, puede funcionar desde el primer momento sin necesidad de placas adicionales o configuraciones complejas.

Desarrollo y comunidad

Otro aspecto clave de la MaixCAM2 es su entorno de desarrollo. El soporte de MaixPy, que facilita la programación en Python con acceso directo a las funcionalidades de la cámara y de la NPU, permite a desarrolladores de diferentes niveles trabajar con modelos entrenados o incluso adaptar modelos propios. La comunidad alrededor del ecosistema Maix (incluyendo documentación en la wiki de Sipeed y repositorios en GitHub) ofrece ejemplos, herramientas y recursos para acelerar el desarrollo. Para detalles técnicos del SoC: Axera AX630 en Axera Tech.

Reflexiones finales

La MaixCAM2 es una propuesta sólida para proyectos que combinan visión por computadora, procesamiento de IA en el borde y facilidad de despliegue. Su equilibrio entre especificaciones técnicas avanzadas —como 3,2 TOPS de NPU en INT8, soporte de vídeo 4K, conectividad múltiple y expansión modular— la hacen adecuada tanto para prototipos como para aplicaciones reales donde se requieran análisis en tiempo real sin depender de infraestructura en la nube.

562
Suscribirse
Notificación
1 Comment
Inline Feedbacks
Ver todos los comentarios
1
0
¡Aquí puedes dejar tus comentarios!x