AndesDataCube

El proyecto AndesDataCube busca desarrollar algoritmos de inteligencia artificial para cuantificar los activos naturales de los Andes del Perú a partir del procesamiento de imágenes satelitales. El objetivo es monitorear los cambios en las reservas de agua dulce y carbono orgánico en ecosistemas de alta montaña (EAM) desde 1972 hasta 2022, utilizando imágenes de satélites como Sentinel‑2, Landsat y Planet.

Grupo de trabajo: Universidad Peruana Cayetano Heredia (UPCH), Centro de Competencias del Agua (CCA), Universidad Agraria La Molina (UNALM), grupo ECOHIDRO de la UNMSM, Instituto Nacional de Investigación en Glaciares y Ecosistemas de Montaña (INAIGEM) y ZGIS (Universidad de Salzburgo).

Logo AndesDataCube

  • Paquetes
  • Resumen
  • Papers
  • Tesis
  • Software
  • Conclusiones
  • Referencias

Descubra nuestros paquetes

cubexpress cubexpress equi7grid equi7grid Satalign Satalign Sathybrid Sathybrid phicloudmask phicloudmask opensr-mamba opensr-mamba satcompression satcompression Satcube Satcube

Resumen

El Proyecto Andes Data Cube diseñó e implementó una arquitectura de procesamiento automatizado para transformar la serie completa de imágenes Sentinel‑2 (2017–2025, 10 bandas ópticas de 10–20 m) en un cubo de datos espacio‑temporal listo para análisis ambiental en los ecosistemas altoandinos del Perú. Inspirado en la filosofía Analysis Ready Data (ARD), el flujo integra descarga, corrección atmosférica y organización geoespacial, de modo que miles de escenas puedan consultarse como un único bloque multidimensional.

Desde esa base se desarrolló el paquete satcube (código abierto, PyPI), cuyo flujo encadena: descarga óptima de S2, enmascarado de nubes (CloudSEN12+), co‑registro sub‑píxel, gap‑filling temporal, suavizado mensual y super‑resolución 4× (SEN2SR) para generar salidas continuas de 2,5 m a lo largo de la cordillera. El resultado es un cubo mensual libre de nubes, coherente y de alta resolución que se genera con un solo comando.

Esta infraestructura habilita la expansión con series Landsat y Planet hasta 1972 y el despliegue de algoritmos de IA para cuantificar agua dulce y carbono orgánico, aportando una plataforma escalable para convertir big‑data satelital en indicadores periódicos de gestión hídrica, contabilidad de carbono y adaptación al cambio climático.

Papers

Aybar, C., Montero, D., Donike, S., Kalaitzis, F., & Gómez‑Chova, L. (2024). IEEE GRSL, 21, 1–5. DOI

Presenta OpenSR‑Test, primer banco de pruebas específico para super‑resolución (SR) en teledetección óptica, con pares LR‑HR reales (NAIP, SPOT, VENµS), protocolo Consistencia‑Síntesis‑Corrección y métricas normalizadas (dom, dim) para comparar arquitecturas discriminativas y generativas.

Data in Brief, 56, 110852. DOI

CloudSEN12+ amplía el repositorio experto de nubes y sombras a 50k parches, incluyendo tamaños 509 y 2000 px, protocolo de calidad TI‑HI y mejoras notables en detección de sombras y transferencia a Landsat‑8.

IEEE JSTARS. DOI

DTACSNet integra detección de nubes (U‑Net‑MobileNetV2) y corrección atmosférica (CNN residual) con latencias 4–10× menores que Sen2Cor y error radiométrico <2% frente a AERONET‑SEN2.

Environmental Data Science, 3, e27. DOI

Marco HOLAP para integrar observaciones satelitales ARD, reanálisis climáticos y datos socioeconómicos en cubos FAIR, con ciclo de vida STAC→ARD→cubing→armonización→análisis→reutilización.

arXiv preprint. DOI

sen2nbar implementa el c‑factor Ross‑Li con parámetros MODIS para convertir reflectancia de superficie en NBAR desde un único comando, sobre SAFE locales o cubos Zarr en la nube.

SSRN preprint. DOI/SSRN

SEN2SR unifica las 13 bandas de Sentinel‑2 a 2,5 m mediante una restricción FFT que preserva coherencia LR y acelera la convergencia. Supera a métodos difusivos en PSNR y tasa de alucinaciones con 13–70× menor tiempo de inferencia.

Tesis

Estimación del área glaciar mediante IA y cubos de datos (UNMSM, 2024)

Cubo S2 (2018–2022) en Huascarán; U‑Net para nubes, nieve/hielo y suelo. F‑score = 0.89 y tendencia de pérdida glaciar consistente con INAIGEM.

Recuperación de imágenes Landsat‑MSS vía aprendizaje profundo (UNMSM, 2024)

GAN MSS2TM armoniza MSS→TM (79→30 m) con RMSE ≈ 0.016 ρ y PSNR ≈ 32.4 dB en Perú (1972–1999), habilitando continuidad 1972–2025.

Comparativa de datasets de cobertura de tierra para área glaciar (UNMSM, 2024)

Evaluación de ESA‑WC, ESRI‑LC, DynamicWorld e INGLOG II con 21,752 puntos; ESRI‑LC con mayor F1 (0.90), DW con vacíos relevantes en la Cordillera Blanca.

Creación de software especializado en Python

Paquete Rol Dependencias núcleo URL
cubexpress Descarga y cubing acelerado desde Google Earth Engine ee Repositorio
equi7grid‑lite Conversión y codificación Quad‑Tree Equi7Grid numpy, pyproj Docs
satalign Co‑registro multitemporal sub‑píxel opencv, skimage, numba Repositorio
sathybrid Fusión LR–HR y SR guiada en Fourier scipy, torch, rasterio Docs
phicloudmask Segmentación nube/sombra sensor‑independiente torch Repositorio
sen2sr Super‑resolución (RGBN ×4, RSWIR ×4/×2) torch, einops Repositorio
satcompression Compresión Quad‑Tree & pseudo‑MTF bitarray, numpy Docs
satcube Orquestación end‑to‑end (cloud → ARD‑SR cubo) pystac, xarray, rio‑cogeo Docs
cubexpress
  • Clases FastImage / FastCollection con batching automático.
  • Reintentos, checksums y reanudación de descargas masivas.
  • Exportación directa a xarray.Dataset (cálculo lazy con dask).
equi7grid‑lite
  • Conversión precisa lat‑lon ↔ quad‑ID sin librerías pesadas.
  • Resoluciones jerárquicas 1 km → 10 m.
  • Listo para CPU edge/embebido.
satalign
  • Co‑registro multitemporal con error < 0.15 px.
  • Algoritmos PCC, ECC y LGM seleccionables.
  • Función drop‑in para xarray → cubo alineado.
sathybrid
  • Fusión espacial‑espectral guiada por FFT.
  • LPF/HPF (Butterworth o Gauss) + deconvolución PSF.
  • Salida GeoTIFF o Zarr con metadatos STAC.
phicloudmask
  • Máscara nube/sombra entrenada en CloudSEN12+.
  • Exportable a ONNX (Myriad X / edge).
  • Métricas TI‑HI y F2 integradas.
sen2sr
  • Implementación oficial SEN2SR (RGBN ×4, RSWIR ×4/×2).
  • Bloques SSM Mamba + restricción FFT coherente LR.
  • Tile‑streaming para memoria constante.
satcompression
  • Compresión jerárquica (ratio ≈ 15:1) sin pérdida geométrica.
  • Codificación Quad‑Tree con estimación MTF radial.
  • Compatible con COG (JPEG‑YCbCr interno).
satcube
  • Comando único: descarga → enmascarado → co‑registro → gap‑filling → SR → compresión/publicación.
  • Stack reproducible reutilizable por otros países andinos.

Conclusiones

  • ADC generó cubos S2 ARD‑SR (2,5 m) mensuales en zonas de alta nubosidad, reduciendo el preprocesado de ~3 días a < 1 h por track.
  • La cadena DTACSNet → sen2nbar → sen2sr reduce el error radiométrico a < 2% y el geométrico a 0,15 px.
  • Los cubos permiten cuantificar tendencias glaciar‑laguna con ±2% de incertidumbre, superando inventarios tradicionales.
  • La armonización Landsat‑MSS (GAN MSS2TM) aporta continuidad 1972‑presente.
  • El ecosistema de paquetes Python (cubexpress, satalign, phicloudmask, …) constituye un stack reproducible para la región andina.

Referencias

  1. Aybar, C., Bautista, L., Montero, D., Contreras, J., Ayala, D., Prudencio, F., … Gómez‑Chova, L. (2024). Data in Brief, 56, 110852. DOI
  2. Aybar, C., Contreras, J., Donike, S., Portalés‑Julià, E., Mateo‑García, G., & Gómez‑Chova, L. (2024). SSRN. DOI
  3. Aybar, C., Mateo‑García, G., Acciarini, G., Růžička, V., Meoni, G., Longépé, N., & Gómez‑Chova, L. (2024). IEEE JSTARS. DOI
  4. Aybar, C., Montero, D., Donike, S., Kalaitzis, F., & Gómez‑Chova, L. (2024). IEEE GRSL, 21, 1–5. DOI
  5. Bautista, L. A., & Calvo, J. A. (2024). Tesis UNMSM.
  6. Contreras, J. C. (2024). Tesis UNMSM.
  7. Espinoza, W. J. (2024). Tesis UNMSM.
  8. Montero, D., Kraemer, G., Anghelea, A., Aybar, C., Brandt, G., Camps‑Valls, G., … Mahecha, M. D. (2024). Environmental Data Science, 3, e27. DOI
  9. Montero, D., Mahecha, M. D., Aybar, C., Mosig, C., & Wieneke, S. (2024). arXiv. DOI

AndesDataCube

© 2025 · Ciencia de datos para ecosistemas altoandinos