Flujo de trabajo en el paquete ecospat

Di Cola, V., Broennimann, O., Petitpierre, B., Breiner, F.T., D’Amen, M., Randin, C., Engler, R., Pottier, J., Pio, D., Dubuis, A., Pellissier, L., Mateo, R.G., Hordijk, W., Salamin, N. & Guisan, A., 2016. ecospat: an R package to support spatial analyses and modeling of species niches and distributions. Ecography, 40(6), pp.774‑787. doi:10.1111/ecog.02671. 

El artículo presenta el paquete de R ecospat, diseñado para facilitar un marco coherente de análisis espaciales de nichos de especies y modelización de sus distribuciones. Las ideas clave son:

  • Hoy día, con el abaratamiento de los datos espaciales y climatológicos, y los avances en computación estadística, hay muchas técnicas para modelar la distribución de especies (“species distribution models”, SDMs) y sus nichos ecológicos.

  • El paquete ecospat busca cubrir tres fases del análisis: pre‑modelado (exploración de datos, análisis de nicho, detección de extrapolación), modelado núcleo (calibración y proyección de modelos de distribución de especies o ensamblajes de especies) y post‑modelado (evaluación, análisis de nicho dinámico, análisis de co‑ocurrencias, diversidad filogenética).

  • En “pre‑modelado” incluye funciones para cuantificar nichos (ej., densidad de ocurrencias en espacio ambiental), tests de equivalencia/similitud de nichos, detección de extrapolación mediante MESS/ExDet, selección de variables, etc.

  • En la fase de “modelado núcleo”, incluye dos funcionalidades destacadas: la estrategia de Ensemble of Small Models (ESM) — útil cuando pocos datos de ocurrencia — y el marco SESAM (Spatially‑explicit modelling of species assemblages) para modelar comunidades (especies múltiples) en lugar de sólo especies individuales.

  • En “post‑modelado”, el paquete permite evaluar modelos (por ejemplo usando el índice Boyce index para datos de presencia‑única), también analizar co‑ocurrencias entre especies sujetas a restricciones ambientales, calcular diversidad filogenética espacialmente, y otras funciones de análisis de ensamblajes.

  • Los autores ilustran el uso del paquete con dos ejemplos: (1) análisis de un especie invasora: cuantificación del cambio de nicho entre rango nativo e invadido + modelado con ESM + evaluación con índice Boyce. (2) análisis de estructuración de una comunidad de plantas: diversidad filogenética, predicción de composición de la comunidad mediante SESAM, análisis de co‑ocurrencias.

  • Finalmente señalan que el paquete no reemplaza otros paquetes de modelado de distribución (como biomod2, dismo) sino que los complementa, especialmente en fases pre‑ y post‑modelado, y en el enfoque de comunidad.

Flujo de trabajo (workflow) propuesto

A continuación un flujo paso‑a‑paso basado en el artículo:

1. Preparación de datos / Pre‑modelado

  • Recolectar los datos de ocurrencia de la(s) especie(s) de interés: coordenadas geográficas, periodo temporal, etc.

  • Obtener las variables ambientales relevantes (climáticas, edáficas, topográficas, etc).

  • Realizar análisis exploratorio:

    • Verificar autocorrelación espacial de las variables y de las ocurrencias. (por ejemplo ecospat.mantel.correlogram)

    • Selección de variables: calcular cuántas variables pueden usarse según tamaño de muestra (ecospat.npred)

    • Detectar zonas de extrapolación al proponer proyecciones (por ejemplo hacia otro rango geográfico o hacia futuro). Usar funciones como ecospat.exdet, ecospat.mess.

  • Si es un estudio de nicho comparativo (por ejemplo especie nativa vs invasora, o antes vs después):

    • Calcular densidad de ocurrencias de la especie en el espacio ambiental (ej., función ecospat.grid.clim.dyn())

    • Cuantificar el solapamiento de nichos (por ejemplo índices de Schoener’s D o Hellinger’s I) con ecospat.niche.overlap()

    • Realizar pruebas de equivalencia de nicho (ecospat.niche.equivalency.test()) y de similitud (ecospat.niche.similarity.test()) para evaluar si los nichos difieren más de lo que se esperaría al azar.

    • Interpretar posibles resultados: expansión del nicho, rellenado de nicho, estabilidad, etc. (por ejemplo en invasiones).

2. Modelado núcleo

  • Elegir el tipo de modelado según los datos: para pocas ocurrencias, la estrategia ESM es adecuada.

    • Usar ecospat.ESM.Modeling() para calibrar múltiples modelos pequeños (por ejemplo combinaciones de 2 variables) y luego ecospat.ESM.EnsembleModeling() para crear un ensamble ponderado.

  • Si el estudio abarca múltiples especies y se quiere modelar composición de comunidad, usar el marco SESAM:

    • Obtener predicciones de probabilidad de presencia para cada especie (por ejemplo con SDMs tradicionales).

    • Aplicar el “probability ranking rule” (PRR) con ecospat.SESAM.prr() para convertir las probabilidades en predicciones binarias de presencia/ausencia por sitio y especie.

  • Realizar la proyección del modelo a la(s) zona(s) de interés (otro rango geográfico, futuro climático, etc), considerando la extrapolación ya detectada.

3. Evaluación y análisis post‑modelado

  • Para especies individuales: evaluar la calidad de predicción. En casos de sólo datos de presencia, utilizar el índice Boyce con ecospat.boyce() para medir qué tan bien la predicción ordena los sitios según su adecuación.

  • Para comunidades: usar ecospat.CommunityEval() para calcular diversas métricas de evaluación por sitio (comparando matriz observada vs matriz predicha) cuando se tiene dato de presencia/ausencia.

  • Análisis de co‑ocurrencias:

    • Construir matriz sitio×especie (observada o predicha).

    • Usar ecospat.cons_Cscore() para calcular el índice C‑score con reglas nulas restringidas ambientalmente (null model que mantiene frecuencias de especies y probabilidades según predicciones) para detectar patrones de agregación o segregación entre pares de especies.

  • Calcular diversidad filogenética en los sitios o en las predicciones de comunidad:

    • Usar ecospat.calculate.pd() con un árbol filogenético y matriz presencia/ausencia (observada o predicha) para obtener medidas de diversidad filogenética (por ejemplo PD, J, AvPD, etc.).

  • Interpretar los resultados en términos ecológicos y biogeográficos: por ejemplo, ¿la especie invasora expandió su nicho? ¿los modelos sugieren buenas predicciones? ¿Las comunidades predichas tienen patrones de co‑ocurrencia que indican interacción biológica o estructura ambiental? ¿La diversidad filogenética se relaciona con riqueza de especies o con variables ambientales?

4. Comunicación y documentación

  • Documentar todo el procedimiento, los supuestos, los datos de entrada, los modelos ajustados, las proyecciones, las evaluaciones.

  • Visualizar resultados clave: mapas de predicción, curvas de densidad de nicho, gráficos de solapamiento de nicho, gráficos de evaluación (por ejemplo predicted/expected vs adecuación), mapas de diversidad filogenética, histogramas de C‑score null vs observado.

  • Asegurarse de citar correctamente el paquete ecospat además de los demás métodos usados.

  • Discutir limitaciones: tamaño de muestra, extrapolación, calidad de los datos de ausencia o presencia, suposiciones de los modelos, efectos biológicos no considerados (como dispersión, interacciones bióticas), etc.