Metodología del monitor de remesas
Documento técnico · Remesas en Datos · CINCO · versión 1.0 (junio de 2026) · ¿Buscas la versión sin matemática? Lee la guía de interpretación.
Este documento especifica por completo los modelos del monitor: el modelo estructural de espacio de estados que descompone y pronostica el flujo mensual de remesas, el nowcast del mes en curso con intervalos conformales, la detección de rupturas estructurales, el modelo GARCH de la volatilidad cambiaria, la microestructura de la pizarra bancaria y la descomposición del costo de envío. Toda decisión metodológica que toma el código está documentada aquí; la implementación —TypeScript puro, determinista, sin dependencias numéricas— es pública en el repositorio del proyecto.
1. Datos y definiciones
El monitor integra cinco fuentes, todas ingestadas a BigQuery por canalizaciones automáticas:
| Serie | Fuente | Frecuencia | Cobertura |
|---|---|---|---|
| Flujo de remesas familiares (millones USD) | Banguat (Banguat, 2026) | mensual | ene-1994 → presente |
| Tipo de cambio de referencia (GTQ/USD) | Banguat | diaria | ene-2000 → presente |
| Pizarra bancaria compra/venta (14 bancos) | sitios de los bancos | diaria | jun-2026 → presente |
| Costo de envío del corredor EE. UU.→GTM | Banco Mundial RPW (Banco Mundial, 2025); cotizaciones semanales de proveedores digitales | anual / semanal | 2011 → presente |
| IPC oficial, canasta básica alimentaria, encuestas | INE, OIM (OIM, 2022), ENCOVI (INE, 2023), RemitSCOPE (RemitSCOPE, 2024) | mensual / anual | — |
Convenciones: indexa meses, días. El objeto modelado es : el flujo creció dos órdenes de magnitud desde 1994 (de US 2,200 M mensuales), de modo que solo en logaritmos los choques son comparables a lo largo de la muestra y la estacionalidad es aproximadamente multiplicativa con amplitud estable.
2. El modelo estructural
2.1 Forma de espacio de estados
Usamos el modelo estructural básico de Harvey (Harvey, 1989): tendencia de nivel local más estacionalidad trigonométrica,
con tendencia de nivel local (caminata aleatoria con deriva estocástica)
y estacionalidad trigonométrica de período 12 con los seis armónicos , :
con compartiendo una sola varianza (parsimonia). El armónico de Nyquist () colapsa a un único estado con transición . El vector de estado es, por tanto,
y el sistema completo en notación matricial estándar , con , y .
2.2 El filtro de Kalman
Sea y su covarianza. Con observación escalar, las recursiones de (Durbin y Koopman, 2012) son
es escalar: el filtro no invierte ninguna matriz. Cuando falta (o es un mes futuro), se omite la actualización y se propaga solo la predicción — esta es exactamente la mecánica del pronóstico de la sección 3. La inicialización es difusa aproximada: , con , y las primeras innovaciones (la dimensión del estado) se excluyen de la verosimilitud.
2.3 Estimación por máxima verosimilitud
La log-verosimilitud de descomposición del error de predicción es
parametrizada en logaritmos para garantizar positividad (acotados en : si la pendiente es casi determinista y el óptimo está en la frontera, un resultado válido, no un error). Se maximiza con el simplex de Nelder–Mead (Nelder y Mead, 1965) con dos reinicios desde el óptimo. En los datos (389 meses), el ajuste toma ~3 segundos y produce , , , : una tendencia flexible con pendiente suave y estacionalidad que evoluciona muy lentamente.
2.4 Suavizado y descomposición
El suavizador de estados corre hacia atrás con las recursiones – de (Durbin y Koopman, 2012):
con , . De salen los tres productos del tablero: la tendencia , el factor estacional (en puntos log, ≈ desvíos porcentuales) y la serie desestacionalizada . El perfil estacional estimado es económicamente interpretable: valle profundo en enero–febrero (≈ −11 %), picos en mayo (Día de la Madre, ≈ +6 %), agosto y octubre–diciembre.
3. Pronóstico
Para pronosticar meses se filtra la serie extendida : en el tramo sin datos el filtro solo propaga, y la media y varianza predictivas son y . Como el predictivo es normal en logaritmos, los cuantiles en niveles son lognormales:
con el cuantil normal estándar. El abanico del tablero dibuja las bandas 50/80/95 %. En el backtest del año 2025 (modelo ajustado hasta dic-2024), los 12 meses observados cayeron dentro de la banda del 80 %.
4. Nowcast del mes en curso
Banguat publica el flujo con un mes de rezago: en cualquier día del mes el último dato es . El nowcast estima combinando tres modelos deliberadamente distintos (Bates y Granger, 1969).
4.1 Modelos base
(a) BSM. La predicción 1-paso del modelo estructural, , de la sección 3.
(b) Estacional-naïve con deriva. , donde es el crecimiento interanual promedio de los últimos tres meses observados. Sin parámetros: es el punto de referencia que cualquier modelo debe batir.
(c) Puente ridge. Una ecuación puente que explota la información intramensual disponible: al día del mes ya se observan días del tipo de cambio de referencia. Como las remesas se liquidan en el mercado cambiario, la apreciación intramensual del quetzal está correlacionada con la fuerza del flujo en curso. La regresión es
donde compara el TCR promedio de los primeros días del mes con el promedio del mes anterior, y son días hábiles, viernes y quincenas del mes (centrados), calculados con el calendario de feriados de Guatemala (Semana Santa por computus). Se estima por ridge (Hoerl y Kennard, 1970), sin penalizar el intercepto, con elegido por validación cruzada generalizada (Golub, Heath y Wahba, 1979):
con los autovalores de (calculados por rotaciones de Jacobi).
4.2 Validación y pesos
Los tres modelos se evalúan por validación de origen rodante (Tashman, 2000) con ventana expansiva: para cada origen desde enero de 2015, se predice usando solo información hasta (el puente se reajusta en cada origen; el BSM usa los hiperparámetros de la muestra completa con estado filtrado hasta —pseudo fuera de muestra, la aproximación estándar cuando reajustar es costoso). Los orígenes se parten por la mitad:
- Mitad 1 (pesos). El ensamble pondera por precisión inversa: , normalizados. Las métricas por modelo (MAE, RMSE, MAPE) se publican en el tablero.
- Mitad 2 (calibración). Con los pesos congelados, los residuos del ensamble en la mitad 2 calibran los intervalos conformales (§4.3). La separación evita que los pesos y los intervalos usen los mismos errores.
En los datos, el ensamble logra MAPE ≈ 5.4 % a un paso, con pesos aproximados 40 % BSM, 27 % naïve, 33 % puente.
4.3 Intervalos conformales
Los intervalos del nowcast no asumen normalidad: usan predicción conformal dividida (Vovk, Gammerman y Shafer, 2005) sobre el score relativo de la mitad de calibración.
Definición — Intervalo conformal del nowcast
Sea los scores ordenados de la mitad de calibración y . El intervalo de nivel es .
Proposición — Cobertura en muestra finita
Si los scores de calibración y el del mes objetivo son intercambiables, entonces , sin ningún supuesto distribucional.
Demostración
Sea el score del mes objetivo. Por intercambiabilidad, el rango de entre los scores es uniforme en . Entonces , y equivale a . ∎
∎
La intercambiabilidad es una idealización en series de tiempo (véase §11); empíricamente, la cobertura del 80 % en la ventana de calibración es cercana a la nominal, y los intervalos se ensanchan mecánicamente tras episodios volátiles, que es el comportamiento deseable (Angelopoulos y Bates, 2023).
5. Rupturas estructurales y anomalías
5.1 CUSUM de innovaciones
Las innovaciones estandarizadas del filtro, , son aproximadamente e independientes bajo el modelo. El estadístico CUSUM se compara con las bandas del 5 % de (Brown, Durbin y Evans, 1975), : una excursión sostenida señala un cambio sistemático de nivel no capturado por el modelo. Las innovaciones individuales también se publican: marzo–abril de 2020 (COVID-19) es la innovación más negativa de la década (−2.4σ).
5.2 Segmentación de regímenes
Sobre el crecimiento interanual desestacionalizado (era moderna, 2005–presente: el despegue 1999–2004, con crecimientos > 100 %, domina cualquier criterio homoscedástico) se estima el modelo de medias por tramos de (Bai y Perron, 1998):
resuelto de forma exacta por programación dinámica (con la DP es instantánea), longitud mínima de segmento 12 meses, elegido por BIC. El resultado actual identifica, entre otros, la contracción de la crisis financiera (oct-2008 → feb-2010, media −8 %), el auge pos-COVID (mar-2021 → feb-2022, media +40 %) y el régimen vigente (≈ +13 %).
5.3 Estudio de evento: el impuesto de 2026
Desde el 1 de enero de 2026 EE. UU. aplica un impuesto del 1 % a remesas salientes en efectivo (EE. UU., 2026). El efecto se estima con la metodología de control sintético temporal: se ajusta el BSM solo con datos hasta dic-2025 y su pronóstico es el contrafactual "sin impuesto";
con las bandas predictivas lognormales como medida de incertidumbre: un desvío fuera de la banda del 95 % es inconsistente con la dinámica previa. La estimación se actualiza cada mes al publicarse un dato nuevo. (Advertencia estándar: el desvío captura todo lo que cambió desde enero de 2026, no solo el impuesto; la anticipación de remitentes en 2025-S2 —adelantar envíos antes de la vigencia— sesgaría el contrafactual al alza.)
6. Volatilidad cambiaria
Sobre los log-retornos diarios del TCR, (≈ 6,500 observaciones desde 2000), se estiman dos medidas complementarias:
EWMA (J.P. Morgan, 1996): con .
GARCH(1,1) (Bollerslev, 1986):
estimado por cuasi-máxima verosimilitud gaussiana con la reparametrización , , que impone y sin restricciones en . En los datos , : persistencia —en la frontera, comportamiento cuasi-IGARCH típico de un tipo de cambio administrado con largos períodos de calma interrumpidos por episodios— por lo que la vida media del choque () debe leerse como "muy larga" más que como una cifra puntual. La volatilidad se publica anualizada ().
7. Microestructura de la pizarra bancaria
Para cada banco y día , con tasas de compra y venta (la compra es la que recibe quien cobra una remesa en dólares):
- Spread: , el margen bruto del banco.
- Prima de compra: frente al TCR de referencia.
- Quetzales por remesa: para el envío típico de US$ 200.
- Dispersión transversal: rango , desviación estándar e IQR. Es la versión cambiaria de la "ley de un solo precio": en un mercado sin fricciones la dispersión sería ≈ 0; su nivel mide cuánto pierde un receptor por cobrar en el banco equivocado.
La serie de la pizarra nace el 11 de junio de 2026; las vistas temporales se activan al acumular historia (las medidas de un día —ranking, dispersión— son válidas desde el primer día).
8. Remesas y tipo de cambio: regresión HAC
La hipótesis de que los meses estacionalmente fuertes de remesas aprecian el quetzal se contrasta con
donde es el TCR promedio del mes y el factor estacional de remesas (§2.4). Como está serialmente correlacionado, la inferencia usa errores de (Newey y West, 1987) con núcleo de Bartlett y rezagos. Un significativo indica que la estacionalidad de remesas se transmite al mercado cambiario.
9. Costo de envío y la meta ODS 10.c
Para un envío de monto con comisión fija y tipo de cambio del proveedor frente a la referencia :
la descomposición estándar del Banco Mundial (Banco Mundial, 2025). El margen cambiario puede ser negativo (proveedores que pagan sobre la referencia para captar volumen). El tablero compara la última cotización de cada proveedor digital para US$ 200, la serie anual del RPW para el corredor EE. UU.→Guatemala y la distancia a la meta ODS 10.c (Naciones Unidas, 2015): costo promedio ≤ 3 % al 2030.
10. Poder adquisitivo real
Dos transformaciones del flujo nominal:
Flujo real. con el IPC oficial (base: último mes disponible ). Responde a "¿cuántos dólares de poder de compra de hoy entraron?".
Canastas por hogar receptor. Con el TCR promedio del mes, hogares receptores (OIM, 2022) y el costo mensual per cápita de la canasta básica alimentaria urbana (INE):
Es una métrica de bienestar deliberadamente cruda (el número de hogares es un parámetro de 2022, no una serie), útil por su interpretabilidad: cuántas canastas alimentarias per cápita compra la remesa promedio por hogar.
11. Limitaciones
- Revisiones de la fuente. Banguat puede revisar los últimos meses; el monitor siempre refleja la última cifra publicada y no congela vintages.
- Intercambiabilidad conformal. En series de tiempo la garantía de la §4.3 es aproximada; los cambios de régimen degradan la cobertura hasta que la ventana de calibración los absorbe.
- Pseudo fuera de muestra del BSM. Los hiperparámetros (no los estados) usan la muestra completa en la validación; el sesgo resultante es pequeño pero no nulo, y es el costo de mantener la validación computable.
- Estudio de evento ≠ efecto causal. El contrafactual del §5.3 atribuye al evento todo el desvío posterior a la fecha de corte.
- El número de hogares receptores es fijo (encuesta 2022); las canastas por hogar son un índice de poder de compra, no una medición por hogar.
- La pizarra bancaria es de tasas publicadas, no transadas; los montos grandes negocian tasas preferenciales.
Referencias
- Harvey, A. C. (1989). Forecasting, Structural Time Series Models and the Kalman Filter. Cambridge University Press.
- Durbin, J. y S. J. Koopman (2012). Time Series Analysis by State Space Methods (2.ª ed.). Oxford University Press.
- Kalman, R. E. (1960). “A New Approach to Linear Filtering and Prediction Problems”. Journal of Basic Engineering, 82(1), 35–45.
- Bai, J. y P. Perron (1998). “Estimating and Testing Linear Models with Multiple Structural Changes”. Econometrica, 66(1), 47–78.
- Brown, R. L., J. Durbin y J. M. Evans (1975). “Techniques for Testing the Constancy of Regression Relationships over Time”. Journal of the Royal Statistical Society B, 37(2), 149–192.
- Bollerslev, T. (1986). “Generalized Autoregressive Conditional Heteroskedasticity”. Journal of Econometrics, 31(3), 307–327.
- Newey, W. K. y K. D. West (1987). “A Simple, Positive Semi-definite, Heteroskedasticity and Autocorrelation Consistent Covariance Matrix”. Econometrica, 55(3), 703–708.
- Vovk, V., A. Gammerman y G. Shafer (2005). Algorithmic Learning in a Random World. Springer.
- Angelopoulos, A. N. y S. Bates (2023). “Conformal Prediction: A Gentle Introduction”. Foundations and Trends in Machine Learning, 16(4), 494–591.
- Bates, J. M. y C. W. J. Granger (1969). “The Combination of Forecasts”. Operational Research Quarterly, 20(4), 451–468.
- Golub, G. H., M. Heath y G. Wahba (1979). “Generalized Cross-Validation as a Method for Choosing a Good Ridge Parameter”. Technometrics, 21(2), 215–223.
- Hoerl, A. E. y R. W. Kennard (1970). “Ridge Regression: Biased Estimation for Nonorthogonal Problems”. Technometrics, 12(1), 55–67.
- Tashman, L. J. (2000). “Out-of-sample tests of forecasting accuracy: an analysis and review”. International Journal of Forecasting, 16(4), 437–450.
- J.P. Morgan/Reuters (1996). RiskMetrics — Technical Document (4.ª ed.). Nueva York.
- Nelder, J. A. y R. Mead (1965). “A Simplex Method for Function Minimization”. The Computer Journal, 7(4), 308–313.
- Banco de Guatemala (2026). Remesas familiares: ingreso de divisas; tipo de cambio de referencia. Estadísticas oficiales, banguat.gob.gt. https://www.banguat.gob.gt
- Organización Internacional para las Migraciones y Banco de Guatemala (2022). Encuesta sobre Migración Internacional de Personas Guatemaltecas y Remesas.
- Instituto Nacional de Estadística (2023). Encuesta Nacional de Condiciones de Vida (ENCOVI).
- Banco Mundial (2025). Remittance Prices Worldwide. remittanceprices.worldbank.org. https://remittanceprices.worldbank.org
- RemitSCOPE/FIDA (2024). Diagnóstico del mercado de remesas, Guatemala.
- Naciones Unidas (2015). Objetivos de Desarrollo Sostenible, meta 10.c: reducir a menos del 3 % los costos de transacción de las remesas de los migrantes.
- Estados Unidos (2025). One Big Beautiful Bill Act, §112105: impuesto especial del 1 % a transferencias de remesas en efectivo, vigente para transferencias posteriores al 31 de diciembre de 2025.