“Hay
tres tipos de mentiras: mentiras, malditas mentiras, y estadísticas.”
Benjamín
Disreali (1804–1881)
La frase de Disraeli, primer ministro durante la etapa mas pujante del Imperio
Británico, tipifica con extrema sencillez el dilema que uno enfrenta al tratar
de interpretar datos estadísticos.
Una de tales interpretaciones, ampliamente difundida, y con más
repercusiones, es el valor de la inflación. En este caso, la estadística es el
índice de precios al consumidor, compilado y publicado mensualmente por el
INDEC, y la interpretación es el valor de la inflación. Esta interpretación
de las estadísticas del INDEC esta sujeta a errores y limitaciones que no son
ampliamente conocidos, lo que nos ha motivado a escribir este artículo. La
pregunta que tratamos de contestar es la siguiente: ¿cúal es el márgen de
error de los datos del INDEC, y como afecta este a la más común interpretación
de estos datos, el valor de la inflación?
Las
repercusiones del valor de la inflación son varias. Una de la más obvias, es
saber cuánto vale el dinero que tenemos en la mano. Pero hay otras que, pese a
ser menos difundidas, no son de menor interés o improtancia. Por ejemplo, los
bonos de la deuda externa pagan un interés ajustado de acuerdo a la inflación,
y cada 1% de aumento en la inflación corresponde a un pago adicional de U$S 480
millones en concepto de intereses.
El
crecimiento económico de un país se mide, entre otras cosas, por un indicador
llamado el Producto Bruto Interno (PBI). Este es un agregado del valor total de
bienes y servicios producidos. Sin embargo, en precesencia de inflación, estos
valores deben ser corregidos—usando la tasa de inflación—para poder
comparar el crecimiento verdadero, eliminando la abultación en las cifras
debido a que un peso hoy compra menos que un peso ayer.
Más abajo nos explayaremos sobre cómo la incertidumbre en el valor real
de la inflación se propaga al cálculo del PBI.
El
primer punto a tener en claro es que las estadísticas no nos dicen como son las
cosas, sino que nos dan una probabilidad de que cierto evento ocurra o
haya ocurrido—en nuestro caso, un cambio en los precios. A esta probabilidad
se le asocia un márgen de error, lo que nos da cierta confianza en el
resultado obtenido.
Por ejemplo, si una encuesta indica que el candidato A
obtendría 40% de los votos sobre 10% para el candidato B, pero el márgen de
error es 50%, esta encuesta es poco útil. De acuerdo a este márgen de error,
el candidato A obtendría entre 0 y 90% de los votos, y el candidato B obtendría
entre 0 y 60% de los votos. Uno estaría tentado a decir que el mayor porcentaje
de votos pronosticado para A todavía está un 30% sobre el correspondiente número
para B. Pero al hacer esta comparación estamos restando dos números que
contienen un márgen de error, y en tal caso, el error que le corresponde a la
diferencia es la suma de los errores individuales. Es decir, si
realizamos la operación A-B=30%, el error correspondiente es 100%! La única
conclusión válida a partir de estos números es que no sabemos quien va a
ganar.
El
valor más usado para medir el error es en terminos de la desviación estándar.
Si el error presentado es igual a una desviación estándar, la probabilidad o nivel
de confianza de obtener el resultado presentado es del 68%. Si el error es
igual a dos desviaciones estándar, el nivel de confianza aumenta a 95%. Si en
el ejemplo electoral de más arriba el error presentado es igual
a dos desviaciones estándar, decimos que la encuesta indica que el
candidato B obtendría entre 0 y 60% de los votos con un nivel de confianza del
95%.
¿Cúal es el márgen de error de las estadísticas
compiladas por el INDEC? Vale mencionar que existen dos tipos diferentes de
error en todo emprendimiento estadístico: los errores de muestreo, y los
errores que no son de muestreo.
El
error de muestreo en el índice de precios al consumidor (IPC) resulta del hecho
que una muestra finita de precios es relevada, en lugar de compilar todos
los precios existentes. Los errores que no son de muestreo son el resto del
error, y son el resultado de respuestas incorrectas, error en la carga de datos,
etc. Los errores que no son de muestreo son independientes del tamaño de
la muestra. En la jerga técnica el error de muestreo se denomina varianza, y el
error no de muestreo se llama sesgo (bias en ingles). Nuestro foco, de ahora en
más, será el error de muestreo en el IPC, confiando en que el personal técnico
del INDEC haga todo lo posible para minimizar los errores no de muestreo.
Con
estos preliminares en cuenta, ¿cúal es el error de muestreo en el IPC?
Desafortunadamente, el INDEC no presenta una figura para este márgen de error.
Una estimación del mismo, sin embargo, es posible
teniendo en cuenta el tamaño de la muestra usada. De acuerdo al
INDEC (http://www.indec.mecon.ar/), el IPC se computa en base a 80.000 precios
obtenidos através del relevamiento de 6.000 comercios distintos. Es
importante señalar que se trata de 80.000 precios y no artículos, dado
que, de ser este último el caso, para cada artículo habría que obtener
por lo menos 30 precios para
obtener un dato con mínima significancia estadística, inflando de este modo el
tamaño de la muestra a 240.000 precios. Dada una muestra de N precios,
el error del IPC se puede estimar sabiendo
que ela desviación estámdard es proporcional a 1/√N . Los precios
son relevados todos los días hábiles del mes (aproximadamente 20, en
promedio); de esta forma, el número a usar es N=20X80.000. Obtenemos así que
el IPC tiene un error de muestreo del orden de 0,5%., a un nivel de
confiabilidad del 95%.
¿Cuánto es la inflación?
Todo
el mundo tiene un concepto intuitivo de la inflación. Como en el tango, el
puchero hoy cuesta más que ayer; este aumento
generalizado de precios es lo que llamamos inflación. Pero para efectuar una
medición científica de este fenómeno, es necesario definir que precios se han
de monitorear. El precio del puchero podría ser el precio a seguir, pero nos
daría una visión parcial del universo económico. Por esta razón, es común
utilizar el llamado índice de precios al consumidor
(IPC)
El
IPC es un indicador del costo de una canasta de artículos predefinida
durante un período específico (un mes). Siguiendo metodología estándar, el
INDEC divide el IPC obtenido cada mes de tal forma que, arbitrariamente, el IPC
a comienzos del año 1999 sea igual a 100. Para obtener una idea de la variación
de precios mes a mes, en porcentaje, la fórmula a utilizar es, por ejemplo,
entre Marzo y Febrero de 1997,
Variación del IPC entre Marzo y Febrero 1997 = (IPC Marzo 1997 - IPC
Febrero 1997) x
100
IPC Febrero 1997
Esta
variación mes a mes es el dato que publica mesnusalmente el INDEC, y los medios
periodísticos reportan esta variación como la inflación mensual.
¿Cuál es el error de esta variación? O, en otras palabras,
¿cual es el márgen de error en la medición mensual de la inflación? ¿Cuál
es el nivel de confianza?
La
fórmula estándar para el cálculo de errores indica usar la suma de los
errores individuales, obteniendo así, que la variación mes a mes del IPC
esta sujeta a un error del orden de 1,5% a un nivel de confianza del 95%
. Remarcamos el hecho de que
este error es del orden del error calculado usando métodos más rigurosos,
pero, a lo sumo, la diferencia no es mayor a 2. Es decir, una estimación
conservadora del error en la variación del IPC indica que este error está
entre el 0,75% y 1,5%.
¿Cómo se puede verificar este error? Usando los datos
provistos por el sitio web del INDEC, se puede graficar la variación acumulada
del IPC como función del tiempo. Es decir, mes a mes, se suman todas las
variaciones del IPC de los meses anteriores hasta llegar a un predeterminado mes
base.
La Figura 1 (ver al pie) es un gráfico de la variación acumulada mes a mes
para el IPC y el IPM (índice de precios mayoristas, al que nos referiremos más
tarde). Lo más notable de éste gráfico es que la suma de las variaciaciones
acumulan un total de 52% a Julio de 2005, en tanto, si medimos directamente la
variación de precios entre Julio 2005 y Diciembre 2001 usando la fórmula
anterior obtenemos una variación de 62%. Si la serie de variaciones
individuales estuviera libre de error, ambos métodos de computar la variación
acumulada a Julio 2005 desde Diciembre 2001 deberían dar exactamente el
mismo resultado.
El
hecho que este no sea el caso es una evidencia a priori de la existencia
de errores en la variación mensual del IPC (y asimismo en el IPM). Esto no es
de sorprender, ya que sabemos que toda medición estadística esta sujeta a
errores de muestreo.
Nosotros
hemos realizado un análisis técnico detallado para determinar el error de
muestreo en el IPC y el IPM, y afinar nuestra estimación previa que la inflación
mensual esta sujeta a un márgen de error del 1,5%.
Este análisis se basa en examinar la distribución de valores de la
variación mensual del IPC (y del
IPM), y la aplicación de uno de los teoremas fundamentales de la estadística,
el teorema del Límite Central. Es así que concluímos que la inflación
minorista mensual esta sujeta a un error del 1%
(prácticamente idéntica a nuestra
simple estimación previa del 1,5%). Para la inflación mayorista mensual
(basada en el IPM) obtenemos un error del 1,8%. (este error es razonablemente
mayor que para el IPC dado que la muestra usada para obtener el IPM es menor).
Todos los errores son a un nivel de confianza del 95%.
En
síntesis: nuestro análisis indica que, con
las muestras existentes, es imposible medir con certeza una inflación minorista
mensual menor al 2% (que se debería
presentar como 2+∕-1%), y una inflación mayorista menor al 4%
(4+∕-1,8%).
Causas y Propuestas
¿Cuáles
son las consecuencias de nuestras conclusiones? Primero,
el cálculo mensual de la inflación, con los muestreos existentes, no es práctico
en tanto la inflación mensual se mantenga debajo del 2%. Esto quiere decir,
que, por ejemplo, el dato publicado para Agosto 2005, que indica una inflación
minorista del 0,4%, es inservible
porque, siendo el márgen de error 1%, la inflación de Agosto 2005 estaría
entre –0,6% y 1,4%. Un dato inusable.
Esta
falencia se puede aliviar aumentando el tamaño de la muestra, pero esto demanda
la alocación de mayor presupuesto para el INDEC. Por ejemplo, en USA el Bureau
of Labor and Statistics (http://www.bls.gov/cpi/)
compila el IPC (CPI en inglés) en base a 80.000 artículos (en oposición
a precios) relevados de 23.000 comercios. Si uno asume que cada artículo es
relevado por lo menos 30 veces, el tamaño de la muestra es 2.400.000, treinta
veces mayor que la muestra usada por el INDEC. Es así que la variación mensual
del CPI en USA tiene un error de muestreo del 0,12%—casi nueve veces menor que
el IPC nuestro (para más detalles, ver http://www.bls.gov/cpi/cpivar2004.pdf
).
Todo
lo que hemos dicho hasta ahora se aplica también a la medición a nivel
mayorista, medida por el índice de precios mayoristas (IPM). De acuerdo al
INDEC, el IPM se obtiene mensualmente en base
al relevamiento de 2.800 precios obtenidos de 1.400 fuentes. Repitiendo, el márgen
de error del IPM es 1,8%, con lo cual cualquier variación mensual del IPM menor
al 4% no es estadísticamente significante.
La
comparación de la inflación mensual a nivel minorista y mayorista permite
entrever la razón de la evolución de los precios. Por ejemplo, si mes a mes la
inflación minorista es, dentro de los márgenes de error, mayor que la
inflación mayorista, esto indica que el sector minorista esta remarcando
precios por arriba de los aumentos con los cuales recibe la mercadería del
distribuidor. Por el contrario, si las variaciones minoristas son,
consistentemente menores que las variaciones mayoristas, dentro de los márgenes
de error, esto indica que los comercios minoristas prefieren absorber los
aumentos en lugar de trasladarlos al público.Y, por último, si las variaciones
minoristas son, dentro de los márgenes de error, iguales a la inflación
mayorista, esto índica que el sector minorista simplemente está trasladando al
consumidor los mayores precios recibidos, y que los aumentos se deben a razones
estructurales.
¿Cuál de estos tres escenarios corresponde a la actualidad?
La
Figura 2 (ver al pie) grafica las variaciones porcentuales mensuales del IPC y
del IPM entre Mayo del 2002 y Julio de este año.
Nótese
que a aprtir de Junio 2002 las variaciones mensuales del IPC, excepto por Enero
2005, son menores que el márgen de error del 1%—indicado por las líneas
horizontales de puntos—excepto por el dato de Mayo 2002, ninguno es mayor al
2%. Similarmente para el IPM, todos los valors computados a partir de Julio 2002
estan dentro del márgen de error—cuyo límite superior esta indicado por la línea
horizontal sólida—y sólo el dato de Mayo 2002 es mayor al 4%. Esto ilustra
nuestra aserción anterior que, a partir de Mayo 2002, las variaciones mensuales
no son estadísticamente significativas—o sea, en buen romance, son inusables.
Es
más, en base a estas estadística es imposible afirmar quien es responsable por
el aumento de precios, el sector minorista versus el mayorista, dado que no
existen los datos estadísticos en los cuales se pueda basar tal conclusión.
Variaciones
medidas sobre intervalos mayores a un mes sí son usables. Por ejemplo, usando
el valor del IPC reportado por el INDEC para Setiembre de este año (IPC=164,79)
y comparandolo con el valor reportado para Diciembre 2004
(IPC=151,30) obtenemos una variación de precios con respecto a Diciembre
2004 igual al 8%, muy por arriba
del margen de error del 1%. Es decir, se puede decir, con un nivel de confianza
del 95%, que la variación de precios entre Diciembre 2004 y Setiembre 2005 está
entre el 7 y el 9%.
Concluyendo,
es imperativo aumentar los recursos del INDEC a fin de aumentar el muestreo, y
obtener resultados significativos mes a mes. Asimismo, y siguiendo el ejemplo
del Bureau of Labor and Satistics de USA, sería muy útil la publicación anual
por parte del INDEC de un estudio de los márgenes de error para los resultados
presentados.
Estimación del Producto Bruto Interno (PBI)
En
1993 la Argentina adoptó el Sistema de Cuentas Nacionales (SCN 1993) que fuera
promovido por varios organismos internacionales entre ellos las Naciones Unidas
y el Fondo Monetario Internacional. El SCN 1993, al igual que el plan de cuentas
en las empresas, ordena y estandariza la contabilidad nacional con el claro
sentido de facilitar el cálculo de los indicadores de desarrollo, entre los que
se destaca el PBI. Al mismo tiempo éste sistema de cuentas permite que todas
las naciones calculen sus indicadores en forma similar y los valores obtenidos
puedan interpretarse con el mismo criterio. Este fue el primer paso en encarar
con seriedad la estimación del PBI.
El
PBI es un valor muy difícil de establecer con precisión. En primer lugar
porque, a diferencia del IPC, no puede medirse en forma directa y en segundo
lugar el valor resultante es muy sensible a la metodología de estimación que
se utilice. La Dirección Nacional de Cuentas Nacionales (DNCN) es el organismo
estatal encargado de la estimación del PBI entre otros indicadores.
Hemos
visto que la medición del IPC resulta de una encuesta de precios por producto y
por sector y que su margen de error es mayormente muestral ya que aumentando la
muestra disminuimos el margen de error. A
modo de ejemplo que multiplicando por 100 la muestra el margen de error se
divide por aproximadamente 10. El margen de error en el IPC depende del
presupuesto que se le asigne al INDEC y no de la capacidad de sus técnicos la
cual no esta en tela de juicio.
Para
la pregunta de por qué se estima el PBI y no se mide imaginemos una metodología
de medición que consiste en considerar un período de tiempo, desagregar el
precio de todos y cada uno de los bienes que se han transado en dicho período,
calcular el valor agregado y sumar todos los valores agregados para obtener el
PBI de dicho período. En otras palabras deberíamos encuestar a todo el
universo de productos y no una muestra. Resulta claro. Entonces, que medir el
PBI es imposible desde el punto de vista práctico,
por lo cual se debe recurrir a una
estimación del mismo.
El
margen de error en la estimación del PBI tiene una componente muestral que
proviene de la cantidad de encuestas de recolección de datos y una parte no
muestral que resulta del método de estimación más errores de lectura y
escritura de los datos. Como siempre el margen de error total es la suma de
estos dos márgenes de error parciales, siendo el muestral el más fácil de
controlar pues, al igual que con el IPC, aumentando la muestra disminuye el
margen de error.
Sería
de gran utilidad que el INDEC indicara los márgenes de error en su estimación
del PBI ya sea en un informe trimestral o uno completo anual.
Los errores se propagan:
Hasta
aquí hemos analizado el margen de error en la medición del IPC y en la
estimación del PBI. Veremos a continuación como el IPC propaga su error a
otros indicadores que miden la economía en particular todas aquellas cuentas
que se requieren a moneda constante.
Supongamos
que estimamos el PBI este mes y queremos compararlo con el mismo mes del año
anterior. Si bien ambos valores de PBI tienen como unidad el peso difieren en la
fecha en que se hizo la estimación, difieren en el IPC interanual.
Aquí aparece entonces el concepto de moneda constante. Concluimos en forma rápida
que al margen de error de la estimación del PBI hay que sumarle el margen de
error de la medición del IPC cuando lo pasamos a moneda constante. Todo valor a
moneda constante tiene mayor margen de error que el valor sin ajustar que se
denomina a moneda corriente.
Los
valores útiles en la economía son los de moneda constante pues son éstos los
que permiten las comparaciones. El PBI, el gasto, los ingresos, el
superavit/deficit, la inversión, las importaciones/exportaciones, los
impuestos, los depósitos en bancos y toda otra cuenta del SCN que se nos ocurra
medir o estimar a moneda constante llevan y propagan como un virus el error en
la medición del IPC.
Para
cuantificar este concepto demos un ejemplo: consideremos como cierta una economía
que no ha crecido a lo largo de un trimestre y presenta una inflación de 3%
medida por la diferencia porcentual del IPC. En un escenario como el supuesto el
IPC y el PBI crecerán en la misma
proporción porque la inflación puede tomarse como un factor de escala de
los valores agregados propios de cada producto que llega al consumidor, al ser
el PBI un gran agregado de valores agregados puede sacarse la inflación como un
factor común de la sumatoria, en otras palabras IPC y PBI a precios corrientes
crecen a la tasa de inflación.
Poniendo
en números lo expresado anteriormente:
Variación
Real IPC = 3% trimestral
Variación Real
PBI = 3% trimestral
Crecimiento
Real del PBI a moneda constante = Variación PBI- Variación IPC =0%
Supongamos ahora que el INDEC en
ese mismo trimestre mide el IPC y
comete un error muestral, calculando el IPC en 2% en lugar del 3% real; al mismo
tiempo, estima el PBI obteniendo un cambio trimestral igual al 3%. Se obtiene así
Variación
Medida IPC = 2% trimestral
Variación Estimada
PBI = 3% trimestral
Crecimiento
Calculado del PBI a moneda constante =
Variación PBI- Variación IPC
=1%
En
este simple ejemplo se observa que el margen de error en la medición del IPC
arroja un crecimiento en el PBI a moneda constante que en la realidad no sucedió.
Todo porcentaje que se subestime en el IPC se agrega como crecimiento del
PBI a moneda constante.
Obsérvese
que en el ejemplo la variación del IPC medido de 2% es consistente con el 3%
real más el margen de error muestral del INDEC como se expuso en párrafos
anteriores.
Es decir, las estimaciones corrientes del PBI a moneda
constante tiene un margen de error de por lo menos 1% que resulta únicamente de
la propagación de errores en el IPC. Adicionalmente, el PBI tiene sus errores
intrínscos, que, desafortunadamente, no son estimados por el INDEC.
Conclusiones
Un
número estadístico debe estar siempre acompañado de su margen de error, el número
solitario no indica nada y es científicamente objetable.
A
continuación de un dato estadístico y su margen de error debe estar explícita
la metodología de medición o estimación con los elementos necesarios para que
un tercero repita el experimento a fin de corroborarlo.
El
Sistema de Cuentas Nacionales es un modelo que se va refinando con el tiempo,
con mejor metodología y más tecnología, mientras que el error del IPC podría
reducirse significativamente con un presupuesto adecuado para el INDEC.
Carlos
M. Ortega y Pedro N. Safier
cortega@fibertel.com.ar
Enviado
por los autores especialmente a Tribuna de Periodistas
Gráficos:
Figura 1. Variación Acumulada Mes a Mes como función del tiempo para el IPC (índice de precios al consumidor) y el IPM (índice de precios mayoristas). Se muestran las variaciones acumuladas entre Diciembre 2001 y Julio 2005. Fuente de datos: INDEC (http://www.indec.mecon.ar/).
Figura 2 Variación porcentual con respecto al mes anterior del IPM (cruces) y el IPM (círculos) como función del tiempo. Se muestran las variaciones computadas entre Mayo 2002 y Julio 2005. Fuente de datos: INDEC (http://www.indec.mecon.ar/). Las líneas horizontales de puntos delimitan la zona acotada por el márgen de error del IPC (1%) y la línea horizontal sólida es la cota superior del márgen de error del IPM (1,8%).