Ajuste multiplicativo: considere o gráfico das vendas no varejo totais de automóveis nos EUA de janeiro de 1970 a maio de 1998, em unidades de bilhões de dólares, conforme relatado pelo Escritório de Análise Econômica dos EUA: grande parte da tendência é meramente devido à inflação. Os valores podem ser desinflados, ou seja, convertidos em unidades de dólares constantes em vez de dólares nominais, dividindo-os por um índice de preços adequado escalado para um valor de 1,0 em qualquer ano desejado como ano base. Aqui, o resultado da divisão pelo índice de preços ao consumidor dos EUA (CPI) foi reduzido para 1.0 em 1990, o que converte as unidades em bilhões de dólares de 1990: (Os dados podem ser encontrados neste arquivo do Excel. Também são analisados em detalhes em As páginas sobre os modelos sazonais ARIMA neste site). Ainda existe uma tendência ascendente geral e a amplitude crescente das variações sazonais é sugestiva de um padrão sazonal multiplicativo: o efeito sazonal se expressa em termos percentuais, de modo que a magnitude absoluta do período sazonal As variações aumentam à medida que a série cresce ao longo do tempo. Esse padrão pode ser removido por ajuste sazonal multiplicativo. Que é conseguido dividindo cada valor da série temporal por um índice sazonal (um número na vizinhança de 1,0) que representa a porcentagem de normal normalmente observada naquela estação. Por exemplo, se as vendas de Decembers forem geralmente 130 do valor mensal normal (com base em dados históricos), as vendas de cada Decembers seriam ajustadas sazonalmente dividindo-se por 1,3. Da mesma forma, se as vendas de janeiro são tipicamente apenas 90 do normal, as vendas de cada janeiro serão ajustadas sazonalmente dividindo 0,9. Assim, o valor de Decembers seria ajustado para baixo enquanto os janeiro fossem ajustados para cima, corrigindo o efeito sazonal antecipado. Dependendo de como foram estimados a partir dos dados, os índices sazonais podem permanecer iguais de um ano para o outro, ou podem variar lentamente com o tempo. Os índices sazonais calculados pelo procedimento de decomposição sazonal em Statgraphics são constantes ao longo do tempo, e são computados através do chamado método médio quotratio-to-moving. (Para uma explicação deste método, veja os slides sobre previsão com ajuste sazonal e As notas sobre a implantação da planilha de ajuste sazonal.) Aqui estão os índices sazonais multiplicativos para vendas de automóveis, conforme calculado pelo procedimento de decomposição sazonal em Statgraphics: Finalmente, aqui está a versão sazonalmente ajustada de vendas automáticas deflacionadas que é obtida dividindo cada valor de meses por Seu índice sazonal estimado: Observe que o padrão sazonal pronunciado desapareceu e o que resta é a tendência e os componentes cíclicos dos dados, além do barulho aleatório. Ajuste aditivo: como alternativa ao ajuste sazonal multiplicativo, também é possível realizar ajustes sazonais aditivos. Uma série de tempo cujas variações sazonais são aproximadamente constantes em magnitude, independentemente do nível médio atual da série, seria um candidato para ajuste aditivo sazonal. No ajuste sazonal aditivo, cada valor de uma série temporal é ajustado adicionando ou subtraindo uma quantidade que representa a quantidade absoluta pela qual o valor naquela estação do ano tende a estar abaixo ou acima do normal, conforme estimado a partir de dados passados. Os padrões sazonais aditivos são de natureza algo rara, mas uma série que tem um padrão sazonal multiplicativo natural é convertida em um com um padrão sazonal aditiva aplicando uma transformação do logaritmo aos dados originais. Portanto, se você estiver usando o ajuste sazonal em conjunto com uma transformação do logaritmo, você provavelmente deve usar o ajuste sazonal aditivo e não multiplicativo. (Nos procedimentos de Decomposição Sazonal e Previsão em Statgraphics, você tem uma escolha entre o ajuste sazonal aditivo e multiplicativo.) (Voltar ao topo da página.) Acrônimos: Ao examinar as descrições das séries temporais no Datadisk e outras fontes, a sigla SA Significa um ajuste razoavelmente ajustado, enquanto a NSA significa que não está ajustado sazonalmente. Uma taxa anual ajustada sazonalmente (SAAR) é uma série temporal em que cada valor de período foi ajustado para sazonalidade e depois multiplicado pelo número de períodos em um ano, como se o mesmo valor tivesse sido obtido em todos os períodos por um ano inteiro. (Voltar ao topo da página.) Coef de correlacion correlaciones espreas 218 EL COEFICIENTE DE CORRELACIN E CORRELACIONES ESPREAS Erick Lahura Enero, 2003 DOCUMENTO DE TRABAJO 218 pucp. edu. pe economia pdf DDD218.pdf EL COEFICIENTE DE CORRELACINA E CORRELACIONES ESPREAS Erick Lahura RESUMO En este ensayo se apresenta e analiza o coeficiente de correlação, uma ferramenta estadstica elemental e importante para o estudo econométrico de relações lineales bivariadas que envolvendo o uso de dados de corte transversal ou série de tempo. Em particular, se analiza su relacin con las denominadas correlaciones espreas o sin sentido. Além disso, é mostrado uma aplicação para a medida. RESUMO Uma ferramenta estatística importante para o estudo econométrico da relação linear bivariada que envolve o uso de dados de seção transversal ou séries temporais é apresentada e analisada neste ensaio: o coeficiente de correlação. Em particular, sua relação com correlações espúrias ou sem sentido é analisada. Do mesmo modo, são mostradas aplicações empíricas baseadas em dados peruanos. 2 EL COEFICIENTE DE CORRELACIN E CORRELACIONES ESPREAS1 Erick Lahura2 1. INTRODUÇÃO A economia é o campo da economia que ocupa a ocupação da economia (estimativa, inferência e previsão) das relações entre as variáveis que estabelecem a teoria econômica, a travs de la Aplicação de mtodos estadsticos, matemticos e computacionales. O propsito fundamental é o conteúdo principal para as relações tericas. Uma forma elemental de levar um cabo este propsito consiste em analizar relações entre as variáveis. São Paulo,.,..................................................................................... Como primeiro exemplo, considere o modelo clsico de demanda por dinheiro real, que relaciona a linha de demanda por dinheiro e o transporte real a travs da próxima ecuação: t t Y P M 21 (1.1) onde y. Sê-lo como a demanda por dinheiro real (MP) e o ingreso real (Y) podem ser representados por séries de tempo circulantes reais e PBI reais 01 02 3 medidas 1 Este ensayo forma parte de um dos captulos do livro Econometra Bsica : Teoria e aplicações que se encontram atualmente em elaboração. 2 Professora do Departamento de Economia da Pontifícia Universidade Católica do Peru e do Departamento de Ciências - Seccin Matemticas. O autor agradece o apoio de Magrith Mena, Ana M. Whittembury e Manuel Barrn por trabalho eficiente como asistentes de investigação. Além disso, agradece a Gisella Chiang, Kristian Lpez, Julio Villavicencio, Luis Orezzoli, Martn Tello, Carla Murgua, Caroline Postigo, Donita Rodriguez e al arbitro anônimo, por sus valiosos comentarios e sugerencias. 3 Ms adelante se detalhará a forma de obter cada um de seus dados. 3 mensualmente, obtém o seguinte o grfico que mostra a evolução dos valores de cada uma das quais (eje vertical) entre janeiro de 1993 e dezembro de 2001 (eje horizontal): Figura 1: Gráficos do Circulante e PBI reais (janeiro1993-dezembro 2001) 2,4 2,6 2,8 3,0 3,2 3,4 8,8 8,9 9,0 9,1 9,2 9,3 93 94 95 96 97 98 99 00 01 Circulante Real (logs) PBI Real (logs) La figura 1 amostra que tanto o circulante como o PBI real tienden a crecer a lo Largo do perodo estudado é dizer, criando com o tempo. Esta informação não está disponível, mas não é suficiente para dar suporte ao modelo de demanda por dinheiro: não é possível saber exatamente o que é forte, é a relacão entre a demanda por dinheiro e o investimento real. Como o segundo exemplo, considera um modelo de consumo de tipo keynesiano com o que se intenta explicar o consumo de um grupo de famílias representativas de uma regência para um determinado volume: ii YC 21 (1.2) donde. É o consumo da família simpatica e o envio da família sim. A figura 2 mostra o comportamento das quantidades de consumo e de entrada real (eje vertical) para 200 observaciones generadas artificialmente (eje horizontal), que constituyen dados de corte transversal: 01 10 2 Figura 2: Grfico del Consumo e Ingreso (200 observaciones) 200 400 600 800 1000 1200 1400 0 400 800 1200 1600 25 50 75 100 125 150 175 200 CONSUMO INGRESO En este caso, uma diferença do modelo de demanda por dinheiro real, a série não apresenta uma tendência clara a crecer o decrecer, sino ms Bem parecen revertir um valor médio constante ao longo de todas as observações. De este modo, não é possível concluir fcilmente a partir da série e as séries se mueven juntas, no mesmo sentido e em sentidos. De esta moda, tanto no contexto do modelo de demanda por dinheiro (série de tempo) como no modelo de consumo (corte transversal), se torna necessário um instrumento que permita determinar a força eo sentido do possível relacin lineal existente entre Os par de variáveis de referência. Ste se denomina coeficiente de correlacin.4 O coeficiente de correlação é uma ferramenta estadstica elemental e importante para o estudo econométrico de relações lineales bivariadas que involucram o uso de dados de corte transversal ou série de tempo. Sin embargo, este instrumento pode fallar em algumas das ocasiões de sugerir a presença de uma relacão estadsticamente importante entre as variáveis que é verdade, não há nenhum sentido, não há poseen relacin lineal alguna, es decir, que apresentam uma correlação esprea. O coeficiente de correlação está isolado de variáveis, variando de classe de variáveis analizadas (categrica, continua, etc.). Uma grande variedade de estantes é Liebetrau (1983). 5 En este ensayo se analiza o coeficiente de correlação e su relacin com as denominadas correlaciones espreas o sin sentido. En la seccin 2 se examina estadsticamente o coeficiente de correlação. En la seccin 3 se define o problema de correlação espreas o sin sentido. En la seccin 4 se discute a presença de correlaciones espreas em um contexto de corte transversal. En la seccin 5 se analiza a presença de correlação espreas em um contexto de série de tempo. Finalmente, na seção 6, se apresenta as aplicações usando dados da economia. 2. EL COEFICIENTE DE CORRELACION O coeficiente de correlação é um estadstico que fornece informações sobre a relação existente entre as variáveis quiáveis. Bsicamente, esta informaçao refere-se a uma das características da linha de relacionamento: a direcção do sistema e a circunferência da força. É importante notar que o uso do coeficiente de correlação com o sentido e a relacin bivariada a analizar es do tipo linear. Si sta no fuera sem lineal, o coeficiente de correlação na indicação da ausência de uma linha de linha não é a ausencia de relacin alguna. Debido a esto, muitas vezes o coeficiente de correlação se define - de moda ms geral - como un instrumento estadstico que mide o grau de associação linear entre variáveis. 2.1. Desvios e graficos de dispersão Uma amostra de observações ou amostra de tamanho para as variáveis X e Y, denotada por:), () ,, () ,, (2211 nn YXYXYXM K (2.1) onde cada par (representando los Valores de cada variável para a i-sima observacin, con. Além, mar X), ii YX ni. 2,1 K i la i-sima observação da variável X y X a valorização das observações de la misma. Contudo, se define a desviacin de la i-sima observação da variável X respeito de su valor médio observado, o simplesmente desviacin de Xi, como: 6 XXx ii (2.2) A variável xi pode tomar valores positivos o negativos dependendo do valor De cada observação, es decir, se é maior o menor que o valor médio observado. Quando xi 0 se dice que a desviração da variável Xi es positiva, enquanto que si xi XXx ii AYX 011 El punto A, situado no primer quadrante Da Figura 2a, representam os valores das variáveis X e Y correspondientes à observação da amostra. Na este punto, O valor de cada variável é o prefeito e os seus valores, projeções, saídas, variáveis variáveis variáveis. De esta forma, as variáveis X e Y varan conjuntamente e en el mesmo sentido, é decir, covaran positivamente. En este caso, se dados que existe uma relacina linear e positiva entre ambas variáveis. El punto B, situado no terceiro quadrante da Figura 2a, representam os valores das variáveis X e Y respectivos la (i1) - sima observação da amostra. En este punto, as desviações de todas as variáveis son negativas. Como, se tem que X e Y varam conjuntamente e em o mesmo sentido, é decir, covaran positivamente. En este caso, se dice que é um ponto como B implica a existência de uma relação linear e positiva entre essas variáveis. A relação entre as variáveis X e Y estuviera representada para as duas observações da Figura 2a (pontos A e B), se diz que a relação entre estas variáveis é linear e positiva e as variáveis covaran positivamente. 022 XXx ii 033 YYY ii 2iY D C Y X 3iX2iX 3iY X Y Figura 2b: Desviaciones de X e Y em direcciones opuestas. 8 El punto C, situado no segundo quadrante da Figura 2b, representa os valores das variáveis X e Y correspondientes à (i2) - sima observação da amostra. En este punto, as desviacin de X é negativa e a desviacin de Y é positiva. Como, as variáveis X e Y varan conjuntamente e en sentidos, é covaran negativamente. En este caso, se dados que existe uma relacin lineal negativa entre ambas as variáveis. El punto D, situado no quarto quadrante da Figura 2b, representa os valores de X e Y correspondientes à (i3) - sima observação da amostra. De forma anormal, caso contrário, o anlisis dos signos das desviações permite afirmar que existe uma relacin lineal negativa entre X e Y. Se as variáveis X e Y está representadas por as observações da Figura 2 (pontos C e D ), Assim como as variáveis variáveis sera lineal y negativa. Para o caso de um grfico em el cual as variáveis X e Y estuvieran representadas por quatro observações iguales a los pontos A, B, C y D, contos que as desvios positivas e negativas se compensam entre s, então se concluy que não existe relacin Variáveis entre as variáveis lineares. 2.2. La Covarianza Muestral Si os n par de observações se ubicaran em el primer e terceiro quadrante, e a multiplicação de sus desviaciones. Tendra signo positivo. Por lo tanto, la suma de las n desviações tambin sera positiva: ii yx 0 1 n i ii yx. (2.5) De esta forma, o signo de (2.5) indicara que a direcção do sentido da reativação é positiva. Símbolo do relacionamento com a propaganda da propaganda, do signo de (2.5) indicação do signo do pendente da lnea, como se muestra em Figura 3. 9 YX Figura 3: Relacin lineal y positiva entre las Variáveis X e Y. A travs de anlisis anlogo al anterior, se tem que si os n par de observações se ubicaran en segundo y cuarto cuadrante (é decir, e a relação entre as variáveis X e Y fuera negativa), tendramos : 0 1 Dadas las desigualdades (2.5), (2.6) y (2.7) y uma amostra de 21 nnn observações para un par de variáveis X e Y cujo grfico de dispersão consta de pontos turísticos no primeiro e terceiro quadrante: 1n 0 1 N ii yx y ditos ubicados em segundo e quarto quadrante: 2n 0 2 n ii n ii yxyx o equivalente: 0 21 n ii n ii yxyx então la relacin lineal predominante entre las variáveis es positiva. En este caso, veja-se as variáveis X e Y covaran lineal y positivamente. (2) Si os valores e o tamanho e o quarto quadrante são importantes, os servidores e o terceiro quadrante, é decir: 0 21 o equivalentemente: 0 21 Estas três afirmações são resumidas na Figura 4: -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 XY RELACIN LINEAL POSITIVA -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 XY RELACIN LINEAL NEGATIVA -4 -2 0 2 4 -3 -2 -1 0 1 2 3 XY RELACIN LINEAL NULA -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 XY RELACIN NO LINEAL Figura 4: Relaciones Lineales e Não Lineales Si el Nmero De observações, o tamao de muestra, fora muito grande e si as variáveis presentearan algn tipo de comovimento linear (positivo o negativo), a expressin crecera com o tamao de amostra. Debido a este, é melhor promediar considerando a informacão que provoca cada desviação, obtenção de esta forma o estadstico conhecido como covarianza muestral: ni ii yx 1 ni ii yx 1 13 ni iii nii yxn YYXX n YXCov 11 1 1)) ((1 1), ((2.8) O promedio da suma de desviações se obtiene a travs de um fator igual a (n-1) porque basta com a informação (valor) das primeras n-1 desviaciones para conhecer a informação (valor) (21, então, bastara com a primeira desvantagem (o valor de 1 X X) para conhecer o valor de. Dado que (2.8) depende de2X Ni ii yx1. El anlisis precedente implica que a covariedade muestral permite identificar a direcção do sentido da linha de relacionamento entre as variáveis, a partir de uma análise do conhecimento. Esta é a nica informacin relevante que fornece a covariança para a análise da anistia da religião entre Duas variáveis. 2.3. Coeficiente de correlação Intuit Ivamente, a força o cercana de la relacin entre as variáveis podra medirse a travs de la covarianza muestral: durante ms grande mar o valor da variedade, a massa forte e a relação entre as variáveis. Sin embargo, os valores que podem tomar a covariança variam dependentes das unidades de medida das variáveis envolvidas, na forma como o qual pode conduzir a interpretações equívocas sobre a força da relacin. Para ilustrar este problema, considere as variáveis X taxa de participação e taxa de interspastação, para as quais é conta com uma amostra de 10 observações:) 50,100 () 45,90 () 40,80 () 35,70 () 30,60 () 25,50 () 20,40 () 15,30 () 10,20 () 5,10 (M onde as variáveis são expressas como porcentagens na escala del 0 al 100 (por exemplo, 10 representantes 10 por cento). La covarianza muestral entre X e Y, dados estes valores muestrales, é igual a: 5,412), (YXCov 14 Este resultado indica que existe uma linha positiva em linha com a taxa de participação activa e pasiva. Dividir todos os valores da amostra por 100, se obtiene a próxima amostra:), 25,050,0 () 20,040,0 () 15,030,0 () 10,020,0 () 05,010,0 (M) 50,000,1 () 45,090 , 0 () 40,080,0 () 35,070,0 () 30,060,0 onde as variáveis são expressas como porcentagens na escala do 0 al 1 (por exemplo, 0,10 representam 10 por cento). En este caso, a co-variante entre os mais variados entre nós, os dados são valores mestrales, é igual a: 04125,0), (YXCov Este resultado confirma a relação entre as taxas de intercâmbio e a contribuição. Como, o sentido de Uma vez que o mercado está em circulação, o mercado de produtos de medida é obrigatório, e depois de reduzir a escala das variáveis, o valor da covariante diminui (se torna prcticamente cero). , Se você usa o valor absoluto da covariança para medir a força da linha de relacionamento entre as variáveis, pode-se obter as conclusões equivalentes: em o primeiro caso, se você está em condições de gravar, É muito difícil, é o que é inconsistente, pois é o objetivo de uma análise de sua mesma relação em todos os casos. Como, a força de uma linha linear medida por a covariança, é um sinal de medida. A força da linha reta entre as variáveis que não dependem das unidades de medida de las mesmas, devem precisar as máquinas em unidades de desviacin estndar. La demostração matemática do presente se muestra na apndice (demostracina (demostracina), (2.9) 5 (1) 1) 15 onde: 1 2 nx S i X (2.9) 1 2 ny S i Y (2.9) Es fcil observa o coeficiente de correlação muestreado não é outra coisa que o cociente entre a covariança muestral e os destros estndar muestrales de Cada variável: YX SS YXCovr), ((2.10) Alternativamente, o coeficiente de correlação pode ser expresso como: niiniini ii yx yx r 1 2 1 2 1 (2.11) 2 11 2 2 11 2 111 niiniiniiniiniiniini ii YYnXXn YXYXn r (2.12 ) 2.4 Interpretação do Coeficiente de Correlação O coeficiente de correlação de amostras, ademas de ser independente das unidades de medida de variáveis, caracterização por tomar valores dentro do intervalo cerrado -1,16: 11 r 6 La demostracina matemática se presenta En el apndice (demostracina 2). 16 o equivalente: 1 r A interpretação do coeficiente de correlação de amostras depende do valor e do signo que tomam e das características da amostra analizada. Para os propsitos do presente ensaio, veja-se o número de observações da amostra (o tamanho da amostra), é o que é a amostra representativa: apresenta as mesmas características da população. De esta moda, as conclusões que são extraídas a partir da análise do coeficiente de correlação para as relações internacionais. A partir da edição (2.9), dado que você pode tomar valores não negativos, tem como o signo do coeficiente de correlação, dependente amostral do signo da suma do produto de todas as máquinas, XS YS ni ii yx1. Como, o signo de r indica a direcção da relacina linear (al igual que a covariedade muestral): valores positivos indicam uma relação directa e valores negativos uma inversão entre as variáveis involucradas. Por outro lado, o valor absoluto do coeficiente de correlação indica a força da reação linear. Um coeficiente de correlação muito perto de um valor absoluto, que é o que é mais importante, é muito novo e está muito perto de um cero, indica que é muito difícil. El cuadro 1 amostra as possíveis interpretações do coeficiente de correlacin muestral. Cuadro 1: Interpretação do Coeficiente de Correlacin Muestral VALOR DEL COEFICIENTE INTERPRETACIN 10 O coeficiente de correlação muestral, a diferenciação da co-variante, além de mide o sentido da relacão entre as variáveis sino a força da linha linear ou o grau de associação linear. La figura 5 relaciona o grau de associação linear com diversos valores do coeficiente de correlacin muestral r. -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 XY r 0 -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 XY r 0,5 -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 XY r 0,95 -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 XY r 1 Figura 5: Coeficiente de Correlacin Muestral y Grado de Associação Lineal Es importante observar o coeficiente de correlação no significa que não existe relacin entre as variáveis, sino simplesmente que não existe relacin lineal entre ellas. A partir do anlisis precedente sobre as desvios das métricas, pode-se concluir que não é uma linha, a expressão não é capaz de ter um valor muito próximo a cero, o que implica que o coeficiente de correlação muestral r tambin tendr Un valor muy cercano a cero. Como, o coeficiente de correlação muestreo não 18 fornece informações adequadas sobre a existência de uma relação não linear entre as variáveis. Como nota adicional, é importante saber que o coeficiente de correlação não fornece informações sobre a causalidade entre as séries. Lo nico que permite identificar e co-movimientos significativos. Existen pruebas estadsticas que permitem determinar em cierta medida da causalidad entre variáveis, como por exemplo a prova de causalidad a la Granger (1969). Sin embargo, um nível de segurança da economia, é a forma de determinar a causalidade de uma viagem à economia. 2.5. Uso do coeficiente de correlação: Un modelo simulado Para finalizar, considerar o caso da relacão entre o consumo e o ingresso de uma amostra de 200 famílias representativas de uma regência, que se apresentam na seção 1. A realização de simulações Como se mostra na Figura 6. -4 -2 0 2 4 -3 -2 -1 0 1 2 3 INGRESO CON SU MO Figura 6: Grfico de Dispersin entre Consumo e Ingreso Al aplicar a frmula (2.11), obtém-se um coeficiente de correlação igual a 0.99, de onde se deduz que existe uma forte relacin lineal positiva entre o consumo e o ingresso. Usualmente, os paquetes economizadores permitem mostrar o coeficiente de correlação a 19 travs de uma matriz de correlações, onde os elementos da diagonal são sempre iguales a 1 (assim que se mostra a correlação entre cada variável consigo mesma) e os que estão fora da diagonal Miden la correlacin entre cada par de variáveis. Matriz de Correlaciones: Consumo e Ingreso INGRESO CONSUMO INGRESO 1.000000 0.993350 CONSUMO 0.993350 1.000000 3. CORRELACIONES ESPREAS Em esta seção, defina o conceito de correlação esprea. Adems, se apresentam as características que você pode apresentar os dados admitidos para representar as variáveis econômicas, os quais são essenciais para analizar as causas da presença de correlações espreas 3.1. Definição de Correlaciones Espreas O coeficiente de correlação de amostras permite estabelecer o grau de associação de variáveis entre as variáveis a partir de uma amostra do conjunto de observações representativas para cada uma delas. Esto significa que o coeficiente de correlação permite estabelecer a força e o sentido de uma possível relacin linear entre as variáveis, a partir de uma amostra representativa. Sin embargo, muitas vezes é possível encontrar um alto coeficiente de correlação entre as variáveis que não têm relacin alguma, é decir, variáveis que não apresentam relacin justificada a travs de alguna teoria especfica (biologa, astronoma, economa, entre otras). Quando sucede esto, se dice que a correlaçao estadstica existente entre estas variáveis é uma correlação esprea o sin sentido. De esta forma, é possível falar de correlação entre variáveis relacionadas a la economa, a la biologa, a astronoma, entre outras. 20 Formalmente, se dice que não é alto coeficiente de correlação entre as variáveis é espreto si ste se explica por a presença de um terceiro factor e não é uma razão para a existência de uma relação com o sentido entre as variáveis analizadas. En este caso, a correlação é estimada entre as variáveis e uma correlação com o objetivo. Karl Pearson (1897) foi o primeiro a usar o trmino correlacin esprea para ilustrar o origem de uma correlação com sinitos entre proporções, um travs do futuro caso. Considere um grupo de esqueletos que são utilizados em cada um de seus componentes e que se tornam um armar um pouco mais novos, que são utilizados pelos elementos elegíveis aleatoriamente dos diferentes esqueletos originales. Si para verificar se os perfis de cada novo esqueleto correspondente ao mesmo indivíduo (lo cual no es cierto), se correlacionan a la longitud de vários huesos de cada novo esqueleto divididos por a longitude do novo esqueleto al qual pertenece, se obtiene un coeficiente de correlacin Muito alto e estadsticamente significativo. Si bem é certo este resultado sugere que los huesos de cada esqueleto analizado (os novos esqueletos) correspondem aos mesmos indivíduos, esta não está concluindo cierta. En este caso, se dados que existe uma correlação esprea, pois a alta correlação se explica por a presença de um terceiro componente: a divisão da distância dos filhotes que se correlacionavam pela maior parte de cada novo aspecto. Este caso foi estudado em detalhe na seção 4.1. Durante o século XX se estudaram muitos casos de correlação espreas entre variáveis medidas a travs de dados de corte transversal e séries de tempo. El caso ms anecdótico de uma correlação em um contexto de corte transversal foi apresentado por J. Neyman em 1952. Neyman analiz la relacin entre a taxa de nascidos e a população de cigeas em várias regiões, encontrou um alto coeficiente de correlação entre estas Variáveis. Entre os casos, conhecidos de correlação espreas em um contexto de série de tempo, são os analizados por G. Udny Yule (1926) y Ploser y Schwer (1978). Por um lado, use dados anuales para o perodo 1866-1911, G. Udny Yule encontrou o coeficiente de correlação entre a taxa de mortalidade em Inglaterra e Gales e o percentual de matrimônios na igreja de Inglaterra era de 0,95. Por outro lado, use dados anuales para o perodo 1897-1958, Ploser y Schwertfen que o coeficiente de correlação 21 entre o logaritmo do ingreso nominal dos Estados Unidos e logaritmo da acumulação de manchas solares era de 0,91. Estes são os fatores que podem ser encontrados entre as variáveis. Então, lo nico seguro é o coeficiente de correlação permite determinar a força e o sentido de uma relacin lineal estadstica entre dos variáveis, ms não necessario de uma relacin lineal con sentido entre las mesmas. Dado este problema, é importante analizar as causas por as quais podem surgir correlaciones espreas. Como se mostre nas seguintes secções, as razões para as quais surgen correlaciones espreas em um contexto de corte transversal e em conjunto de séries de tempo podem ser diferentes. Sin embargo, antes de realizar esta análise, ser importante conhecer a estrutura de uma série que pode representar uma variável econmica. 3.2. Estructura de uma série Econmica En general, as séries econômicas podem ser apresentadas nos componentes: a. Un componente tendencial, que pode ser determinado (lineal o no lineal) o estocstico. B. Un componente estacional es decir, patrones de comportamento recorrentes para determinados perodos de tempo. C. Un componente irregular o modelable7. Es importante sealar que não todas as séries econômicas apresentam necessariamente os seus componentes. Por ejemplo, si los valores de las variables en cuestin estn representados por datos de corte transversal, es usual que no presenten componentes tendenciales ni estacionales. Sin embargo, con datos de series de tiempo, es muy probable que las variables presenten los tres componentes. 7 Existe un cuarto componente denominado cclico que muchas veces como en este caso se asume como parte del componente irregular o modelable. 22 En general, el componente ms importante de una serie econmica es el componente irregular o modelable, ya que contiene la mayor parte de la informacin econmicamente relevante. Sin embargo, existen situaciones en las que los componentes tendenciales determinsticos y o estocsticos poseen interpretacin econmica. Un caso muy conocido en el que el componente tendencial determinstico (lineal o no lineal) tiene sentido econmico lo constituye la tendencia determinstica del PBI real8. Esta tendencia representa el PBI potencial, el cual crece a una tasa igual a la pendiente de la tendencia. As, la diferencia entre la serie observada del PBI real y la tendencia (lineal o no lineal), permite obtener una aproximacin de las fluctuaciones del PBI o ciclo econmico. En la Figura 6 se muestra la serie mensual del PBI real de la economa peruana para el perodo enero 1933 - diciembre 2001, el PBI potencial (representado por una tendencia determinstica no lineal) y el ciclo econmico. 8.8 8.9 9.0 9.1 9.2 9.3 93 94 95 96 97 98 99 00 01 LPBIRSA HLPBIRSA -0.08 -0.04 0.00 0.04 0.08 93 94 95 96 97 98 99 00 01 CICLO Figura 6: El PBI real, el PBI potencial y el ciclo econmico Asimismo, las tendencias estocsticas de dos o ms series econmicas podran presentar una relacin con sentido econmico. Si dos series presentan tendencias estocsticas relacionadas entre s (es decir, comparten una tendencia estocstica), se dice que las variables cointegran. En trminos econmicos, si la relacin tiene sustento terico, se dice que estas variables presentan una relacin de largo plazo econmicamente significativa. En este caso, la tendencia estocstica que comparten las variables se interpreta como un camino comn del cual pueden desviarse temporalmente (corto plazo), pero no permanentemente (largo plazo). 8 Aunque tambin tiene sentido la tenencia estocstica. 23 4. CORRELACIONES ESPREAS Y DATOS DE CORTE TRANSVERSAL En esta seccin se muestran tres posibles formas en las que pueden presentarse correlaciones espreas en un contexto de corte transversal: el uso de ratios, observaciones atpicas o extraordinarias y grupos no relacionados. 4.1. Correlaciones Espreas y el uso de Ratios K. Pearson (1898) y R. Kronmal (1993) muestran que las correlaciones espreas pueden surgir entre dos variables que se miden como cocientes o ratios respecto de una tercera variable. Pearson, a travs de su ejemplo de los esqueletos construidos aleatoriamente, muestra la existencia de un coeficiente de correlacin significativo entre dos ratios cuyos componentes variables no presentan relacin alguna. Para entender esto, considrese las variables W, X, Y y Z, tales que se cumplen las siguientes condiciones: a. Y y X son independientes, por lo que no presentan relacin significativa alguna. B. Z es igual a la suma de Y, X y W En el contexto del caso analizado por Pearson, X e Y representan las longitudes de diferentes huesos que fueron correlacionados. Estos huesos pertenecen al mismo esqueleto aleatoriamente construido, por lo cual no estn relacionados. Z representa la longitud total del esqueleto aleatorio y W la longitud de los huesos de cada esqueleto aleatorio que no fueron utilizados en la correlacin. Si se contara con 200 esqueletos construidos aleatoriamente a partir de 200 esqueletos originales, entonces se tienen los siguientes pares de observaciones: ),( ),( ),( 200200 22 11 XY XY XY M 24 donde representa la longitud de un primer grupo de huesos del esqueleto artificial 1, representa la longitud de un segundo grupo de huesos del esqueleto artificial 1 Y representa la longitud de un primer grupo de huesos del esqueleto artificial 2 y representa la longitud de un segundo grupo de huesos del esqueleto artificial 2 y as sucesivamente. Si se dividen cada una de estas observaciones por la longitud total del esqueleto artificial al cual pertenecen, se obtienen las siguientes observaciones: 1Y 1X 2 2X ) , ( , ) , ( 200200200200 2222 1111 ZXZY ZXZY ZXZY M donde representa la longitud de un primer grupo de huesos del esqueleto artificial 1 como porcentaje de la longitud total de ste esqueleto, representa la longitud de un segundo grupo de huesos del esqueleto artificial 1 como porcenta je de la longitud total de este esqueleto y as sucesivamente. 11 ZY 11 ZX Para simular los resultados del caso presentado por Pearson, se construyeron artificialmente las variables W y YX. Z. con las caractersticas del problema que han sido mencionadas. Al analizar el coeficiente de correlacin entre las observaciones de Y y X, el resultado es un coeficiente de correlacin cercano a cero consistente con la realidad analizada: Matriz de Correlaciones entre X e Y X Y X 1.000000 -0.006123 Y -0.006123 1.000000 25 Esto puede observarse claramente en el grfico de dispersin de las mismas (Figura 7): -4 -2 0 2 4 6 -4 -2 0 2 4 X Y Figura 7: Relacin entre X e Y Sin embargo, al analizar la correlacin entre Y y X utilizando los ratios X Z e Y Z (cuyos componentes variables son X e Y), se obtiene un alto coeficiente de correlacin: Matriz de Correlaciones entre X Z e Y Z X Z Y Z X Z 1.000000 -0.965746 Y Z -0.965746 1.000000 lo cual tambin puede observarse claramente en el grfico de dispersin de las mismas. Como se muestra en la Figura 8: 26 -4 -2 0 2 4 -4 -2 0 2 4 XZ YZ Figura 8: Relacin entre X Z e Y Z De esta manera, la alta correlacin entre X Z e Y Z sera esprea o sin sentido. La alta correlacin est explicada por un tercer componente, Z, que esta relacionado a cada uno de los componentes variables, X e Y, que son independientes entre s. En el contexto del caso analizado por Pearson, dado que se sabe que no existe relacin entre las longitudes de los huesos de los esqueletos artificiales, un alto coeficiente de correlacin entre las longitudes de los huesos como porcentaje de la longitud total del esqueleto artificial al cual pertenecen es espreo o sin sentido. La explicacin de este alto coeficiente de correlacin est en la divisin de las longitudes de los huesos por la longitud total del esqueleto artificial al cual pertenecen. Una forma simple de detectar la presencia de correlaciones espreas cuando se utilizan ratios es analizar el grfico de dispersin y el coeficiente de correlacin entre los componentes variables de los mismos (cuando sea posible obtenerlos). 4.2. Presencia de Observaciones Atpicas (Out layers) Un segundo caso en el cual puede surgir correlaciones espreas se presenta cuando existen observaciones atpicas (out layers) tan importantes en magnitud que pueden generar un alto coeficiente de correlacin entre dos variables que no tienen relacin alguna. 27 Para mostrar este caso, se crearon dos series artificiales S1 y S2 independientes entre s, como se muestra en la matriz de correlaciones: Matriz de Correlaciones entre S1 y S2 S1 S2 S1 1.000000 0.024656 S2 0.024656 1.000000 y en el grfico de dispersin correspondiente: -4 -2 0 2 4 6 8 10 12 14 S1 S2 Figura 9: Relacin entre S1 y S2 Si una de las observaciones de esta muestra sta compuesta por valores muy diferentes a los usuales (relativamente muy grandes o muy pequeos), denominados atpicos u out layers, se obtendra la siguiente la matriz de correlaciones: Matriz de Correlaciones entre S1 y S2 con un out layer S1 S2 S1 1.000000 0.906860 S2 0.906860 1.000000 28 y el siguiente grfico de dispersin: -5 0 5 10 15 -5 0 5 10 15 S1 S2 S2 vs. S1 Figura 10: Relacin entre S1 y S2 Claramente, el alto coeficiente de correlacin (0.91) entre las variables S1 y S2 se debe a la presencia de un out layer, el cual fuerza la existencia de una relacin lineal entre las mismas (como se muestra en la Figura 10), a travs de una lnea que representa los datos. De manera natural, este resultado se puede generalizar a ms de un out layer. La identificacin de la existencia de correlaciones espreas entre dos variables debida a la presencia de uno o ms out layers, puede ser identificada fcilmente analizando el grfico de dispersin de las mismas. 4.3. Grupos No Relacionados Un tercer caso en el cual pueden surgir correlaciones espreas se presenta cuando existen dos o ms grupos de observaciones que relacionan dos variables, tales que el coeficiente de correlacin es bajo en cada grupo, pero alto cuando se analizan todos los grupos simultneamente. A estos grupos de observaciones se les denomina grupos no relacionados. 29 Para mostrar este caso, se crearon dos grupos de observaciones para dos variables ficticias C1 y C2 tales que estas no tienen relacin alguna, como se puede apreciar en sus respectivos grficos de dispersin: 7 8 9 10 11 12 13 6 8 10 12 14 C1 C 2 26 28 30 32 34 28 29 30 31 32 33 C1 C 2 Grupo 1 Grupo 2 Figura 11: Grupos No Relacionados y en sus matrices de correlaciones: Matriz de Correlaciones entre C1 y C2 en el Grupo 1 C1 C2 C1 1.000000 -0.066483 C2 -0.066483 1.000000 Matriz de Correlaciones entre S1 y S2 en el Grupo 2 C1 C2 C1 1.000000 0.062029 C2 0.062029 1.000000 30 Sin embargo, al analizar de manera conjunta ambos grupos de observaciones, se obtiene un grfico de dispersin donde se muestra que las observaciones pueden ser representadas por una lnea recta: 0 10 20 30 40 0 10 20 30 40 C1 C 2 C2 vs. C1 Figura 12: Correlacin entre Conglomerados y Correlacin Esprea La matriz de correlaciones confirma la existencia de una relacin lineal estadsticamente significativa: Matriz de Correlaci ones entre C1 y C2 C1 C2 C1 1.000000 0.988784 C2 0.988784 1.000000 De esta manera, es posible encontrar un coeficiente de correlacin alto entre dos variables no relacionadas entre s, o correlacin esprea, si se analizan de manera conjunta dos o ms grupos no relacionados de observaciones. 31 Este caso de correlacin esprea entre grupos no relacionados puede ser considerado como una generalizacin del caso de correlaciones espreas cuando existen out-layers: un grupo estara constituido por el out-layer y el segundo por las observaciones restantes. El caso de correlacin esprea presentado por Neyman, a travs de su ejemplo de las cigeas, puede ser considerado como un caso de grupos no relacionados. Los datos utilizados por Neyman que se presentan en la cuadro 2 corresponden al nmero de mujeres (por cada 10 mil), cigeas y nacimientos, para una muestra de 54 localidades. El nmero de mujeres est aproximado a nmeros enteros es decir, si en una localidad existen 14 mil mujeres, entonces el nmero de mujeres por cada 10 mil es 1. 32 Cuadro 2: Informacin sobre Mujeres, Nacimientos y Cigeas 1 1 2 10 2 1 2 15 3 1 2 20 4 1 3 10 5 1 3 15 6 1 3 20 7 1 4 10 8 1 4 15 9 1 4 20 10 2 4 15 11 2 4 20 12 2 4 25 13 2 5 15 14 2 5 20 15 2 5 25 16 2 6 15 17 2 6 20 18 2 6 25 19 3 5 20 20 3 5 25 21 3 5 30 22 3 6 20 23 3 6 25 24 3 6 30 25 3 7 20 26 3 7 25 27 3 7 30 28 4 6 25 29 4 6 30 30 4 6 35 31 4 7 25 32 4 7 30 33 4 7 35 34 4 8 25 35 4 8 30 36 4 8 35 37 5 7 30 38 5 7 35 39 5 7 40 40 5 8 30 41 5 8 35 42 5 8 40 43 5 9 30 44 5 9 35 45 5 9 40 46 6 8 35 47 6 8 40 48 6 8 45 49 6 9 35 50 6 9 40 51 6 9 45 52 6 10 35 53 6 10 40 54 6 10 45 Corr (C, N) 0,83 NacimientosLocalidad Mujeres Cigeas Si se analiza toda la muestra, se observa que el coeficiente de correlacin entre el nmero de cigeas y el nmero de nacimientos es 0.83, lo cual indicara la existencia de una relacin lineal estadsti camente significativa entre estas variables. Sin embargo, no existe una relacin con algn sentido diferente del estadstico, pues no es posible afirmar a partir de este 33 resultado que las cigeas traen a los bebs (a mayor nmero de cigeas, mayor nmero de nacimientos). Cuadro 3: Informacin por Grupos 1 1 2 10 2 1 2 15 3 1 2 20 4 1 3 10 5 1 3 15 6 1 3 20 7 1 4 10 8 1 4 15 9 1 4 20 Corr (C, N) 0.00 10 2 4 15 11 2 4 20 12 2 4 25 13 2 5 15 14 2 5 20 15 2 5 25 16 2 6 15 17 2 6 20 18 2 6 25 Corr (C, N) 0.00 19 3 5 20 20 3 5 25 21 3 5 30 22 3 6 20 23 3 6 25 24 3 6 30 25 3 7 20 26 3 7 25 27 3 7 30 Corr (C, N) 0.00 28 4 6 25 29 4 6 30 30 4 6 35 31 4 7 25 32 4 7 30 33 4 7 35 34 4 8 25 35 4 8 30 36 4 8 35 Corr (C, N) 0.00 37 5 7 30 38 5 7 35 39 5 7 40 40 5 8 30 41 5 8 35 42 5 8 40 43 5 9 30 44 5 9 35 45 5 9 40 Corr (C, N) 0.00 46 6 8 35 47 6 8 40 48 6 8 45 49 6 9 35 50 6 9 40 51 6 9 45 52 6 10 35 53 6 10 40 54 6 10 45 Corr (C, N) 0.00 G R U PO 5 G R U PO 6 G R U PO 1 G R U PO 2 G R U PO 3 G R U PO 4 Localidad Mujeres Cigeas Nacimientos 34 La existencia de un coeficiente de correlacin alto se explica por la presencia de grupos de datos no relacionados en la muestra analizada. El cuadro 3 muestra la informacin utilizada por Neyman en seis grupos de localidades de acuerdo al nmero de mujeres de las mismas. Al analizar el coeficiente de correlacin y el grfico de dispersin entre el nmero de cigeas y de nacimientos para cada grupo de localidades (Figura 13), se observa que en cada grupo de localidades el nmero de cigeas y de nacimientos no estn correlacionados, como era de esperarse. 8 10 12 14 16 18 20 22 1.5 2.0 2.5 3.0 3.5 4.0 4.5 CIGEAS N AC IM IE N TO S 14 16 18 20 22 24 26 3.5 4.0 4.5 5.0 5.5 6.0 6.5 CIGEAS N AC IM IE N TO S 18 20 22 24 26 28 30 32 4.5 5.0 5.5 6.0 6.5 7.0 7.5 CIGEAS N AC IM IE N TO S 24 26 28 30 32 34 36 5.5 6.0 6.5 7.0 7.5 8.0 8.5 CIGEAS N AC IM IE N TO S 28 30 32 34 36 38 40 42 6.5 7.0 7.5 8.0 8.5 9.0 9.5 CIGEAS N AC IM IE N TO S 34 36 38 40 42 44 46 7.5 8.0 8.5 9.0 9.5 10.0 10.5 CIGEAS N AC IM IE N TO S Figura 13: Relacin entre nacimientos y cigeas para cada grupo de localidades. Sin embargo, al considerar (por ejemplo) los grupos 1 y 6 en una sola muestra, se obtiene un coeficiente de correlacin alto (0.92), al igual que cuando se consideran todos los grupos simultneamente (0.82), lo cual se muestra a travs de los grficos de dispersin correspondientes de la Figura 14. De esta forma, se concluye que el alto coeficiente de correlacin entre las cigeas y los nacimientos es una correlacin esprea, explicada por la presencia de conglomerados. 35 0 10 20 30 40 50 0 2 4 6 8 10 12 CIGEAS N A C IM IE N TO S RELACIN ENTRE NACIMIENTOS Y CIGEAS: GRUPOS 1 Y 6 0 10 20 30 40 50 0 2 4 6 8 10 12 CIGEAS N A C IM IE N TO S RELACIN ENTRE NACIMIENTOS Y CIGEAS: GRUPOS 1 AL 6 Figura 14:Relacin lineal entre grupos no relacionados 5. CORRELACIONES ESPREAS Y SERIES DE TIEMPO En el contexto de series de tiempo, las correlaciones espreas pueden surgir por las mismas razones consideradas para el contexto de corte transversal: el uso de ratios, la presencia de out layers y grupos no relacionados. Sin embargo, las tendencias determinsticas o estocsticas - propias de la mayora de series de tiempo tambin pueden generar correlaciones espreas entre variables que no tienen sentido alguno. 5.1. Simulacin de Series de Tiempo Para demostrar que la presencia de componentes tendenciales pueden generan coeficientes de correlacin significativamente altos, se utilizan dos series de tiempo de 100 observaciones cada una que representan a dos variables X e Y. Estas series se construyen artificialmente de tal forma que no presentan relacin lineal alguna (considerando alguna teora especfica), como lo muestra la matriz de correlaciones: 36 Matriz de Correlaciones para X e Y X Y X 1.000000 0.032141 Y 0.032141 1.000000 A partir de sta matriz se observa que la correlacin entre X e Y es prcticamente cero (0.03), lo cual es consistente con la construccin de las dos series. La Figura 15 muestra el comportamiento de estas variables a lo largo de las 100 observaciones. -3 -2 -1 0 1 2 -3 -2 -1 0 1 2 3 10 20 30 40 50 60 70 80 90 X Y Figura 15: Series Artificiales X e Y A partir de esta figura, no es posible afirmar que si una de las variables aumenta, la otra tambin aumenta, disminuye o no se mueve. Es decir, no es posible inferir la existencia de una relacin positiva, negativa o simplemente que no exista relacin. Sin embargo, el grfico de dispersin para X e Y - en el cual se han normalizado las unidades de medida de las series9 - s permite afirmar que no existe relacin lineal entre estas variables, como se muestra en la Figura 16. En este ejemplo, el coeficiente de correlacin funciona bien, pues es posible afirmar que no existe relacin lineal estadstica ni significativa. 9 En adelante, los grficos de dispersin que se presenten utilizarn datos normalizados. 37 -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 X Y Figura 16: Grfico de dispersin entre X e Y. No existe relacin lineal significativa. Si a cada una de estas dos series construidas artificialmente se les aade una tendencia determinstica (lineal) que crece con el tiempo10, pero sin significado alguno: 1tXXT tt 2tYYT tt se obtiene una matriz de correlaciones como la siguiente: Matriz de Correlaciones para XT e YT XT YT XT 1.000000 0.997099 YT 0.997099 1.000000 Como se puede observar a partir de la matriz de correlaciones, el simple hecho de aadir una tendencia lineal creciente a cada una de las variables originales, genera una fuerte relacin lineal positiva entre las nuevas variables XT e YT (r 0,99). 10 Tambin podra ser una tendencia lineal decreciente, los resultados son similares en trminos de la existencia de una relacin lineal significativa estadsticamente, pero negativa. 38 -20 0 20 40 60 80 100 10 20 30 40 50 60 70 80 90 XT YT Figura 17: Series Artificiales XT e YT A partir de la Figura 17, se puede observar que ambas series crecen a lo largo del tiempo, lo cual muestra la posible existencia de una relacin positiva entre las variables XT e YT, cuya fuerza y linealidad pueden inferirse a partir del grfico de dispersin (Figura 18). Adems, el alto grado de correlacin se refleja por el hecho de que los puntos que representan las observaciones estn muy cercanos entre s y alrededor de una recta. -2 -1 0 1 2 -2 -1 0 1 2 XT YT Figura 18: Grfico de dispersin entre XT e YT. 39 Estos mismos resultados se obtienen si se aade una tendencia estocstica11 (sin ningn significado especial) a cada una de las series originalmente creadas, X e Y, crendose de esta forma dos nuevas variables, XRW e YRW: 1 ttt ZXXRW 2 ttt ZYYRW Las nuevas variables, como en el caso anterior, muestran un coeficiente de correlacin muy cercano a uno: Matriz de Correlaciones para XRW e YRW XRW YRW XRW 1.000000 0.989578 YRW 0.989578 1.000000 Al observar el grfico de las series (Figura 19), se puede apreciar que ambas crecen, lo cual inducira a pensar (al menos estadsticamente) que la correlacin entre las variables es positiva y aparentemente fuerte. -10 0 10 20 30 40 0 10 20 30 40 10 20 30 40 50 60 70 80 90 XRW YRW Figura 19: Series Artificiales XW e YW 11 Una tendencia estocstica es de la forma: ttt ZZ 1. donde. Tambin se le conoce como paseo aleatorio o random walk. ),0( 2 iidt 40 En efecto, al observar el grfico de dispersin de las variables XW e YW (Figura 20), se puede apreciar que la correlacin es significativamente alta (fuerte) y positiva. -2 -1 0 1 2 -2 -1 0 1 2 XRW YR W Figura 20: Relacin lineal significativa entre XW e YW. Estos ejemplos, que utilizan series artificiales, muestran que un coeficiente de correlacin alto entre dos variables que no tienen relacin alguna puede ser producto de la existencia de una tendencia lineal (determinstica) o una tendencia estocstica. 5.2. Tendencias y Correlaciones Espreas Considrense las variables XT e YT tales que cada una de ellas contiene un componente modelable (X e Y) y una tendencia lineal determinstica ( t y ), como las simuladas anteriormente: 1 2t 1tXXT tt 2tYYT tt Dada la estructura de las series, podran presentarse cuatro situaciones diferentes: 41 a. Relacin con sentido entre los componentes irregulares o modelables ( X e Y ) y entre los componentes tendenciales ( t y ). 1 2t b. Relacin co n sentido entre los componentes irregulares o modelables ( X e Y ), pero no entre los componentes tendenciales ( t y t ). 1 2 c. No existe relacin con sentido entre los componentes irregulares o modelables ( X e Y ), pero s entre los componentes tendenciales ( t y ). 1 2t d. No existe relacin con sentido entre los componentes irregulares o modelables ( X e Y ) ni entre los componentes tendenciales ( t y ). 1 2t En todos los casos, a excepcin de la situacin d, se afirma que existe una relacin con sentido entre XT e YT, pues existe relacin con sentido entre al menos uno de sus componentes. Sin embargo, en todos los casos existe una relacin estadsticamente significativa entre XT e YT medida a travs del coeficiente de correlacin entre las variables, lo cual se explica por la presencia de las tendencias lineales (pesar de que no estn relacionadas significativamente). Este resultado sera el mismo si el componente tendencial de las variables fuera estocstico. As, cuando se analizan dos series temporales que presentan tendencias que no tienen significado alguno, el coeficiente de correlacin no siempre esta asociado a una relacin con sentido. Cuando esto sucede, como en el caso d, se dice que la correlacin es esprea o sin sentido: el factor que genera la correlacin esprea es el componente tendencial. En otro caso, el coeficiente de correlacin si estara asociado a una relacin con sentido entre las variables. 5.3. Identificacin de Correlaciones Espreas Dado que es posible la existencia de correlaciones espreas en series de tiempo que presentan tendencias (determinsticas o estocsticas), que no tienen algn significado especial, es importante tratar de establecer alguna metodologa para identificar este problema. 42 Para este propsito, es necesario entender el concepto de variables en niveles y en primeras diferencias, pues la metodologa de identificacin consistir en el anlisis de los coeficientes de correlacin de las mismas. 5.3.1. Variables en niveles y primeras diferencias Una variable en niveles es cualquier variable que se toma como punto de partida para cualquier transformacin posterior. Por ejemplo, el nivel del PBI nominal en 1999 es el valor del PBI nominal en 1999, el nivel del gasto pblico en 1999 es el saldo del gasto pblico en 1999, el nivel de la tasa de crecimiento anual del PBI en 1999 es la tasa de crecimiento registrada entre 1999 y 1998, entre otros ejemplos. Una variable est expresada en primeras diferencias en el perodo t si se obtiene como la diferencia entre su valor actual y su valor pasado: 1 ttt XXX (4.1) As, por ejemplo, la primera diferencia del PBI nominal en 1999 es la diferencia entre el valor del PBI nominal en 1999 y el valor del PBI nominal en 1998 la primera diferencia del gasto pblico en 1999 es la diferencia entre el saldo del gasto pblico en 1999 y el saldo del gasto pblico en 1998 la primera diferencia de la tasa de crecimiento anual del PBI en 1999 es la diferencia entre la tasa de crecimiento entre 1999 y 1998 y la tasa de crecimiento entre 1998 y 1997. Los ejemplos planteados muestran que la definicin de variable en niveles y en primeras diferencias es relativa. As, la primera diferencia de podra considerarse como una variable en niveles, mientras que la segunda diferencia de. definida como: tX Xt )()( 211 2 ttttt XXXXX (4.2) podra considerarse como la primera diferencia de la primera diferencia de . tX 43 5.3.2. Primeras Diferencias y Eliminacin de Tendencias Dadas las definiciones de variables en niveles y primeras diferencias, es fcil mostrar que si una variable en niveles presenta una tendencia lineal, su primera diferencia ya no presenta ese componente tendencial. Para verificar esto, considrense las variables simuladas XT e YT: 1tXXT tt 2tYYT tt donde las tendencias no tienen significado alguno. La primera diferencia de la serie X est dada por: )1 11 1 1 (t X-tXXTXTXT ttttt 111 1 t-X-tXXT ttt )X-XXT ttt 1(1 tt XXT 1 (3.3) De manera anloga, la primera diferencia de Y est dada por: )1 11 1 1 (t Y-tYYTYTYT ttttt tt YYT 1 (3.5) As, la primera diferencia de una variable elimina todo componente tendencial determinstico existente en su expresin en niveles. Sin embargo, las primeras diferencias de los componentes irregulares o modelables permanece N. Si las variables en niveles presentaran un componente tendencial estocstico, la primera diferencia tambin lo eliminara12. Dado el supuesto que Xt y Yt no estn relacionados, si se calcula el coeficiente de correlacin entre las primeras diferencias de las variables, ste sera bajo a pesar de que el coeficiente en niveles es alto, cmo se mostr en la seccin 5.1. 12 Este es un ejercicio que el lector debera resolver. 44 Matriz de Correlaciones para las primeras diferencias de XT e YT XT YT XT 1.000000 0.002450 YT 0.002450 1.000000 De esta manera, la relacin esprea entre X e Y presenta un coeficiente de correlacin alto para los niveles de las variables y uno bajo para las primeras diferencias de las variables. Sin embargo, si existiera una relacin con sentido entre Xt e Yt, entonces el coeficiente de correlacin entre los niveles de las variables sera alto, al igual que el coeficiente de correlacin para sus primeras diferencias. El anlisis precedente permite establecer la siguiente metodologa de identificacin de correlaciones espreas en un contexto de series de tiempo, bajo el supuesto de que los componentes tendenciales (determinsticos o estocsticos) no tienen sentido alguno: a. Si el coeficiente de correlacin de los niveles de las variables es significativamente alto, pero el coeficiente de correlacin de las primeras diferencias de las mismas es bajo, entonces la correlacin entre los niveles de las variables es una correlacin esprea o sin sentido alguno. B. Si el coeficiente de correlacin de los niveles y de las primeras diferencias de las variables es significativamente alto, entonces la correlacin entre los niveles de las variables es una correlacin con sentido. 5.3. Correlaciones Espreas y Correlaciones con Sentido Econmico En muchas ocasiones, la teora econmica establece que es posible encontrar relaciones con sentido entre pares de variables bajo ciertas circunstancias. Por ejemplo, no siempre existe una relacin con sentido econmico entre los precios de todos los bienes de la economa, pero s entre los precios de los bienes producidos por dos empresas que compiten en el mismo mercado. De hecho, si los precios de dos bienes cualesquiera presentan un componente tendencial sin sentido econmico, es posible encontrar un coeficiente de correlacin alto entre ellos sin que eso implique que guarden alguna relacin con sentido. 45 En casos como estos, donde es posible que exista relacin con sentido econmico y se intenta encontrar evidencia sobre ello, es posible aplicar la metodologa presentada en la seccin anterior. As, bajo el supuesto de que los componentes tendenciales de cada una de las variables econmicas relacionadas no tiene sentido: a. Si el coeficiente de correlacin de los niveles de las variables es significativamente alto, pero el coeficiente de correlacin de las primeras diferencias de las mismas es bajo, entonces la correlacin entre los niveles de las variables es una correlacin esprea o sin sentido econmico. B. Si el coeficiente de correlacin de los niveles y de las primeras diferencias de las variables es significativamente alto, entonces la correlacin entre los niveles de las variables es una correlacin con sentido econmico. Esta metodologa para identificar correlaciones espreas a partir de los coeficientes de correlacin, fue utilizada por Stigler y Sherwin (1985). La hiptesis principal del artculo en el cual ponen en prctica la metodologa es la siguiente: Si dos bienes o servicios compiten en el mismo mercado, sus precios deberan estar muy correlacionados. Sin embargo, como la mayora de precios muestran movimientos tendenciales en el tiempo (que se asumen que no tienen interpretacin econmica en muchos casos), los autores analizaron la correlacin entre los niveles de los precios y sus primeras diferencias (cambio en lo precios), para poder identificar la existencia de una correlacin con sentido econmico. Los resultados del anlisis mostraron que el valor del coeficiente de correlacin no disminuye drsticamente al utilizar las variables en niveles y en primeras diferencias. De esta manera, los autores concluyen que los bienes estudiados compiten en el mismo mercado. 46 6. APLICACIONES: IDENTIFICACIN DE RELACIONES ESPREAS ENTRE VARIABLES ECONMICAS En esta seccin se presentan aplicaciones del coeficiente de correlacin para el anlisis de relaciones bivariadas y la identificacin de posibles correlaciones espreas. Para este fin, se analizan diferentes relaciones bivariadas entre variables econmicas empleando datos mensuales para el Per (series de tiempo) que abarcan el perodo enero 1993 - diciembre 2001. 6.1. Descripcin de los datos utilizados Los datos empleados para realizar las aplicaciones han sido obtenidos del Banco Central de Reserva del Per (Boletines Semanales, Memorias Anuales y pgina web13), y corresponden a ocho variables importantes para la economa peruana. Las series escogidas como variables proxy (aproximadas) para cada una de las variables econmicas utilizadas fueron: la emisin primaria (EMISION), el ndice de precios al consumidor con base 1994 (IPC94), el circulante nominal (CIR), el producto bruto interno real (PBIR), el tipo de cambio informal promedio (TCIP), el crdito de las empresas bancarias al sector privado en moneda extranjera (CREME), la tasa de inters pasiva en moneda nacional (TIPMN) y la tasa de inters activa en moneda extranjera (TAMEX). Para obtener series que permitan representar relaciones bivariadas con sentido econmico, se realizaron algunas transformaciones. En primer lugar, se eliminaron los componentes cclicos o estacionales de las series EMISIN, CIR y PBIR, a travs del procedimiento de desestacionalizacin ratio moving average-multiplicative del programa Eviews. Las series desestacionalizadas se denominaron EMISIONSA, CIRSA y PBIRSA. Los componentes estacionales dependen de la economa analizada. Por ejemplo, la emisin monetaria en el caso peruano presenta un componente estacional representado por picos en los meses de julio y diciembre, que se observan en la figura 21. 13 bcrp. gob. pe 47 1000 2000 3000 4000 5000 6000 93 94 95 96 97 98 99 00 01 EMISION Figura 21: La Emisin en el Per y su estacionalidad Luego de aplicar a la serie EMISIN el proceso ratio moving average-multiplicative, la serie desestacionalizada (EMISIONSA) ya no presenta el componente cclico, como se muestra en la Figura 22: 1000 2000 3000 4000 5000 6000 93 94 95 96 97 98 99 00 01 EMISIONSA Figura 22: Emisin desestacionalizada Como segundo las variables nominales CIR, CREME, TAMEX y TCIP fueron transformadas a reales (CR, CRERME, TARMEX y TCIPR), utilizando el IPC94 y el TCIP para el caso de las variables denominadas en moneda extranjera. Finalmente, para 48 homogenizar la escala de las variables se aplicaron logaritmos a todas las series con excepcin de las tasas de inters, generando as las series finales LEMISIONSA, LCR, LPBIRSA, LIPC94, LCRERME y LTCIPR. 6.2. Relaciones Econmicas y Correlaciones Espreas Para aplicar los conceptos de correlacin y correlaciones espreas, se analizarn seis relaciones bivariadas importantes propuestas por la teora macroeconmica convencional: dinero y precios, demanda por dinero real e ingreso, demanda por dinero real y tasa de inters nominal en moneda nacional, produccin y tasa de inters real en moneda extranjera, produccin y crdito real en moneda extranjera, produccin y tipo de cambio real. 6.2.1. Dinero y Precios Para analizar la relacin entre dinero y precios se utilizaron como variables proxy LEMISIONSA y LIPC94. La teora macroeconmica establece la existencia de una relacin positiva entre estas variables. Por un lado, la ecuacin cuantitativa del dinero, definida como: PQMV establece que en el largo plazo bajo el supuesto que la velocidad de circulacin del dinero (V) es estable y que el producto est en su nivel potencial o de pleno empleo - un aumento de la cantidad de dinero tendr efectos nicamente sobre el nivel de precios as, un aumento de 10 por ciento en la cantidad de dinero generar en el largo plazo un incremento de 10 por ciento en el nivel de precios. Este resultado es uno de los supuestos que subyacen a la nueva macroeconoma clsica. Por otro lado, considerando el modelo de la sntesis neoclsica (que asume una oferta agregada con pendiente positiva), un aumento de la cantidad de dinero genera un aumento en la demanda agregada y por lo tanto un aumento en el producto (fenmeno denominado demanda efectiva), el cual va acompaado de un aumento del nivel de precios, como se muestra en la Figura 23: 49 DA(M0) DA(M1) OA P1 P0 Y0 Y1 Figura 23: Demanda, Oferta, Produccin y Precios Para verificar la existencia de un sustento emprico de esta relacin terica entre dinero y precios, se grafican (Figura 24) las series LEMISIONSA e IPC94 para el periodo enero 1993 diciembre 2001: 7.2 7.6 8.0 8.4 8.8 4.2 4.4 4.6 4.8 5.0 5.2 93 94 95 96 97 98 99 00 01 LEMISIONSA LIPC94 Figura 24: Dinero y Precios El grfico muestra que ambas series crecen a lo largo del tiempo y de forma parecida. Para verificar la existencia de una relacin lineal se utiliza el grfico de dispersin de ambas series: 50 -3 -2 -1 0 1 2 -3 -2 -1 0 1 2 LEMISIONSA LI PC 94 Figura 25: Grfico de dispersin entre los niveles de Emisin y Precios Como se puede apreciar en la Figura 25, la relacin entre LEMISIONSA y LIPC94 es aproximadamente lineal (los puntos pueden ser representados por una lnea recta) y positiva. Para determinar la fuerza de la relacin entre estas variables se utiliza la matriz de correlaciones: LEMISIONSA LIPC94 LEMISIONSA 1.000000 0.988957 LIPC94 0.988957 1.000000 Como era de esperar por lo establecido por la teora econmica, la correlacin entre los niveles de las variables es positiva y fuerte (0.99). Para comprobar si la relacin lineal entre las variables analizadas es o no esprea, es necesario analizar la correlacin entre las primeras diferencias de las variables. DLEMISIONSA DLIPC94 DLEMISIONSA 1.000000 0.224576 DLIPC94 0.224576 1.000000 51 La matriz de correlaciones entre las primeras diferencias de las variables muestra una relacin lineal positiva y dbil entre DLEMISIONSA y DLIPC94 (0.22), lo cual tambin puede observarse en el grfico de dispersin: -2 0 2 4 6 -4 -2 0 2 4 DLEMISIONSA D LI PC 94 Figura 26: Grfico de dispersin entre las primeras diferencias de la Emisin y los Precios Bajo el supuesto de que las tendencias de las series no tienen sentido alguno, este resultado permitira concluir que la relacin entre el dinero y el nivel de precios de la economa es esprea. Sin embargo, si se considera la teora monetarista de la determinacin de los precios, las tendencias que presentan cada una de las series se interpretan como la senda de largo plazo que siguen as, en este caso la correlacin sera una correlacin con sentido econmico: el dinero determina los precios en el largo plazo. 6.2.2. Demanda por Dinero Real e Ingreso Real. Como segundo ejemplo, se analiza la relacin entre la demanda por dinero real y el ingreso real, relacionados tericamente a travs del modelo clsico de demanda por dinero real. En este modelo, el dinero se utiliza solamente para realizar transacciones. Para verificar empricamente la existencia de sta relacin terica se utilizaron como variables proxy LCR (para la demanda por dinero real) y LPBIRSA (para el ingreso real). 52 El grfico de la demanda por dinero real y el ingreso real (figura 27), permite apreciar un comportamiento creciente en ambas series, para el periodo enero 1993 diciembre 2001: 2.4 2.6 2.8 3.0 3.2 3.4 8.8 8.9 9.0 9.1 9.2 9.3 93 94 95 96 97 98 99 00 01 Circulante Real (logs) PBI Real (logs) Figura 27: Dinero e Ingreso reales El grfico de dispersin (Figura 28), sugiere la existencia de una relacin aproximadamente lineal positiva entre las variables LCR y LPBIRSA. -3 -2 -1 0 1 2 -3 -2 -1 0 1 2 LCR LP BI R SA Figura 28: Grfico de dispersin entre los niveles de Dinero e Ingreso reales 53 La matriz de correlaciones indica que la existencia de un grado de asociacin lineal entre las variables positivo y bastante alto (0.95), corroborndose de esta forma lo establecido por la teora econmica y lo observado preliminarmente en el grfico de dispersin: Matriz de Correlaciones en Niveles: Dinero e Ingreso Reales LCR LPBIRSA LCR 1.000000 0.953381 LPBIRSA 0.953381 1.000000 Sin embargo, para determinar si la correlacin entre estas variables es una correlacin esprea, es necesario analizar la matriz de correlaciones entre las primeras diferencias de las mismas: Matriz de Correlaciones en Primeras Diferencias: Dinero e Ingreso Reales DLCR DLPBIRSA DLCR 1.000000 0.036931 DLPBIRSA 0.036931 1.000000 La matriz muestra una relacin lineal dbil entre las primeras diferencias de las variables. Por lo tanto, se concluye que la correlacin entre la demanda por dinero real y el ingreso es esprea o sin sentido, lo cual implica que la correlacin entre las variables est explicada por la presencia de componentes tendenciales. Nuevamente, bajo el supuesto de que las tendencias de las series no tienen sentido alguno, este resultado permitira concluir que la relacin entre el dinero real y el ingreso real es esprea. Sin embargo, si se considera como relevante la relacin de largo plazo entre el dinero real y el ingreso real, entonces las tendencias que presentan cada una de las series se interpretan como la senda de largo plazo que siguen cada una de ellas en este caso, la correlacin sera una correlacin con sentido econmico: en el largo plazo la demanda real por dinero esta ntimamente relacionada con el ingreso real. 54 6.2.3 Produccin, Tasa de Inters, Crdito y Tipo de Cambio reales La teora macroeconmica tradicional establece relaciones econmicamente significativas entre la produccin, la tasa de inters, el crdito y tipo de cambio - todas expresadas en trminos reales. Por un lado, un aumento de la tasa de inters real encarece el crdito y por lo tanto desincentiva la inversin en trminos reales, generndose finalmente un efecto adverso sobre la produccin. Por ello, existe una relacin directa o positiva entre el producto real y el crdito real, y una relacin inversa o negativa entre el producto real y la tasa de inters real. Por otro lado, la relacin entre el producto real y el tipo de cambio real no es nica y depende de las caractersticas de la economa. Por ejemplo, en una economa como la peruana donde aproximadamente el 80 por ciento de los activos monetarios estn denominados en dlares y la carga de la deuda externa tambin denominada en dlares constituye ms del 20 por ciento del producto, un aumento del tipo de cambio tendra efectos negativos sobre el producto. Sin embargo, en otras economas, la relacin entre el producto y el tipo de cambio reales es positiva: un incremento del tipo de cambio real incentiva las exportaciones netas, generndose un aumento de la demanda agregada y en consecuencia por demanda efectiva un aumento del producto. 8.8 8.9 9.0 9.1 9.2 9.3 0.004 0.006 0.008 0.010 0.012 0.014 0.016 0.018 0.020 93 94 95 96 97 98 99 00 01 LPBIRSA TARMEX 8.8 8.9 9.0 9.1 9.2 9.3 3.0 3.5 4.0 4.5 93 94 95 96 97 98 99 00 01 LPBIRSA LCRERME 55 8.8 8.9 9.0 9.1 9.2 9.3 -3.95 -3.90 -3.85 -3.80 -3.75 -3.70 -3.65 93 94 95 96 97 98 99 00 01 LPBIRSA LTCIPR Figura 29: Producto, Tasa de Inters, Crdito y Tipo de Cambio reales Las variables proxy utilizadas para medir la produccin, la tasa de inters, el crdito y el tipo de cambio reales fueron LPBIRSA, TARMEX, CRERME y LTCIPR, respectivamente. Para el caso de la tasa de inters y el crdito, se utilizaron las series correspondientes a moneda extranjera, dada la importancia de la dolarizacin de la economa peruana para el periodo estudiado. La contrapartida emprica para las relaciones bivariadas establecidas por la teora econmica se aprecia en los grficos de las series de la Figura 29, verificndose el sentido de las relaciones establecidas por la teora. -2 0 2 4 -3 -2 -1 0 1 2 LPBIRSA TA R M EX -2 -1 0 1 2 3 -3 -2 -1 0 1 2 LPBIRSA LT C IP R 56 -3 -2 -1 0 1 2 -3 -2 -1 0 1 2 LPBIRSA LC R ER M E Figura 30: Relaciones Bivariadas entre Producto, Tasa de Inters, Crdito y Tipo de Cambio Reales. Los grficos de dispersin de la Figura 30, confirman la existencia de una relacin lineal inversa, tanto para el caso del producto real vs. la tasa de inters real como para el del producto real vs. el tipo de cambio real, y una relacin directa entre el producto y el crdito reales. La matriz de correlaciones de las variables permite determinar la fuerza de estas relaciones bivariadas lineales: LPBIRSA TARMEX LCRERME LTCIPR LPBIRSA 1.000000 -0.940297 0.947747 -0.431767 TARMEX -0.940297 1.000000 -0.871744 0.256799 LCRERME 0.947747 -0.871744 1.000000 -0.440914 LTCIPR -0.431767 0.256799 -0.440914 1.000000 Bajo el supuesto de que los componentes tendenciales que presentan cada una de las series no tienen sentido alguno, la matriz de correlaciones en primeras diferencias de las mismas permite concluir que las relaciones bivariadas entre el producto y la tasa de inters, el crdito y el tipo de cambio reales son espreas: 57 DLPBIRSA DTARMEX DLCRERME DLTCIPR DLPBIRSA 1.000000 -0.178665 0.248468 0.077523 DTARMEX -0.178665 1.000000 -0.016953 0.090657 DLCRERME 0.248468 -0.016953 1.000000 -0.131397 DLTCIPR 0.077523 0.090657 -0.131397 1.000000 El grfico de dispersin de las variables en primeras diferencias (Figura 31), refuerza la conclusin, pues muestra la ausencia de relacin alguna entre las variables: -4 -2 0 2 4 -4 -2 0 2 4 DLPBIRSA D TA M EX R -4 -2 0 2 4 -4 -2 0 2 4 DLPBIRSA D LC R ER M E -4 -2 0 2 4 -4 -2 0 2 4 DLPBIRSA D LT C IP R Figura 31: Grficos de dispersin de las primeras diferencias de las series. Sin embargo, una vez ms, si la teora econmica establece la posibilidad de una relacin de largo plazo entre cualquiera de los pares de variables analizados, entonces los componentes tendenciales tendran sentido (en este caso econmico) y por lo tanto las correlaciones no seran espreas. 58 7. CONCLUSIONES (1) El coeficiente de correlacin es un instrumento estadstico que permite establecer la fuerza y direccin de una relacin lineal estadstica entre dos variables a partir de una muestra determinada, bajo el supuesto de que sta es representativa. (2) Existen casos en los que un coeficiente de correlacin significativo entre dos variables es consecuencia de un tercer factor diferente de ellas y no de la existencia de una relacin lineal con algn sentido entre las mismas bajo la consideracin de alguna teora conocida (por ejemplo, biolgica, fsica, econmica, entre otras). Cuando esto sucede, se dice que la correlacin es esprea. La correlaciones espreas pueden presentarse cuando las variables analizadas son medidas a travs de datos de corte transversal o series de tiempo. (3) Entre las principales causas de las correlaciones espreas en un contexto de corte transversal figuran el uso de ratios, la presencia de datos atpicos (out layers) y de grupos no relacionados. Para el caso de correlaciones espreas causadas por el uso de ratios, la deteccin implica el anlisis de la correlacin y sentido de los componentes variables (numeradores) de los mismos. Para el caso de datos atpicos el grfico de dispersin es un instrumento muy importante para identificarlos. Para el caso de grupos no relacionados, es posible detectar la presencia de correlaciones espreas analizando el grfico de dispersin y la estructura de la muestra. (4) Para el caso de series temporales, adems de las causas mencionadas para el contexto de corte transversal, la presencia de tendencias (determinsticas o estocsticas) que carecen de sentido alguno tambin pueden generar correlaciones espreas. Bajo estas circunstancias, es posible detectar la presencia de correlaciones espreas analizando el coeficiente de correlacin de los niveles y las primeras diferencias de las series. Si el coeficiente de correlacin es considerado significativamente alto en niveles y en primeras diferencias, entonces la correlacin no es esprea. Si el coeficiente de correlacin es considerado significativamente alto en niveles mas no as en primeras diferencias, entonces la correlacin es esprea. 59 Referencias Bibliogrficas Banco Central de Reserva del Per Memoria Anual. Varios nmeros. Banco Central de Reserva del Per Boletn Semanal. Varios nmeros. Granger, C. W. 1969 Investigating Causal Relations by Econometric Models and Cross-Spectral Methods. Economtrica, Vol. 37. Kronmal, Richard 1993 Spurious Correlation and the Fallacy of the Standard Ratio Revisited. Journal of the Royal Statistical Society. Vol. 156, parte 3, p. 379-392. Liebetrau, Albert M. 1983 Mesures of Association. Newbury Park: Sage. Lima, Elon Lages 1997 Anlisis Real. Lima: Per Offset, Vol. 1. Mendenhall, William Scheaffer, Richard L. y Dennis D. Wackerly 1994 Estadstica Matemtica con Aplicaciones. Mxico: Grupo Editorial Iberoamerica. 2da. Edicin. Neyman, Jerzy 1952 Lectures and Conferences on Mathematical Statistics and Probability. Washington DC: US Department of Agriculture. 2da, ed. P. 143-154. 1952. Pearson, Karl 1897 Mathematical contributions to the theory of evolution on the form of spurious correlation which may arise when indices are used in the measurements of organs. Proceedings of the Royal Society of London. Vol. 60, p. 268-286. 1897. Stigler, George J. y Robert A. Sherwin 1985 Extent of the Market. Journal of Political Economics, Vol. 28, 1985. 60 APNDICE Demostracin 1: La covarianza es sensible a las unidades de medida de las variables Sean dos variables X e Y para las cuales se cuenta con n valores observados. Sus valores muestrales promedio estn dados por: n XX X n K1 n YY Y n K1 y su covarianza por: n i ii YYXXn YXCov 1 ))(( 1 1),( Si todos los valores de X e Y fueran multiplicados por y . tales que y. las unidades de medida de ambas variables se incrementaran porcentualmente en dichos factores, al igual que sus respectivas medias muestrales: 1 1 X n XX n XX nn )( 11 KK Y n YY n YY nn )( 11 KK Dado esto, tenemos que: n i ii n i ii YYXXn YYXX n YXCov 11 ))(( 1 1))(( 1 1),( ),())(( 1 ),( 1 YXCovYYXX n YXCov n i ii 61 ),(),( YXCovYXCov Es decir, el valor de la covarianza entre las variables se altera en una proporcin igual a . Sin embargo, el signo no se altera. Demostracin 2: -1
Комментариев нет:
Отправить комментарий