domingo, 13 de novembro de 2016

Será Possível Prever o Futuro?

Olá Pessoal! Na natureza existem leis, e tais lei regem o comportamento dos sistemas, seja este o sistema solar com as posições relativas dos astros por exemplo, ou o sistema climático da terra, dentre tantos outros. Mas a questão é se entendermos estas leis somos capazes de predizer tudo a respeito do sistema em análise? A resposta é: depende da lei!

De forma bastante geral, observando a natureza de forma macroscópica e clássica, existem processos que são regidos por leis  determinísticas, chamados de processos determinísticos, e por lei estocásticas (ou não determinísticas), chamados de processos estocásticos (ou não determinísticos).

Os Processos Determinísticos, como o próprio nome já nos induz a pensar, uma vez conhecidas as leis que os regem é possível determinar exatamente o que irá ocorrer, ou qual será o estado do sistema, em um determinado tempo qualquer, seja este o presente, passado ou futuro. Como já citado como exemplo, o nosso sistema solar, formado por todos os seus astros, é guido pela lei da grafitação, a qual é determinística (lei newtoniana).

Contudo, os fenômenos estocástico, com suas lei não determinísticas, irão seguir alguma função de distribuição de probabilidade (fdp), a qual irá reger as chances de algo ocorrer. 



Assim, imagine um sistema que evolui no tempo, logo dado um valor possível do domínio, no caso x0, a fdp irá dar a probabilidade deste evento ocorrer (ou ser observado) no instante de tempo t. Portanto, se perguntarmos qual a probabilidade de algum evento (de todos os possíveis) ocorrer (dado que um evento irá obrigatoriamente ocorrer, visto que o tempo está correndo), a resposta deverá ser obrigatoriamente 100%, visto que algum evento dos possível obrigatoriamente irá ocorrer. Assim se representarmos a área como a probabilidade de algum intervalo de valores de x ocorrer, a área total ( de -infinito até +infinito) deverá ser 1 (ou 100%). Outra obervação importante a respeito das fdp's vem do fato de que a "largura" da fdp dá a ideia de dispersão (ou espalhamento). Assim, quanto mais "larga" for a fdp, maior será a variação provável do sistema, ou em outra palavras, maior será a variância (e também maior será o desvio padrão). 

Contudo, em um processo típico estocástico, como por exemplo o valor de uma ação em uma bolsa de valores, a impressão que dá para perceber é que, embora exista algo não determinístico ocorrendo, existe alguma lei que ainda relaciona os acontecimentos passados (e presente) para a determinação dos estados futuros. Ou seja, se uma dada ação, por exemplo, vem em uma tendencia de alta, e nenhum acontecimento externo ocorre,  é natural que esperemos que esta ação continue em alta. 

Assim, de forma simplista, suponto que a variância da fdp é uma constante (processo homocedástico) e que existe um relacionamento linear entre as observações do sistema no tempo, existem uma teoria muito bem formulada chamada comumente de modelos de Box & Jenkins [1], ou modelos ARIMA(p,d,q) (Auto-Regressive Integrated Move Averange de ordem p,d,q). De forma geral, estes modelos consideram que exite uma correlação entre as observações passadas e presente dos estados do sistema bem como dos choque aleatórios do passado e presente. Os choques aleatórios são exatamente a parte não determinística do processo que em tese deve seguir uma distribuição gaussiana (ou norma) de média zero e variância constate. Portanto, estes choque aleatórios constituem o que se chama de ruído branco, onde suas observações são independentes e identicamente distribuídas (seguindo uma Normal).

Se $Z_t$ é uma observação no tempo $t$ de um processo $Z$, a forma geral do modelo ARIMA seria: $$ ( 1- \phi_{1} B - \phi_{2} B^2 - \cdots -\phi_{p} B^p ) (1-B)^d Z_t  = (1-\theta_1 B - \theta_2 B^2 - \cdots - \theta_q B^q) a_t$$

onde $B$ é o operador de translado temporal para trás de tal forma que $$B Z_t = Z_{t-1}, \quad B^2 Z_t = B (BZ_t) = B Z_{t-1} = Z_{t-2}$$

onde é possível generalizar, $$ B^m Z_t = Z_{t-m}$$.

Os termos $\phi_1, \phi_2, \dots, \phi_p, \theta_1, \theta_2, \dots, \theta_q$ são os $p$'s termos auto-regressivos e $q$'s termos de médias móveis, sendo todos coeficientes de ajuste do modelo. E por fim, $a_t$ é o termo de ruido branco, ou choque aleatório.

Assim, uma vez observando a evolução de um dado processo no tempo (uma série temporal), é possível determinar os graus $p,d,q$ (o modelo em si) e todos os respectivos parâmetros. Contudo, dado que existe sempre uma componente vinda de um ruido branco ($a_t$), as previsões geradas por este tipo de modelagem sempre irá buscar uma solução de menor erro possível, mas que raramente será zero! De forma prática, esta modelagem ao gerar uma previsão também gera um intervalo de confiança, que irá dar com um certo grau de confiança  um intervalo (um valor de máximo e um de mínimo) onde a verdadeira previsão deverá ocorrer. Neste sentido, um bom modelo será aquele que tiver com um alto grau de confiança um pequeno intervalo para a previsão.

Bem, é assim que de forma geral se realiza uma previsão de um processo estocástico. É claro que existem outros modelos, inclusive modelos não lineares extremamente sofisticados, mas o conceito é o mesmo: dada uma série temporal, seleciona-se um modelo capaz de verificar padrões de correlação entre os dados e extrapola-se tal modelo. Dada a incerteza do processo estocástico, cria-se também um intervalo de confiança para a previsão estimada.


Nenhum comentário:

Postar um comentário