Indicador Z-Score.
Aqui está outra olhada no Bollinger Bands.
O escore z (z) para um item de dados x mede a distância (em desvios padrão & sigma;) e a direção do item de sua média (& mu;):
Um valor de zero indica que o item de dados x é igual à média & mu ;, enquanto os valores positivos ou negativos mostram que o item de dados está acima (x & gt; & mu;) ou abaixo (x & lt; & mu;) da média, respectivamente). Valores de +2 e -2 mostram que o item de dados é dois desvios padrão acima ou abaixo da média escolhida, respectivamente, e mais de 95,5% de todos os itens de dados estão contidos nessas duas referências horizontais (ver Figura 1).
Figura 1: indicador do Z-score Mais de 95,5% de todos os dados estão contidos nos desvios padrão de + e -2.
CÁLCULO DA Z-SCORE.
Como você pode aplicar essa fórmula aos preços das ações? Se você substituir x pelo preço de fechamento C, a média & mu; com média móvel simples (SMA) de n períodos (n) e & sigma; com o desvio padrão dos preços de fechamento para n períodos, a fórmula acima se torna:
(A computação do escore z, usando Excel e MetaStock, para uma série de preços de fechamento, é explicada na barra lateral, & quot; Cálculo do escore Z. & quot;)
COMO USAR O INDICADOR DE Z-SCORE.
Uma vez que o indicador é definido, a questão é & quot; Qual é a relação entre o z-score e as bandas de Bollinger conhecidas? & Quot; Enquanto as Bandas de Bollinger aplicadas aos preços de fechamento são exibidas como desvios padrão D acima e abaixo da média, o escore z mostra a que distância o preço de fechamento atual é dessas bandas.
A Figura 2 exibe Bandas de Bollinger para preços de fechamento (20 períodos e dois desvios padrão) e escore z para 20 dias aplicados ao gráfico diário da Média Industrial Dow Jones (DJIA).
Figura 2: Bandas de Bollinger e z-score. Quando os preços tocam as bandas, o z-score atinge +2 ou -2 níveis de desvio padrão.
Como esperado, sempre que o preço toca a faixa superior, o escore z atinge o +2. Por outro lado, quando o preço toca a banda inferior, o escore z atinge -2 níveis de desvio padrão.
Na Figura 3 (gráfico superior) você vê o indicador z-score aplicado ao índice composto Nasdaq. Os níveis horizontais em +2, 0, -2 oferecem uma imagem clara da resistência esperada e dos níveis de suporte, já que são equivalentes com a Banda de Bollinger superior, a média móvel e a Banda de Bollinger inferior, respectivamente.
Figura 3: Suavizando o z - score Isso pode resultar em negociações muito lucrativas.
O escore Z aplicado ao preço de fechamento é uma curva irregular que pode ser suavizada pela aplicação de médias móveis. Na Figura 3 (gráfico inferior), uma média móvel simples de três dias foi aplicada ao escore z (20) e uma média móvel simples de cinco dias é aplicada à média resultante.
Como você pode ver, bons movimentos de longo prazo ocorreram em:
quando a média móvel simples de três dias cruzou acima da média móvel simples de cinco dias da média móvel simples de três dias. Observe que há algumas boas oportunidades de shorting iniciadas quando a média móvel simples de três dias cruzou abaixo da média móvel simples de cinco dias da média móvel simples de três dias (3/12/02, 22/04/02, 21/5/21). 02 e 8/23/02).
CONCLUSÕES
O indicador z - score não é novo, mas seu uso pode ser visto como um complemento ao Bollinger Bands. Ele oferece uma maneira simples de avaliar a posição do preço vis - & # 224; - vis seus níveis de resistência e suporte expressos pelas Bollinger Bands. Além disso, os cruzamentos das médias do z-score podem sinalizar o início ou o fim de uma tendência negociável. Os traders podem dar um passo adiante e procurar por sinais mais fortes, identificando pontos de cruzamento comuns de z-score, sua média e média da média.
Para melhorar o desempenho, os traders podem usar períodos diferentes para as bandas junto com outros períodos para as médias móveis.
Veronique Valcu é graduada na Escola Americana de Paris, França, com interesse nos mercados financeiros.
REFERÊNCIAS.
Elder, Alexander [1993]. Negociando para viver, John Wiley & Sons.
Evens, Stuart P. [1999]. "Bollinger Bands", Análise Técnica de STOCKS & COMMODITIES, Volume 17: Março.
Murphy, John J [1999]. Análise Técnica de Mercados Financeiros, New York Institute of Finance.
software de animação, Glossário de Termos Estatísticos da Internet.
thinkquest, ThinkQuest: Biblioteca de Desafios da Internet.
TC2000 (dados), MetaStock (Equis International)
BARRA LATERAL: CÁLCULO DE Z-SCORE.
A fórmula Z-pontuação aplicada aos preços de fechamento é.
Neste exemplo, n = 20 dias, mas outros períodos podem ser usados.
Aqui está o cálculo escrito para uma planilha do Excel, onde n = 20 períodos (barras diárias). Os preços de fechamento são mostrados na coluna B do Nasdaq Composite entre 1º de julho e 30 de agosto de 2002.
Na célula C21, calcule a média móvel simples para os primeiros 20 preços de fechamento:
Na célula D21, o uso da função Excel STDEVP (desvio padrão) define o desvio padrão dos preços de fechamento para os primeiros 20 dias:
Na célula E21, insira a fórmula Z-Score como:
Copie as fórmulas em C21, D21 e E21 até a parte inferior da última linha das colunas. Os resultados finais do escore Z aparecem na coluna E. Os valores nessa coluna podem ser plotados facilmente para visualizar o indicador do escore-Z.
Você pode baixar a planilha aqui.
Para criar o mesmo indicador usando o MetaStock 6.52, selecione Construtor de indicadores em Ferramentas, selecione & quot; Novo & quot; atribuir & quot; Z - score & quot; como Nome e digite o seguinte código:
a: = (C-Mov (C, Períodos, S)) / Stdev (C, Períodos);
Pressione OK para salvar este código. Agora você está pronto para aplicar esse indicador a qualquer gráfico selecionado. V. V.
Artigos atuais e passados do Working Money, The Investors 'Magazine, podem ser encontrados no Working-Money.
Direitos autorais & copy; 1982 & ndash; 2018 Technical Analysis, Inc. Todos os direitos reservados. Leia nosso aviso de isenção de responsabilidade & amp; declaração de privacidade.
Sistema de negociação de pontuação Z
Através do tempo e tradables.
Tendências de Negociação com o Teste B de Bandas de Bollinger.
Faixas de desvio padrão são úteis para determinar tendências. Aqui, o autor desenvolve um sistema de negociação baseado nessa ideia que gera altos retornos com baixo risco controlado.
O conjunto de técnicas de negociação que apresentarei aqui usa bandas de desvio padrão para determinar tendências e ajudar a desenvolver um sistema de negociação que produz retornos altos com risco baixo e controlado. O nome desse sistema de negociação, BBZ, é um acrônimo derivado de "Bollinger Bands" e o "z-score", baseado em um artigo da Working Money publicado em outubro de 2002 por Veronique Valcu. No "Z-Score Indicator", o Valcu relacionou as pontuações z a Bollinger Bands. Intrigado com o artigo e continuar com essa discussão, eu queria dar uma olhada mais de perto nessa relação e apresentar o teste z de Bollinger Bands (BBZ).
O escore z (Z) mede a diferença (direção) entre o preço de fechamento (C) da média (média móvel do período n) dado o (s) desvio (s) padrão do período n. Assim, a fórmula se torna:
Valores positivos ou negativos mostram que o preço de fecho (C) está acima (C> e micro;) ou abaixo (C & lt; & micro;) da média, respectivamente.
As propriedades que interessam os comerciantes são de retorno e risco. Em finanças, a média representa o retorno esperado e o desvio padrão representa o risco esperado. Nas estatísticas, podemos definir o intervalo de negociação como os preços que são observados dentro da faixa de desvio padrão esperada (1). Nós definimos a negociação de tendência como os preços que são observados acima de +1 de banda de desvio padrão (para tendências de alta) e abaixo de -1 de banda de desvio padrão (para tendências de baixa).
Este artigo mostrará como projetar e desenvolver este sistema de negociação. Ele descreve a pesquisa, por que o indicador z-score é usado, os testes e os resultados.
PROJETANDO O SISTEMA.
Etapa 1: análise de dados.
Realize uma análise de dados na série de preços. A ferramenta estatística mais básica é a média e o desvio padrão dos retornos. Isso lhe dará uma idéia da tendência predominante; uma média positiva para a maioria dos dias mostra uma tendência de alta, e uma média negativa para a maioria dos dias mostra uma tendência de baixa. Você também pode determinar a volatilidade dos retornos.
. Continua na edição de março da Análise Técnica de STOCKS & amp; COMMODITIES.
Extraído de um artigo publicado originalmente na edição de março de 2006 da Technical Analysis of STOCKS & amp; Revista COMMODITIES. Todos os direitos reservados. &cópia de; Copyright 2006, Análise Técnica, Inc.
Z-Score.
O que é um 'Z-Score'
Um escore Z é uma medida numérica da relação de um valor com a média em um grupo de valores. Se uma pontuação Z for 0, ela representa a pontuação como idêntica à pontuação média.
Os escores Z também podem ser positivos ou negativos, com um valor positivo indicando que a pontuação está acima da média e uma pontuação negativa indicando que está abaixo da média. As pontuações positivas e negativas também revelam o número de desvios padrão em que a pontuação está acima ou abaixo da média.
QUEBRANDO 'Z-Score'
As pontuações Z revelam aos estatísticos e traders se uma pontuação é típica de um conjunto de dados especificado ou se é atípica. Além disso, os escores Z também permitem que os analistas adaptem as pontuações de vários conjuntos de dados para obter pontuações que possam ser comparadas com precisão. O teste de usabilidade é um exemplo de uma aplicação real de pontuações Z.
O escore Z é mais comumente conhecido como o Altman Z-score. Edward Altman, professor da Universidade de Nova York, desenvolveu e introduziu a fórmula Z-score no final dos anos 1960 como uma solução para o processo demorado e um tanto confuso que os investidores precisavam submeter para determinar o grau de falência de uma empresa. Na realidade, a fórmula Z-score desenvolvida por Altman acabou fornecendo aos investidores uma idéia da saúde financeira geral de uma empresa.
A fórmula do Altman Z-Score.
O Altman Z-score é a saída de um teste de força de crédito que ajuda a avaliar a probabilidade de falência de uma empresa de manufatura de capital aberto. A pontuação Z é baseada em cinco principais índices financeiros que podem ser encontrados e calculados a partir do relatório anual 10-K de uma empresa. O cálculo usado para determinar a pontuação Z Altman é o seguinte:
Pontuação Z = 1.2A + 1.4B + 3.3C + 0.6D + 1.0E.
Nesta equação:
A = Capital de giro / total de ativos.
B = Lucros retidos / total de ativos.
C = Lucro antes de juros e impostos (EBIT) / ativo total.
D = Valor de mercado do patrimônio líquido / valor contábil do passivo total.
E = vendas / total de ativos.
Normalmente, uma pontuação abaixo de 1,8 indica que uma empresa provavelmente está sob o peso da falência. Por outro lado, as empresas com pontuação acima de 3 são menos propensas à falência.
Deficiências do Z-Score.
Infelizmente, o escore Z não é perfeito e precisa ser calculado e interpretado com cuidado. Para começar, o Z-score não é imune a práticas contábeis falsas. Como as empresas com problemas podem ser tentadas a deturpar as finanças, o escore Z é tão preciso quanto os dados que entram nele.
A pontuação Z também não é muito útil para novas empresas com pouco ou nenhum lucro. Essas empresas, independentemente de sua saúde financeira, terão uma pontuação baixa. Além disso, o escore Z não aborda diretamente a emissão de fluxos de caixa, apenas insinuando-o através do uso do índice líquido de capital de giro em ativos. Afinal, é preciso dinheiro para pagar as contas.
Por fim, as pontuações Z podem variar de trimestre para trimestre, quando uma empresa registra baixas de uma só vez. Estes podem alterar a pontuação final, sugerindo que uma empresa que não está realmente em risco está à beira da falência.
Infelizmente, o escore Z não é perfeito e precisa ser calculado e interpretado com cuidado. Para começar, o Z-score não é imune a práticas contábeis falsas. Como a WorldCom demonstra, empresas com problemas podem ser tentadas a deturpar as finanças. O escore Z é tão preciso quanto os dados que entram nele.
A pontuação Z também não é muito útil para novas empresas com pouco ou nenhum lucro. Essas empresas, independentemente de sua saúde financeira, terão uma pontuação baixa. Além disso, o escore Z não aborda diretamente a emissão de fluxos de caixa, apenas insinuando-o através do uso do índice líquido de capital de giro em ativos. Afinal, é preciso dinheiro para pagar as contas.
Por fim, as pontuações Z podem variar de trimestre para trimestre, quando uma empresa registra baixas de uma só vez. Estes podem alterar a pontuação final, sugerindo que uma empresa que não está realmente em risco está à beira da falência.
Altman Z-Score Plus.
A Altman desenvolveu e lançou o Altman Z-Score Plus em 2012. Essa fórmula é usada para avaliar empresas públicas e privadas e pode ser usada tanto para empresas que não são manufatureiras quanto para empresas de manufatura. O Z-Score Plus é adequado para empresas nos Estados Unidos, bem como para empresas não americanas, incluindo aquelas em economias emergentes, como a China.
Sistema de negociação de pontuação Z
Obter via App Store Leia este post em nosso aplicativo!
Cálculo do Z-Score para uma sequência de ganhos e perdas.
Estou tentando encontrar a correlação entre ganhos e perdas aplicando o Z-Score de acordo com a fórmula anexada abaixo. Eu os coloco em uma matriz atribuindo 1 a wins e -1s a perdedores. Eu estou tentando determinar se os vencedores seguem os vencedores ou os perdedores seguem os perdedores. O que eu quero perguntar é antes de aplicar Z-Score para isso devo remover non-streaks desta matriz? (Quando eu incluo non-streaks eu encontro o Z-Score -125 que não é um número lógico)
A fórmula do z-score é.
Sua fonte não é particularmente clara sobre por que o que eles estão fazendo é uma pontuação Z. Para dar algum contexto, o que eles estão fazendo é calcular $$ \ frac>> $$, onde R é o número de execuções e a média e o desvio padrão são do número de execuções. É realmente mais uma estatística de teste do que um Z-score em si. O denominador em sua fórmula é, na verdade, o mesmo desvio padrão usado no teste de corrida de Wald-Wolfowitz, mas dividido por $ N $ (que se anula a partir da média). Embora eu tenha um resultado ligeiramente diferente se eu calcular o escore Z usando apenas os valores de Wald-Wolfowitz para a média das corridas, é conceitualmente a mesma coisa.
Então, de volta à sua pergunta, você está perguntando se deve remover os riscos da sua matriz antes de calcular o valor. Gostaria de enfatizar que você não deveria. O ponto do teste de execuções é testar o número de execuções. Se você remover tudo o que não é uma execução, sua estatística de teste não será mais válida. Se você não está recebendo números sensíveis, pode haver um problema com o cálculo em algum lugar. Eu estava recebendo números perfeitamente sensatos quando estava testando isso.
O benefício da abordagem original é que é muito fácil calcular. Existem outras opções que podem ser um pouco mais sofisticadas e fornecer informações interessantes. Por exemplo, você poderia encaixar um Hidden Markov Model (HMM) que tenta estimar a probabilidade de uma vitória se o período anterior foi uma vitória ou não.
Matemática na Negociação: Como Estimar os Resultados do Comércio.
Introdução: A matemática é a rainha das ciências.
Um certo nível de background matemático é requerido para qualquer trader, e esta declaração não precisa de provas. A questão é apenas: Como podemos definir esse nível mínimo exigido? No crescimento de sua experiência de trading, o trader freqüentemente amplia sua visão "single-handed", lendo posts em fóruns ou vários livros. Alguns livros requerem um nível mais baixo de conhecimento matemático dos leitores, outros, ao contrário, inspiram a pessoa a estudar ou retocar o conhecimento em um campo de ciências puras ou outro. Vamos tentar dar algumas estimativas e suas interpretações neste artigo único.
De dois males Escolha o menos.
Há mais matemáticos no mundo do que os comerciantes bem sucedidos. Este fato é freqüentemente usado como argumento por aqueles que se opõem a cálculos ou métodos complexos na negociação. Podemos dizer que a negociação não é apenas a capacidade de desenvolver regras de negociação (habilidades de análise), mas também a capacidade de observar essas regras (disciplina). Além disso, uma teoria que descreveria exatamente os preços nos mercados financeiros ainda não foi criada até agora (acho que nunca será criada). A criação da teoria (descoberta da natureza matemática) dos próprios mercados financeiros significaria a morte desses mercados, que é um paradoxo indecidível, em termos de filosofia. No entanto, se nos depararmos com a questão de ir ao mercado com uma descrição matemática não muito satisfatória do mercado ou sem nenhuma descrição, escolhemos o mal mínimo: Escolhemos métodos de estimação de sistemas de negociação.
O que é anormalidade da distribuição normal?
Uma das noções básicas da teoria da probabilidade é a noção de distribuição normal (gaussiana). Por que é assim chamado? Muitos processos naturais acabaram sendo distribuídos normalmente. Para ser mais exato, os processos mais naturais, no limite, reduzem-se à distribuição normal. Vamos considerar um exemplo simples. Suponha que tenhamos uma distribuição uniforme no intervalo de 0 a 100. Distribuição uniforme significa que a probabilidade de cair qualquer valor no intervalo e probabilidade de que 3. 14 (Pi) cairá é a mesma que a da queda 77 (meu número favorito com dois setes). Computadores modernos ajudam a gerar uma boa seqüência de números pseudo-aleatórios.
Como podemos obter uma distribuição normal desta distribuição uniforme? Acontece que, se tomarmos cada vez vários números aleatórios (por exemplo, 5 números) de uma distribuição única e encontrarmos o valor médio desses números (isso é chamado de 'tirar uma amostra') e se a quantidade de tais amostras é ótimo, a distribuição recém-obtida tenderá ao normal. O teorema do limite central diz que isso se relaciona não apenas a amostras tiradas de distribuições únicas, mas também a uma classe muito grande de outras distribuições. Como as propriedades de distribuição normal foram estudadas muito bem, será muito mais fácil analisar os processos se eles forem representados como um processo com distribuição normal. No entanto, ver é acreditar, então podemos ver a confirmação desse teorema do limite central usando um simples indicador MQL4.
Vamos lançar este indicador em qualquer gráfico com diferentes valores de N (quantidade de amostras) e ver que a distribuição de freqüência empírica se torna mais suave e suave.
Figura 1. Indicador que cria uma distribuição normal de um uniforme.
Aqui, N significa quantas vezes tiramos a média de pilha = 5 números uniformemente distribuídos no intervalo de 0 a 100. Obtivemos quatro gráficos, muito semelhantes em aparência. Se os normalizarmos de alguma forma no limite (adjunto a uma única escala), obteremos várias realizações da distribuição normal padrão. A única mosca nesse unguento é que os preços nos mercados financeiros (para ser mais exato, incrementos de preço e outros derivativos desses incrementos), em geral, não se encaixam na distribuição normal. A probabilidade de um evento bastante raro (por exemplo, de preço decrescente de 50%) nos mercados financeiros é, embora baixa, mas ainda consideravelmente maior do que na distribuição normal. É por isso que devemos nos lembrar disso ao estimar riscos com base na distribuição normal.
Quantidade transforma-se em qualidade.
Até mesmo este exemplo simples de modelagem de distribuição normal mostra que a quantidade de dados a serem processados conta muito. Quanto mais dados iniciais houver, mais preciso e válido será o resultado. O menor número da amostra é considerado como tendo que exceder 30. Isso significa que, se quisermos estimar os resultados das negociações (por exemplo, um Expert Advisor no Testador), a quantidade de negociações abaixo de 30 é insuficiente para tornar estatisticamente confiável conclusões sobre alguns parâmetros do sistema. Quanto mais negociações analisamos, menor a probabilidade de que esses negócios sejam apenas elementos felizes de um sistema de negociação pouco confiável. Assim, o lucro final em uma série de 150 negociações oferece mais motivos para colocar o sistema em serviço do que um sistema estimado em apenas 15 negociações.
Expectativa Matemática e Dispersão como Estimativa de Risco.
As duas características mais importantes de uma distribuição são a expectativa matemática (média) e a dispersão. A distribuição normal padrão tem uma expectativa matemática igual a zero. Nesse ponto, o centro de distribuição também está localizado em zero. A planicidade ou declividade da distribuição normal é caracterizada pela medida de propagação de um valor aleatório dentro da área de expectativa matemática. É a dispersão que nos mostra como os valores estão espalhados sobre a expectativa matemática do valor aleatório.
Expectativa matemática pode ser encontrada de uma forma muito simples: Para conjuntos contáveis, todos os valores de distribuição são somados, sendo a soma obtida dividida pela quantidade de valores. Por exemplo, um conjunto de números naturais é infinito, mas contável, uma vez que cada valor pode ser comparado com seu índice (número de pedido). Para conjuntos incontáveis, a integração será aplicada. Para estimar a expectativa matemática de uma série de negociações, resumiremos todos os resultados comerciais e dividiremos o montante obtido pela quantidade de negociações. O valor obtido mostrará o resultado médio esperado de cada negociação. Se a expectativa matemática é positiva, nós lucramos em média. Se for negativo, perdemos em média.
Figura 2. Gráfico de densidade de probabilidade da distribuição normal.
A medida de propagação da distribuição é a soma dos desvios quadrados do valor aleatório de sua expectativa matemática. Essa característica da distribuição é chamada de dispersão. Normalmente, a expectativa matemática para um valor distribuído aleatoriamente é denominada M (X). Então a dispersão pode ser descrita como D (X) = M ((X-M (X)) ^ 2). A raiz quadrada da dispersão é denominada desvio padrão. Também é definido como sigma (σ). É uma distribuição normal com expectativa matemática igual a zero e desvio padrão igual a 1 que é chamado de distribuição normal, ou gaussiana.
Quanto maior o valor do desvio padrão, mais variável é o capital comercial, maior é o risco. Se a expectativa matemática for positiva (uma estratégia lucrativa) e igual a $ 100 e se o desvio padrão for igual a $ 500, arriscamos uma quantia, que é várias vezes maior, para ganhar cada dólar. Por exemplo, temos os resultados de 30 negociações:
Para encontrar a expectativa matemática para essa sequência de negociações, vamos somar todos os resultados e dividir isso por 30. Obteremos o valor médio M (X) igual a $ 4,26. Para encontrar o desvio padrão, subtraia a média do resultado de cada negócio, faça um quadrado e encontre a soma dos quadrados. O valor obtido será dividido por 29 (a quantidade de negociações menos um). Assim, obteremos a dispersão D igual a 9 353.623. Tendo gerado a raiz quadrada da dispersão, obtém-se o desvio padrão, sigma, igual a $ 96,71.
Os dados do cheque são dados na tabela abaixo:
(Quadrado da diferença)
O que obtivemos é a expectativa matemática igual a US $ 4,26 e o desvio padrão de US $ 96,71. Não é a melhor relação entre o risco e o comércio médio. Gráfico de lucro abaixo confirma isso:
Fig.3. Gráfico de saldo para negociações realizadas.
Eu troco aleatoriamente? Z-Score.
A suposição em si de que o lucro obtido como resultado de uma série de operações é aleatória soa ironicamente para a maioria dos traders. Tendo gasto muito tempo à procura de um sistema comercial bem sucedido e observado que o sistema encontrado já resultou em alguns lucros reais em um período de tempo bastante limitado, o trader supõe ter encontrado uma abordagem adequada ao mercado. Como ele pode assumir que tudo isso foi apenas uma aleatoriedade? Isso é um pouco grosso demais, especialmente para iniciantes. No entanto, é essencial estimar os resultados objetivamente. Neste caso, a distribuição normal, novamente, vem para o resgate.
Não sabemos qual será o resultado de cada negócio. Só podemos dizer que ou ganhamos lucro (+) ou enfrentamos perdas (-). Lucros e perdas alternam de maneiras diferentes para diferentes sistemas de negociação. Por exemplo, se o lucro esperado for 5 vezes menor do que a perda esperada no acionamento do Stop Loss, seria razoável presumir que as negociações lucrativas (+ negociações) prevalecerão significativamente sobre as perdas (negociações). O Z - Score permite estimar com que frequência as negociações lucrativas são alternadas com as perdidas.
Z para um sistema de negociação é calculado pela seguinte fórmula:
N - quantidade total de negociações em uma série;
R - quantidade total de séries de negociações lucrativas e perdedoras;
W - quantidade total de negociações lucrativas na série;
L - quantidade total de negociações perdedoras na série.
Uma série é uma sequência de sinais positivos, seguidos uns dos outros (por exemplo, +++) ou minuses seguidos uns dos outros (por exemplo, -). R conta a quantidade de tais séries.
Fig.4. Comparação de duas séries de lucros e perdas.
Na Fig. 4, uma parte da sequência de lucros e perdas do Expert Advisor que ocupou o primeiro lugar no Campeonato de Negociação Automática 2006 é mostrada em azul. Z-score da sua conta de competição tem o valor de -3,85, a probabilidade de 99,74% é dada entre parênteses. Isso significa que, com uma probabilidade de 99,74%, os negócios nessa conta tiveram uma dependência positiva entre eles (o escore Z é negativo): um lucro foi seguido por um lucro, uma perda foi seguida por uma perda. É este o caso? Aqueles que estavam assistindo ao campeonato provavelmente se lembrariam que Roman Rich colocou sua versão do Expert Advisor MACD que freqüentemente abriu três negociações rodando na mesma direção.
Uma seqüência típica de valores positivos e negativos do valor aleatório na distribuição normal é mostrada em vermelho. Podemos ver que essas seqüências são diferentes. No entanto, como podemos medir essa diferença? Z-score responde a esta pergunta: Sua sequência de lucros e perdas contém mais ou menos tiras (lucrativas ou séries perdedoras) do que você pode esperar por uma sequência realmente aleatória sem qualquer dependência entre negociações? Se o escore Z for próximo de zero, não podemos dizer que a distribuição de negociações seja diferente da distribuição normal. Z-score de uma seqüência de negociação pode nos informar sobre a possível dependência entre negociações consecutivas.
Nisso, os valores de Z são interpretados da mesma forma que a probabilidade de desvio de zero de um valor aleatório distribuído de acordo com a distribuição normal padrão (média = 0, sigma = 1). Se a probabilidade de cair um valor aleatório normalmente distribuído dentro do intervalo de ± 3σ é 99,74%, a queda desse valor fora desse intervalo com a mesma probabilidade de 99,74% nos informa que esse valor aleatório não pertence a essa distribuição normal dada . É por isso que a "regra 3-sigma" é lida da seguinte maneira: um valor aleatório normal se desvia de sua média por não mais de 3-sigma de distância.
O sinal de Z nos informa sobre o tipo de dependência. Além disso, significa que é muito provável que o comércio lucrativo seja seguido por um perdedor. Menos diz que o lucro será seguido por um lucro, uma perda será seguida por uma perda novamente. Uma pequena tabela abaixo ilustra o tipo e a probabilidade de dependência entre as negociações em comparação com a distribuição normal.
Uma dependência positiva entre negociações significa que um lucro causará um novo lucro, enquanto uma perda causará uma nova perda. Uma dependência negativa significa que um lucro será seguido por uma perda, enquanto a perda será seguida por um lucro. A dependência encontrada nos permite regular os tamanhos das posições a serem abertas (idealmente) ou até mesmo pular algumas delas e abri-las apenas virtualmente, a fim de observar sequências comerciais.
Rendimentos de períodos de espera (HPR)
Em seu livro, The Mathematics of Money Management, Ralph Vince usa a noção de HPR (holding period returns). Uma negociação resultou em lucro de 10% tem o HPR = 1 + 0,10 = 1,10. Um trade resultou em uma perda de 10% com o HPR = 1-0. 10 = 0,90. Você também pode obter o valor de HPR para uma negociação, dividindo o valor do saldo após o fechamento da negociação (BalanceClose) pelo valor do saldo na abertura da negociação (BalanceOpen). HPR = BalanceClose / BalanceOpen. Assim, todo comércio tem tanto um resultado em termos monetários quanto um resultado expresso em HPR. Isso nos permitirá comparar sistemas independentemente do tamanho dos contratos negociados. Um dos índices utilizados em tal comparação é a média aritmética, AHPR (retornos médios do período de retenção).
Para encontrar o AHPR, devemos somar todos os HPRs e dividir o resultado pela quantidade de negociações. Vamos considerar esses cálculos usando o exemplo acima de 30 negociações. Suponha que começamos a negociar com $ 500 na conta. Vamos fazer uma nova tabela:
AHPR será encontrado como a média aritmética. É igual a 1,0217. Em outras palavras, nós ganhamos medianamente (1,0217-1) * 100% = 2,17% em cada negociação. É este o caso? Se multiplicarmos 2,17 por 30, veremos que a receita deve chegar a 65,1%. Vamos multiplicar o valor inicial de $ 500 por 65,1% e obter $ 325,50. Ao mesmo tempo, o lucro real torna (627,71-500) /500 * 100% = 25,54%. Assim, a média aritmética de HPR nem sempre nos permite estimar um sistema adequadamente.
Junto com a média aritmética, Ralph Vince introduz a noção de média geométrica que chamaremos de GHPR (retornos de período de retenção geométrica), que é praticamente sempre menor que a AHPR. A média geométrica é o fator de crescimento por jogo e é encontrada pela seguinte fórmula:
N - quantidade de negociações;
BalanceOpen - estado inicial da conta;
BalanceClose - estado final da conta.
O sistema com o maior GHPR terá os maiores lucros se negociarmos com base no reinvestimento. O GHPR abaixo de um significa que o sistema perderá dinheiro se negociarmos com base no reinvestimento. Uma boa ilustração da diferença entre o AHPR e o GHPR pode ser o histórico da conta do sashken. Ele foi o líder do campeonato por um longo tempo. AHPR = 9,98% impressiona, mas o GHPR final = -27,68% coloca tudo em perspectiva.
Relação de Sharpe.
A eficiência dos investimentos é frequentemente estimada em termos de dispersão de lucros. Um desses índices é o índice de Sharpe. Este índice mostra como a AHPR diminuiu pela taxa livre de risco (RFR) relacionada ao desvio padrão (SD) da sequência HPR. O valor do RFR é geralmente considerado igual à taxa de juros em depósito no banco ou taxa de juros sobre obrigações do tesouro. No nosso exemplo, AHPR = 1,0217, SD (HPR) = 0,17607, RFR = 0.
AHPR - retornos médios do período de detenção;
RFR - taxa livre de risco;
SD - desvio padrão.
Proporção de Sharpe = (1,0217- (1 + 0)) / 0,17607 = 0,0217 / 0,17607 = 0,1232. Para distribuição normal, mais de 99% dos valores aleatórios estão dentro da faixa de ± 3σ (sigma = SD) sobre o valor médio M (X). Daqui resulta que o valor de Sharpe Ratio superior a 3 é muito bom. Na Figura 5 abaixo, podemos ver que, se os resultados de negociação são distribuídos normalmente e Índice de Sharpe = 3, a probabilidade de perda é inferior a 1% por negociação, de acordo com a regra 3-sigma.
Fig.5. Distribuição normal dos resultados comerciais com a probabilidade de perda inferior a 1%.
A conta do participante RobinHood confirma isso: sua EA fez 26 negociações no Automated Trading Championship 2006 sem perder nenhuma delas. Relação de Sharpe = 3,07!
Regressão Linear (LR) e Coeficiente de Correlação Linear (CLC)
Há também outra maneira de estimar a estabilidade dos resultados comerciais. Sharpe Ratio nos permite estimar o risco do capital está sendo executado, mas também podemos tentar estimar o grau de suavidade da curva de equilíbrio. Se impusermos os valores de saldo no fechamento de cada negociação, poderemos traçar uma linha quebrada. Esses pontos podem ser ajustados com uma certa linha reta que nos mostrará a direção média das mudanças de capital. Vamos considerar um exemplo dessa oportunidade usando o gráfico de equilíbrio do Expert Advisor Phoenix_4 desenvolvido por Hendrick.
Fig. 6. Gráfico de balanço de Hendrick, o participante do campeonato de negociação automatizado de 2006.
Temos que encontrar os coeficientes aeb de que esta linha vai o mais próximo possível dos pontos que estão sendo ajustados. No nosso caso, x é o número comercial, y é o valor do saldo no fechamento do negócio.
Os coeficientes de uma reta aproximada são geralmente encontrados pelo método dos mínimos quadrados (método dos mínimos quadrados). Suponha que tenhamos isso direto com os coeficientes conhecidos a e b. Para cada x, temos dois valores: y (x) = a * x + be balanço (x). O desvio do equilíbrio (x) de y (x) será denotado como d (x) = y (x) - balanço (x). O SSD (soma dos desvios quadrados) pode ser calculado como SD = Summ. Encontrar o método straight by LS significa procurar por aeb que o SD é mínimo. Essa reta também é chamada de regressão linear (LR) para a sequência dada.
Fig. 7. Desvio do valor do balanço da reta de y = ax + b.
Tendo obtido coeficientes da reta de y = a * x + b usando o método LS, podemos estimar o desvio do valor do balanço a partir da reta encontrada em termos monetários. Se calcularmos a média aritmética da sequência d (x), estaremos certos de que М (d (x)) está próximo de zero (para ser mais exato, é igual a zero para algum grau de precisão de cálculo). Ao mesmo tempo, o SSD de SD não é igual a zero e tem um certo valor limitado. A raiz quadrada de SD / (N-2) mostra a distribuição de valores no gráfico Balanço sobre a linha reta e permite estimar sistemas de negociação com valores idênticos do estado inicial da conta. Nós chamaremos este parâmetro LR Standard Error.
Below are values of this parameter for the first 15 accounts in the Automated Trading Championship 2006:
However, the degree of approximation of the balance graph to a straight can be measured in both money terms and absolute terms. For this, we can use correlation rate. Correlation rate, r, measures the degree of correlation between two sequences of numbers. Its value may lie within the range of -1 to +1. If r=+1, it means that two sequences have identical behavior and the correlation is positive.
Fig. 8. Positive correlation example.
If r=-1, the two sequences change in opposition, the correlation is negative.
Fig. 9. Negative correlation example.
If r=0, it means that there is no dependence found between the sequences. It should be emphasized that r=0 does not mean that there is no correlation between the sequences, it just says that such a correlation has not been found. This must be remembered. In our case, we have to compare two sequences of numbers: одна последовательность из графика баланса, а вторая - соответствующие точки на прямой линейной регрессии.
Fig. 10. Values of balance and points on linear regression.
Below is the table representation of the same data:
Let's denote balance values as X and the sequence of points on the straight regression line as Y. To calculate the coefficient of linear correlation between sequences X and Y, it is necessary to find mean values M(X) and M(Y) first. Then we will create a new sequence T=(X-M(X))*(Y-M(Y)) and calculate its mean value as M(T)=cov(X, Y)=M((X-M(X))*(Y-M(Y))). The found value of cov(X, Y) is named covariance of X and Y and means mathematical expectation of product (X-M(X))*(Y-M(Y)). For our example, covariance value is 21 253 775.08. Please note that M(X) and M(Y) are equal and have the value of 21 382.26 each. It means that the Balance mean value and the average of the fitting straight are equal.
Y - linear regression;
M(X) - Balance mean value;
M(Y) - LR mean value.
The only thing that remains to be done is calculation of Sx and Sy. To calculate Sx, we will find the sum of values of (X-M(X))^2, i. e., find the SSD of X from its mean value. Remember how we calculated dispersion and the algorithm of LS method. As you can see they are all related. The found SSD will be divided by the amount of numbers in the sequence - in our case, 36 (from zero to 35) - and extract the square root of the resulting value. So we have obtained the value of Sx. The value of Sy will be calculated in the same way. In our example, Sx=5839. 098245 and Sy=4610. 181675.
N - amount of trades;
Y - linear regression;
M(X) - Balance mean value;
M(Y) - LR mean value.
Now we can find the value of correlation coefficient as r=21 253 775.08/(5839. 098245*4610. 181675)=0.789536583. This is below one, but far from zero. Thus, we can say that the balance graph correlates with the trend line valued as 0.79. By comparison to other systems, we will gradually learn how to interpret the values of correlation coefficient. At page "Reports" of the Championship, this parameter is named LR correlation. The only difference made to calculate this parameter within the framework of the Championship is that the sign of LR correlation indicates the trade profitability.
The matter is that we could calculate the coefficient of correlation between the balance graph and any straight. For purposes of the Championship, it was calculated for ascending trend line, hence, if LR correlation is above zero, the trading is profitable. If it is below zero, it is losing. Sometimes an interesting effect occurs where the account shoes profit, but LR correlation is negative. This can mean that trading is losing, anyway. An example of such situation can be seen at Aver's. The Total Net Profit makes $2 642, whereas LR сorrelation is -0.11. There is likely no correlation, in this case. It means we just could not judge about the future of the account.
MAE and MFE Will Tell Us Much.
We are often warned: "Cut the losses and let profit grow". Looking at final trade results, we cannot draw any conclusions about whether protective stops (Stop Loss) are available or whether the profit fixation is effective. We only see the position opening date, the closing date and the final result - a profit or a loss. This is like judging about a person by his or her birth and death dates. Without knowing about floating profits during every trade's life and about all positions as a total, we cannot judge about the nature of the trading system. How risky is it? How was the profit reached? Was the paper profit lost? Answers to these questions can be rather well provided by parameters MAE (Maximum Adverse Excursion) and MFE (Maximum Favorable Excursion).
Every open position (until it is closed) continuously experiences profit fluctuations. Every trade reached its maximal profit and its maximal loss during the period between its opening and closing. MFE shows the maximal price movement in a favorable direction. Respectively, MAE shows the maximal price movement in an adverse direction. It would be logical to measure both indexes in points. However, if different currency pairs were traded, we will have to express it in money terms.
Every closed trade corresponds to its result (return) and two indexes - MFE and MAE. If the trade resulted in profit of $100, MAE reaching -$1000, this does not speak for this trade's best. Availability of many trades resulted in profits, but having large negative values of MAE per trade, informs us that the system just "sits out" losing positions. Such trading is fated to failure sooner or later.
Similarly, values of MFE can provide some useful information. If a position was opened in a right direction, MFE per trade reached $3000, but the trade was then closed resulting in the profit of $500, we can say that it would be good to elaborate the system of unfixed profit protection. This may be Trailing Stop that we can move after the price if the latter one moves in a favorable direction. If short profits are systematic, the system can be significantly improved. MFE will tell us about this.
For visual analysis to be more convenient, it would be better to use graphical representation of distribution of values of MAE and MFE. If we impose each trade into a chart, we will see how the result has been obtained. For example, if we have another look into "Reports" of RobinHood who didn't have any losing trades at all, we will see that each trade had a drawdown (MAE) from -$120 to -$2500.
Fig. 11. Trades distribution on the plane of MAExReturns.
Besides, we can draw a straight line to fit the Returns x MAE distribution using the LS method. In Fig. 11, it is shown in red and has a negative slope (the straight values decrease when moving from left to right). Parameter Correlation(Profits, MAE)=-0.59 allows us to estimate how close to the straight the points are distributed in the chart. Negative value shows negative slope of the fitting line.
If you look through other Participants' accounts, you will see that correlation coefficient is usually positive. In the above example, the descending slope of the line says us that it tends to get more and more drawdowns in order not to allow losing trades. Now we can understand what price has been paid for the ideal value of parameter LR Correlation=1!
Similarly, we can build a graph of distribution of Returns and MFE, as well as find the values of Correlation(Profits, MFE) = 0.77 and Correlation(MFE, MAE) = -0.59. Correlation(Profits, MFE) is positive and tends to one (0.77). This informs us that the strategy tries not to allow long "sittings out" floating profits. It is more likely that the profit is not allowed to grow enough and trades are closed by Take Profit. As you can see, distributions of MAE and MFE дgive us a visual estimate and values of Correlation(Profits, MFE) and Correlation(Profits, MAE) can inform us about the nature of trading, even without charts.
Values of Correlation(MFE, MAE), Correlation(NormalizedProfits, MAE) and Correlation(NormalizedProfits, MFE) in the Championship Participants' "Reports" are given as additional information.
Trade Result Normalization.
In development of trading systems, they usually use fixed sizes for positions. This allows easier optimization of system parameters in order to find those more optimal on certain criteria. However, after the inputs have been found, the logical question occurs: What sizing management system (Money Management, MM) should be applied. The size of positions opened relates directly to the amount of money on the account, so it would not be reasonable to trade on the account with $5 000 in the same way as on that with $50 000. Besides, an ММ system can open positions, which are not directly proportional. I mean a position opened on the account with $50 000 should not necessarily be 10 times more than that opened on a $5 000 deposit.
Position sizes may also vary according to the current market phase, to the results of the latest several trades analysis, and so on. So the money-management system applied can essentially change the initial appearance of a trading system. How can we then estimate the impact of the applied money-management system? Was it useful or did it just worsen the negative sides of our trading approach? How can we compare the trade results on several accounts having the same deposit size at the beginning? A possible solution would be normalization of trade results.
TradeProfit - profit per trade in money terms;
TradeLots - position size (lots);
MinimumLots - minimum allowable position size.
Normalization will be realized as follows: We will divide each trade's result (profit or loss) by the position volume and then multiply by the minimum allowable position size. For example, order #4399142 BUY 2.3 lots USDJPY was closed with the profit of $4 056. 20 + $118.51 (swaps) = $4 174.71. This example was taken from the account of GODZILLA (Nikolay Kositsin). Let's divide the result by 2.3 and multiply by 0.1 (the minimum allowable position size), and obtain a profit of $4 056.20/2.3 * 0.1 = $176.36 and swaps = $5.15. these would be results for the order of 0.1-lot size. Let us do the same with results of all trades and we will then obtain Normalized Profits (NP).
the first thing we think about is finding values of Correlation(NormalizedProfits, MAE) and Correlation(NormalizedProfits, MFE) and comparing them to the initial Correlation(Profits, MAE) and Correlation(Profits, MFE). If the difference between parameters is significant, the applied method has likely changed the initial system essentially. They say that applying of ММ can "kill" a profitable system, but it cannot turn a losing system into a profitable one. in the Championship, the account of TMR is a rare exception where changing Correlation(NormalizedProfits, MFE) value from 0.23 to 0.63 allowed the trader to "close in black".
How Can We Estimate the Strategy's Aggression?
We can benefit even more from normalized trades in measuring of how the MM method applied influences the strategy. It is obvious that increasing sizes of positions 10 times will cause that the final result will differ from the initial one 10 times. And what if we change the trade sizes not by a given number of times, but depending on the current developments? Results obtained by trust-managing companies are usually compared to a certain model, usually - to a stock index. Beta Coefficient shows by how many times the account deposit changes as compared to the index. If we take normalized trades as an index, we will be able to know how much more volatile the results became as compared to the initial system (0.1-lot trades).
Thus, first of all, we calculate covariance - cov(Profits, NormalizedProfits). then we calculate the dispersion of normalized trades naming the sequence of normalized trades as NP. For this, we will calculate the mathematical expectation of normalized trades named M(NP). M(NP) shows the average trade result for normalized trades. Then we will find the SSD of normalized trades from M(NP), i. e., we will sum up (NP-M(NP))^2. The obtained result will be then divided by the amount of trades and name D(NP). This is the dispersion of normalized trades. Let's divide covariance between the system under measuring, Profits, and the ideal index, NormalizedProfits cov(Profits, NormalizedProfits), by the index dispersion D(NP). The result will be the parameter value that will allow us to estimate by how many times more volatile the capital is than the results of original trades (trades in the Championship) as compared to normalized trades. This parameter is named Money Compounding in the "Reports". It shows the trading aggression level to some extent.
Profits - trade results;
NP - normalized trade results;
M(NP) - mean value of normalized trades.
Now we can revise the way we read the table of Participants of the Automated Trading Championship 2006:
The LR Standard error in Winners' accounts was not the smallest. At the same time, the balance graphs of the most profitable Expert Advisors were rather smooth since the LR Correlation values are not far from 1.0. The Sharpe Ratio lied basically within the range of 0.20 to 0.40. The only EA with extremal Sharpe Ratio=3.07 turned not to have very good values of MAE and MFE.
The GHPR per trade is basically located within the range from 1.5 to 3%. At that, the Winners did not have the largest values of GHPR, though not the smallest ones. Extreme value GHPR=12.77% says us again that there was an abnormality in trading, and we can see that this account experienced the largest fluctuations with LR Standard error=$9 208.08.
Z-score does not give us any generalizations about the first 15 Championship Participants, but values of |Z|>2.0 may draw our attention to the trading history in order to understand the nature of dependence between trades on the account. Thus, we know that Z=-3.85 for Rich's account was practically reached due to simultaneous opening of three positions. And how are things with ldamiani's account?
Finally, the last column in the above table, Money Compounding, also has a large range of values from 8 to 50, 50 being the maximal value for this Championship since the maximal allowable trade size made 5.0 lots, which is 50 times more than the minimal size of 0.1 lot. However, curiously enough, this parameter is not the largest at Winners. The Top Three's values are 17.27, 28.79 and 16.54. Did not the Winners fully used the maximal allowable position size? Yes, they did. the matter is, perhaps, that the MM methods did not considerably influence trading risks at general increasing of contract sizes. This is a visible evidence of that money management is very important for a trading system.
The 15th place was taken by payday. The EA of this Participant could not open trades with the size of more than 1. 0 lot due to a small error in the code. What if this error did not occur and position sizes were in creased 5 times, up to 5.0 lots? Would then the profit increase proportionally, from $4 588.90 to $22 944.50? Would the Participant then take the second place or would he experience an irrecoverable DrawDown due to increased risks? Would alexgomel be on the first place? His EA traded with only 1.0-лот trades, too. Or could vgc win, whose Expert Advisor most frequently opened trades of the size of less than 1.0 lot. All three have a good smooth balance graph. As you can see, the Championship's plot continues whereas it was over!
Conclusion: Don't Throw the Baby Out with the Bathwater.
Opinions differ. This article gives some very general approaches to estimation of trading strategies. One can create many more criteria to estimate trade results. Each characteristic taken separately will not provide a full and objective estimate, but taken together they may help us to avoid lopsided approach in this matter.
We can say that we can subject to a "cross-examination" any positive result (a profit gained on a sufficient sequence of trades) in order to detect negative points in trading. This means that all these characteristics do not so much characterize the efficiency of the given trading strategy as inform us about weak points in trading we should pay attention at, without being satisfied with just a positive final result - the net profit gained on the account.
Well, we cannot create an ideal trading system, every system has its benefits and implications. Estimation test is used in order not to reject a trading approach dogmatically, but to know how to perform further development of trading systems and Expert Advisors. In this regard, statistical data accumulated during the Automated Trading Championship 2006 would be a great support for every trader.
Traduzido do russo por MetaQuotes Software Corp.
The Contrarian Z-Score and Why You Should Always Strive to Reject Trading Systems.
When I first read about the z-score system some years ago I knew it was a fluke. Descriptive statistics cannot be easily converted to edges due to non-stationarity. More importantly, a quant should be always suspicious and strive to reject systems. This is the only way to survive in a market where edges are rare and hard to find.
If you are a technical trader one of your main goals should be disproving apparent edges, not trying to prove them. When you always strive to prove that ideas are good, you risk at the end of getting fooled by randomness. Instead, your goal should be trying to disprove ideas, constantly and relentlessly. In this way you risk rejecting a few good ideas but you reduce the risk of getting fooled by randomness. Which do you prefer? Getting fooled by randomness or missing an edge or two?
Mike at The Whole Street is doing an excellent job aggregating information that is useful to quant traders. I look at his RSS feed daily for interesting articles and links. The other day he posted a link to work involving the z-score contrarian system. That brought back memories of endless backtesting using descriptive statistics many years ago and reaching finally the conclusion that there can be no robust edges based on them due to the non-stationarity of the mean, standard deviation but also of higher moments. I also remembered how I reached the decision that the contrarian z-score was not only a fluke but also a dangerous system to trade.
Based on the details offered in the reference given at the end of this article, back in 2010 I coded the z-score system, I backtested it on SPY data and found out that my results agreed with those in the reference. Then, I just backtested the system not on the portfolio suggested but in GLD, an ETF that was hot at that time due to the strong uptrend in gold. To my surprise or not, the backtest results in GLD with data from inception on 11/08/2004 to 11/30/2010 revealed a disastrous system with a compound annual return of -10.3% and a falling equity line, as shown on the chart below:
The blue line is the buy and hold equity for a $10,000 starting value. In the backtest, position size was calculated based on a constant value of $10,000 and no commission and slippage were included, which would make things worse of course.
That was enough for me. If the z-score system could no profit from a market where even uninformed and random traders could make money via buying and holding for a few days, then it was a bad one. To the credit of the technical analyst in the reference below, it was acknowledged that the system had certain issues. I agree with the analysis and with the comments, which I find good. I disagree with what appears to be an attempt to prove that a system is profitable by selecting a portfolio of a few ETFs where it performed well. This is survivorship bias and should not be part of any analysis. Quants should strive to demolish apparent edges. Only then they can survive the noise.
The z-score system could not make a single dollar in a course of six years in a very dynamic market, GLD. I thus rejected it. It paid because those who continued using it in to trade SPY did not do well after 2013, when the statistics changed and the standard deviation decreased, as shown on the chart below:
From 01/02/2013 to 10/17/2014, the net return of SPY before dividend adjustments is about 29.4% but the z-score system generated a return of only 9.6% and thus underperformed the buy and hold by a margin that is wide enough to indicate that the trades were random and the profit generated was by luck alone. This can be shown mathematically but I do not wish to take more of the valuable time of my readers because the main points of this post were made already.
Você pode se inscrever aqui para notificações de novas postagens por e-mail.
Divulgação: sem posições relevantes.
Programa de gráficos: Amibroker.
Assine nossa lista de e-mails e receba atualizações na sua caixa de entrada de e-mail.
Obrigado por se inscrever.
Algo deu errado.
Nós respeitamos sua privacidade.
Categorias.
Aviso de direitos autorais.
© 2011 & # 8211; 2018 Michael Harris. Todos os direitos reservados. Concederemos uma permissão revogável para criar um hiperlink para este blog sujeito a certos Termos e Condições. Qualquer cópia não autorizada, reprodução, distribuição, publicação, exibição, modificação ou transmissão de qualquer parte deste blog é estritamente proibido sem permissão prévia por escrito.
Obter via App Store Leia este post em nosso aplicativo!
Cálculo do Z-Score para uma sequência de ganhos e perdas.
Estou tentando encontrar a correlação entre ganhos e perdas aplicando o Z-Score de acordo com a fórmula anexada abaixo. Eu os coloco em uma matriz atribuindo 1 a wins e -1s a perdedores. Eu estou tentando determinar se os vencedores seguem os vencedores ou os perdedores seguem os perdedores. O que eu quero perguntar é antes de aplicar Z-Score para isso devo remover non-streaks desta matriz? (Quando eu incluo non-streaks eu encontro o Z-Score -125 que não é um número lógico)
A fórmula do z-score é.
Sua fonte não é particularmente clara sobre por que o que eles estão fazendo é uma pontuação Z. Para dar algum contexto, o que eles estão fazendo é calcular $$ \ frac>> $$, onde R é o número de execuções e a média e o desvio padrão são do número de execuções. É realmente mais uma estatística de teste do que um Z-score em si. O denominador em sua fórmula é, na verdade, o mesmo desvio padrão usado no teste de corrida de Wald-Wolfowitz, mas dividido por $ N $ (que se anula a partir da média). Embora eu tenha um resultado ligeiramente diferente se eu calcular o escore Z usando apenas os valores de Wald-Wolfowitz para a média das corridas, é conceitualmente a mesma coisa.
Então, de volta à sua pergunta, você está perguntando se deve remover os riscos da sua matriz antes de calcular o valor. Gostaria de enfatizar que você não deveria. O ponto do teste de execuções é testar o número de execuções. Se você remover tudo o que não é uma execução, sua estatística de teste não será mais válida. Se você não está recebendo números sensíveis, pode haver um problema com o cálculo em algum lugar. Eu estava recebendo números perfeitamente sensatos quando estava testando isso.
O benefício da abordagem original é que é muito fácil calcular. Existem outras opções que podem ser um pouco mais sofisticadas e fornecer informações interessantes. Por exemplo, você poderia encaixar um Hidden Markov Model (HMM) que tenta estimar a probabilidade de uma vitória se o período anterior foi uma vitória ou não.
Matemática na Negociação: Como Estimar os Resultados do Comércio.
Introdução: A matemática é a rainha das ciências.
Um certo nível de background matemático é requerido para qualquer trader, e esta declaração não precisa de provas. A questão é apenas: Como podemos definir esse nível mínimo exigido? No crescimento de sua experiência de trading, o trader freqüentemente amplia sua visão "single-handed", lendo posts em fóruns ou vários livros. Alguns livros requerem um nível mais baixo de conhecimento matemático dos leitores, outros, ao contrário, inspiram a pessoa a estudar ou retocar o conhecimento em um campo de ciências puras ou outro. Vamos tentar dar algumas estimativas e suas interpretações neste artigo único.
De dois males Escolha o menos.
Há mais matemáticos no mundo do que os comerciantes bem sucedidos. Este fato é freqüentemente usado como argumento por aqueles que se opõem a cálculos ou métodos complexos na negociação. Podemos dizer que a negociação não é apenas a capacidade de desenvolver regras de negociação (habilidades de análise), mas também a capacidade de observar essas regras (disciplina). Além disso, uma teoria que descreveria exatamente os preços nos mercados financeiros ainda não foi criada até agora (acho que nunca será criada). A criação da teoria (descoberta da natureza matemática) dos próprios mercados financeiros significaria a morte desses mercados, que é um paradoxo indecidível, em termos de filosofia. No entanto, se nos depararmos com a questão de ir ao mercado com uma descrição matemática não muito satisfatória do mercado ou sem nenhuma descrição, escolhemos o mal mínimo: Escolhemos métodos de estimação de sistemas de negociação.
O que é anormalidade da distribuição normal?
Uma das noções básicas da teoria da probabilidade é a noção de distribuição normal (gaussiana). Por que é assim chamado? Muitos processos naturais acabaram sendo distribuídos normalmente. Para ser mais exato, os processos mais naturais, no limite, reduzem-se à distribuição normal. Vamos considerar um exemplo simples. Suponha que tenhamos uma distribuição uniforme no intervalo de 0 a 100. Distribuição uniforme significa que a probabilidade de cair qualquer valor no intervalo e probabilidade de que 3. 14 (Pi) cairá é a mesma que a da queda 77 (meu número favorito com dois setes). Computadores modernos ajudam a gerar uma boa seqüência de números pseudo-aleatórios.
Como podemos obter uma distribuição normal desta distribuição uniforme? Acontece que, se tomarmos cada vez vários números aleatórios (por exemplo, 5 números) de uma distribuição única e encontrarmos o valor médio desses números (isso é chamado de 'tirar uma amostra') e se a quantidade de tais amostras é ótimo, a distribuição recém-obtida tenderá ao normal. O teorema do limite central diz que isso se relaciona não apenas a amostras tiradas de distribuições únicas, mas também a uma classe muito grande de outras distribuições. Como as propriedades de distribuição normal foram estudadas muito bem, será muito mais fácil analisar os processos se eles forem representados como um processo com distribuição normal. No entanto, ver é acreditar, então podemos ver a confirmação desse teorema do limite central usando um simples indicador MQL4.
Vamos lançar este indicador em qualquer gráfico com diferentes valores de N (quantidade de amostras) e ver que a distribuição de freqüência empírica se torna mais suave e suave.
Figura 1. Indicador que cria uma distribuição normal de um uniforme.
Aqui, N significa quantas vezes tiramos a média de pilha = 5 números uniformemente distribuídos no intervalo de 0 a 100. Obtivemos quatro gráficos, muito semelhantes em aparência. Se os normalizarmos de alguma forma no limite (adjunto a uma única escala), obteremos várias realizações da distribuição normal padrão. A única mosca nesse unguento é que os preços nos mercados financeiros (para ser mais exato, incrementos de preço e outros derivativos desses incrementos), em geral, não se encaixam na distribuição normal. A probabilidade de um evento bastante raro (por exemplo, de preço decrescente de 50%) nos mercados financeiros é, embora baixa, mas ainda consideravelmente maior do que na distribuição normal. É por isso que devemos nos lembrar disso ao estimar riscos com base na distribuição normal.
Quantidade transforma-se em qualidade.
Até mesmo este exemplo simples de modelagem de distribuição normal mostra que a quantidade de dados a serem processados conta muito. Quanto mais dados iniciais houver, mais preciso e válido será o resultado. O menor número da amostra é considerado como tendo que exceder 30. Isso significa que, se quisermos estimar os resultados das negociações (por exemplo, um Expert Advisor no Testador), a quantidade de negociações abaixo de 30 é insuficiente para tornar estatisticamente confiável conclusões sobre alguns parâmetros do sistema. Quanto mais negociações analisamos, menor a probabilidade de que esses negócios sejam apenas elementos felizes de um sistema de negociação pouco confiável. Assim, o lucro final em uma série de 150 negociações oferece mais motivos para colocar o sistema em serviço do que um sistema estimado em apenas 15 negociações.
Expectativa Matemática e Dispersão como Estimativa de Risco.
As duas características mais importantes de uma distribuição são a expectativa matemática (média) e a dispersão. A distribuição normal padrão tem uma expectativa matemática igual a zero. Nesse ponto, o centro de distribuição também está localizado em zero. A planicidade ou declividade da distribuição normal é caracterizada pela medida de propagação de um valor aleatório dentro da área de expectativa matemática. É a dispersão que nos mostra como os valores estão espalhados sobre a expectativa matemática do valor aleatório.
Expectativa matemática pode ser encontrada de uma forma muito simples: Para conjuntos contáveis, todos os valores de distribuição são somados, sendo a soma obtida dividida pela quantidade de valores. Por exemplo, um conjunto de números naturais é infinito, mas contável, uma vez que cada valor pode ser comparado com seu índice (número de pedido). Para conjuntos incontáveis, a integração será aplicada. Para estimar a expectativa matemática de uma série de negociações, resumiremos todos os resultados comerciais e dividiremos o montante obtido pela quantidade de negociações. O valor obtido mostrará o resultado médio esperado de cada negociação. Se a expectativa matemática é positiva, nós lucramos em média. Se for negativo, perdemos em média.
Figura 2. Gráfico de densidade de probabilidade da distribuição normal.
A medida de propagação da distribuição é a soma dos desvios quadrados do valor aleatório de sua expectativa matemática. Essa característica da distribuição é chamada de dispersão. Normalmente, a expectativa matemática para um valor distribuído aleatoriamente é denominada M (X). Então a dispersão pode ser descrita como D (X) = M ((X-M (X)) ^ 2). A raiz quadrada da dispersão é denominada desvio padrão. Também é definido como sigma (σ). É uma distribuição normal com expectativa matemática igual a zero e desvio padrão igual a 1 que é chamado de distribuição normal, ou gaussiana.
Quanto maior o valor do desvio padrão, mais variável é o capital comercial, maior é o risco. Se a expectativa matemática for positiva (uma estratégia lucrativa) e igual a $ 100 e se o desvio padrão for igual a $ 500, arriscamos uma quantia, que é várias vezes maior, para ganhar cada dólar. Por exemplo, temos os resultados de 30 negociações:
Para encontrar a expectativa matemática para essa sequência de negociações, vamos somar todos os resultados e dividir isso por 30. Obteremos o valor médio M (X) igual a $ 4,26. Para encontrar o desvio padrão, subtraia a média do resultado de cada negócio, faça um quadrado e encontre a soma dos quadrados. O valor obtido será dividido por 29 (a quantidade de negociações menos um). Assim, obteremos a dispersão D igual a 9 353.623. Tendo gerado a raiz quadrada da dispersão, obtém-se o desvio padrão, sigma, igual a $ 96,71.
Os dados do cheque são dados na tabela abaixo:
(Quadrado da diferença)
O que obtivemos é a expectativa matemática igual a US $ 4,26 e o desvio padrão de US $ 96,71. Não é a melhor relação entre o risco e o comércio médio. Gráfico de lucro abaixo confirma isso:
Fig.3. Gráfico de saldo para negociações realizadas.
Eu troco aleatoriamente? Z-Score.
A suposição em si de que o lucro obtido como resultado de uma série de operações é aleatória soa ironicamente para a maioria dos traders. Tendo gasto muito tempo à procura de um sistema comercial bem sucedido e observado que o sistema encontrado já resultou em alguns lucros reais em um período de tempo bastante limitado, o trader supõe ter encontrado uma abordagem adequada ao mercado. Como ele pode assumir que tudo isso foi apenas uma aleatoriedade? Isso é um pouco grosso demais, especialmente para iniciantes. No entanto, é essencial estimar os resultados objetivamente. Neste caso, a distribuição normal, novamente, vem para o resgate.
Não sabemos qual será o resultado de cada negócio. Só podemos dizer que ou ganhamos lucro (+) ou enfrentamos perdas (-). Lucros e perdas alternam de maneiras diferentes para diferentes sistemas de negociação. Por exemplo, se o lucro esperado for 5 vezes menor do que a perda esperada no acionamento do Stop Loss, seria razoável presumir que as negociações lucrativas (+ negociações) prevalecerão significativamente sobre as perdas (negociações). O Z - Score permite estimar com que frequência as negociações lucrativas são alternadas com as perdidas.
Z para um sistema de negociação é calculado pela seguinte fórmula:
N - quantidade total de negociações em uma série;
R - quantidade total de séries de negociações lucrativas e perdedoras;
W - quantidade total de negociações lucrativas na série;
L - quantidade total de negociações perdedoras na série.
Uma série é uma sequência de sinais positivos, seguidos uns dos outros (por exemplo, +++) ou minuses seguidos uns dos outros (por exemplo, -). R conta a quantidade de tais séries.
Fig.4. Comparação de duas séries de lucros e perdas.
Na Fig. 4, uma parte da sequência de lucros e perdas do Expert Advisor que ocupou o primeiro lugar no Campeonato de Negociação Automática 2006 é mostrada em azul. Z-score da sua conta de competição tem o valor de -3,85, a probabilidade de 99,74% é dada entre parênteses. Isso significa que, com uma probabilidade de 99,74%, os negócios nessa conta tiveram uma dependência positiva entre eles (o escore Z é negativo): um lucro foi seguido por um lucro, uma perda foi seguida por uma perda. É este o caso? Aqueles que estavam assistindo ao campeonato provavelmente se lembrariam que Roman Rich colocou sua versão do Expert Advisor MACD que freqüentemente abriu três negociações rodando na mesma direção.
Uma seqüência típica de valores positivos e negativos do valor aleatório na distribuição normal é mostrada em vermelho. Podemos ver que essas seqüências são diferentes. No entanto, como podemos medir essa diferença? Z-score responde a esta pergunta: Sua sequência de lucros e perdas contém mais ou menos tiras (lucrativas ou séries perdedoras) do que você pode esperar por uma sequência realmente aleatória sem qualquer dependência entre negociações? Se o escore Z for próximo de zero, não podemos dizer que a distribuição de negociações seja diferente da distribuição normal. Z-score de uma seqüência de negociação pode nos informar sobre a possível dependência entre negociações consecutivas.
Nisso, os valores de Z são interpretados da mesma forma que a probabilidade de desvio de zero de um valor aleatório distribuído de acordo com a distribuição normal padrão (média = 0, sigma = 1). Se a probabilidade de cair um valor aleatório normalmente distribuído dentro do intervalo de ± 3σ é 99,74%, a queda desse valor fora desse intervalo com a mesma probabilidade de 99,74% nos informa que esse valor aleatório não pertence a essa distribuição normal dada . É por isso que a "regra 3-sigma" é lida da seguinte maneira: um valor aleatório normal se desvia de sua média por não mais de 3-sigma de distância.
O sinal de Z nos informa sobre o tipo de dependência. Além disso, significa que é muito provável que o comércio lucrativo seja seguido por um perdedor. Menos diz que o lucro será seguido por um lucro, uma perda será seguida por uma perda novamente. Uma pequena tabela abaixo ilustra o tipo e a probabilidade de dependência entre as negociações em comparação com a distribuição normal.
Uma dependência positiva entre negociações significa que um lucro causará um novo lucro, enquanto uma perda causará uma nova perda. Uma dependência negativa significa que um lucro será seguido por uma perda, enquanto a perda será seguida por um lucro. A dependência encontrada nos permite regular os tamanhos das posições a serem abertas (idealmente) ou até mesmo pular algumas delas e abri-las apenas virtualmente, a fim de observar sequências comerciais.
Rendimentos de períodos de espera (HPR)
Em seu livro, The Mathematics of Money Management, Ralph Vince usa a noção de HPR (holding period returns). Uma negociação resultou em lucro de 10% tem o HPR = 1 + 0,10 = 1,10. Um trade resultou em uma perda de 10% com o HPR = 1-0. 10 = 0,90. Você também pode obter o valor de HPR para uma negociação, dividindo o valor do saldo após o fechamento da negociação (BalanceClose) pelo valor do saldo na abertura da negociação (BalanceOpen). HPR = BalanceClose / BalanceOpen. Assim, todo comércio tem tanto um resultado em termos monetários quanto um resultado expresso em HPR. Isso nos permitirá comparar sistemas independentemente do tamanho dos contratos negociados. Um dos índices utilizados em tal comparação é a média aritmética, AHPR (retornos médios do período de retenção).
Para encontrar o AHPR, devemos somar todos os HPRs e dividir o resultado pela quantidade de negociações. Vamos considerar esses cálculos usando o exemplo acima de 30 negociações. Suponha que começamos a negociar com $ 500 na conta. Vamos fazer uma nova tabela:
AHPR será encontrado como a média aritmética. É igual a 1,0217. Em outras palavras, nós ganhamos medianamente (1,0217-1) * 100% = 2,17% em cada negociação. É este o caso? Se multiplicarmos 2,17 por 30, veremos que a receita deve chegar a 65,1%. Vamos multiplicar o valor inicial de $ 500 por 65,1% e obter $ 325,50. Ao mesmo tempo, o lucro real torna (627,71-500) /500 * 100% = 25,54%. Assim, a média aritmética de HPR nem sempre nos permite estimar um sistema adequadamente.
Junto com a média aritmética, Ralph Vince introduz a noção de média geométrica que chamaremos de GHPR (retornos de período de retenção geométrica), que é praticamente sempre menor que a AHPR. A média geométrica é o fator de crescimento por jogo e é encontrada pela seguinte fórmula:
N - quantidade de negociações;
BalanceOpen - estado inicial da conta;
BalanceClose - estado final da conta.
O sistema com o maior GHPR terá os maiores lucros se negociarmos com base no reinvestimento. O GHPR abaixo de um significa que o sistema perderá dinheiro se negociarmos com base no reinvestimento. Uma boa ilustração da diferença entre o AHPR e o GHPR pode ser o histórico da conta do sashken. Ele foi o líder do campeonato por um longo tempo. AHPR = 9,98% impressiona, mas o GHPR final = -27,68% coloca tudo em perspectiva.
Relação de Sharpe.
A eficiência dos investimentos é frequentemente estimada em termos de dispersão de lucros. Um desses índices é o índice de Sharpe. Este índice mostra como a AHPR diminuiu pela taxa livre de risco (RFR) relacionada ao desvio padrão (SD) da sequência HPR. O valor do RFR é geralmente considerado igual à taxa de juros em depósito no banco ou taxa de juros sobre obrigações do tesouro. No nosso exemplo, AHPR = 1,0217, SD (HPR) = 0,17607, RFR = 0.
AHPR - retornos médios do período de detenção;
RFR - taxa livre de risco;
SD - desvio padrão.
Proporção de Sharpe = (1,0217- (1 + 0)) / 0,17607 = 0,0217 / 0,17607 = 0,1232. Para distribuição normal, mais de 99% dos valores aleatórios estão dentro da faixa de ± 3σ (sigma = SD) sobre o valor médio M (X). Daqui resulta que o valor de Sharpe Ratio superior a 3 é muito bom. Na Figura 5 abaixo, podemos ver que, se os resultados de negociação são distribuídos normalmente e Índice de Sharpe = 3, a probabilidade de perda é inferior a 1% por negociação, de acordo com a regra 3-sigma.
Fig.5. Distribuição normal dos resultados comerciais com a probabilidade de perda inferior a 1%.
A conta do participante RobinHood confirma isso: sua EA fez 26 negociações no Automated Trading Championship 2006 sem perder nenhuma delas. Relação de Sharpe = 3,07!
Regressão Linear (LR) e Coeficiente de Correlação Linear (CLC)
Há também outra maneira de estimar a estabilidade dos resultados comerciais. Sharpe Ratio nos permite estimar o risco do capital está sendo executado, mas também podemos tentar estimar o grau de suavidade da curva de equilíbrio. Se impusermos os valores de saldo no fechamento de cada negociação, poderemos traçar uma linha quebrada. Esses pontos podem ser ajustados com uma certa linha reta que nos mostrará a direção média das mudanças de capital. Vamos considerar um exemplo dessa oportunidade usando o gráfico de equilíbrio do Expert Advisor Phoenix_4 desenvolvido por Hendrick.
Fig. 6. Gráfico de balanço de Hendrick, o participante do campeonato de negociação automatizado de 2006.
Temos que encontrar os coeficientes aeb de que esta linha vai o mais próximo possível dos pontos que estão sendo ajustados. No nosso caso, x é o número comercial, y é o valor do saldo no fechamento do negócio.
Os coeficientes de uma reta aproximada são geralmente encontrados pelo método dos mínimos quadrados (método dos mínimos quadrados). Suponha que tenhamos isso direto com os coeficientes conhecidos a e b. Para cada x, temos dois valores: y (x) = a * x + be balanço (x). O desvio do equilíbrio (x) de y (x) será denotado como d (x) = y (x) - balanço (x). O SSD (soma dos desvios quadrados) pode ser calculado como SD = Summ. Encontrar o método straight by LS significa procurar por aeb que o SD é mínimo. Essa reta também é chamada de regressão linear (LR) para a sequência dada.
Fig. 7. Desvio do valor do balanço da reta de y = ax + b.
Tendo obtido coeficientes da reta de y = a * x + b usando o método LS, podemos estimar o desvio do valor do balanço a partir da reta encontrada em termos monetários. Se calcularmos a média aritmética da sequência d (x), estaremos certos de que М (d (x)) está próximo de zero (para ser mais exato, é igual a zero para algum grau de precisão de cálculo). Ao mesmo tempo, o SSD de SD não é igual a zero e tem um certo valor limitado. A raiz quadrada de SD / (N-2) mostra a distribuição de valores no gráfico Balanço sobre a linha reta e permite estimar sistemas de negociação com valores idênticos do estado inicial da conta. Nós chamaremos este parâmetro LR Standard Error.
Below are values of this parameter for the first 15 accounts in the Automated Trading Championship 2006:
However, the degree of approximation of the balance graph to a straight can be measured in both money terms and absolute terms. For this, we can use correlation rate. Correlation rate, r, measures the degree of correlation between two sequences of numbers. Its value may lie within the range of -1 to +1. If r=+1, it means that two sequences have identical behavior and the correlation is positive.
Fig. 8. Positive correlation example.
If r=-1, the two sequences change in opposition, the correlation is negative.
Fig. 9. Negative correlation example.
If r=0, it means that there is no dependence found between the sequences. It should be emphasized that r=0 does not mean that there is no correlation between the sequences, it just says that such a correlation has not been found. This must be remembered. In our case, we have to compare two sequences of numbers: одна последовательность из графика баланса, а вторая - соответствующие точки на прямой линейной регрессии.
Fig. 10. Values of balance and points on linear regression.
Below is the table representation of the same data:
Let's denote balance values as X and the sequence of points on the straight regression line as Y. To calculate the coefficient of linear correlation between sequences X and Y, it is necessary to find mean values M(X) and M(Y) first. Then we will create a new sequence T=(X-M(X))*(Y-M(Y)) and calculate its mean value as M(T)=cov(X, Y)=M((X-M(X))*(Y-M(Y))). The found value of cov(X, Y) is named covariance of X and Y and means mathematical expectation of product (X-M(X))*(Y-M(Y)). For our example, covariance value is 21 253 775.08. Please note that M(X) and M(Y) are equal and have the value of 21 382.26 each. It means that the Balance mean value and the average of the fitting straight are equal.
Y - linear regression;
M(X) - Balance mean value;
M(Y) - LR mean value.
The only thing that remains to be done is calculation of Sx and Sy. To calculate Sx, we will find the sum of values of (X-M(X))^2, i. e., find the SSD of X from its mean value. Remember how we calculated dispersion and the algorithm of LS method. As you can see they are all related. The found SSD will be divided by the amount of numbers in the sequence - in our case, 36 (from zero to 35) - and extract the square root of the resulting value. So we have obtained the value of Sx. The value of Sy will be calculated in the same way. In our example, Sx=5839. 098245 and Sy=4610. 181675.
N - amount of trades;
Y - linear regression;
M(X) - Balance mean value;
M(Y) - LR mean value.
Now we can find the value of correlation coefficient as r=21 253 775.08/(5839. 098245*4610. 181675)=0.789536583. This is below one, but far from zero. Thus, we can say that the balance graph correlates with the trend line valued as 0.79. By comparison to other systems, we will gradually learn how to interpret the values of correlation coefficient. At page "Reports" of the Championship, this parameter is named LR correlation. The only difference made to calculate this parameter within the framework of the Championship is that the sign of LR correlation indicates the trade profitability.
The matter is that we could calculate the coefficient of correlation between the balance graph and any straight. For purposes of the Championship, it was calculated for ascending trend line, hence, if LR correlation is above zero, the trading is profitable. If it is below zero, it is losing. Sometimes an interesting effect occurs where the account shoes profit, but LR correlation is negative. This can mean that trading is losing, anyway. An example of such situation can be seen at Aver's. The Total Net Profit makes $2 642, whereas LR сorrelation is -0.11. There is likely no correlation, in this case. It means we just could not judge about the future of the account.
MAE and MFE Will Tell Us Much.
We are often warned: "Cut the losses and let profit grow". Looking at final trade results, we cannot draw any conclusions about whether protective stops (Stop Loss) are available or whether the profit fixation is effective. We only see the position opening date, the closing date and the final result - a profit or a loss. This is like judging about a person by his or her birth and death dates. Without knowing about floating profits during every trade's life and about all positions as a total, we cannot judge about the nature of the trading system. How risky is it? How was the profit reached? Was the paper profit lost? Answers to these questions can be rather well provided by parameters MAE (Maximum Adverse Excursion) and MFE (Maximum Favorable Excursion).
Every open position (until it is closed) continuously experiences profit fluctuations. Every trade reached its maximal profit and its maximal loss during the period between its opening and closing. MFE shows the maximal price movement in a favorable direction. Respectively, MAE shows the maximal price movement in an adverse direction. It would be logical to measure both indexes in points. However, if different currency pairs were traded, we will have to express it in money terms.
Every closed trade corresponds to its result (return) and two indexes - MFE and MAE. If the trade resulted in profit of $100, MAE reaching -$1000, this does not speak for this trade's best. Availability of many trades resulted in profits, but having large negative values of MAE per trade, informs us that the system just "sits out" losing positions. Such trading is fated to failure sooner or later.
Similarly, values of MFE can provide some useful information. If a position was opened in a right direction, MFE per trade reached $3000, but the trade was then closed resulting in the profit of $500, we can say that it would be good to elaborate the system of unfixed profit protection. This may be Trailing Stop that we can move after the price if the latter one moves in a favorable direction. If short profits are systematic, the system can be significantly improved. MFE will tell us about this.
For visual analysis to be more convenient, it would be better to use graphical representation of distribution of values of MAE and MFE. If we impose each trade into a chart, we will see how the result has been obtained. For example, if we have another look into "Reports" of RobinHood who didn't have any losing trades at all, we will see that each trade had a drawdown (MAE) from -$120 to -$2500.
Fig. 11. Trades distribution on the plane of MAExReturns.
Besides, we can draw a straight line to fit the Returns x MAE distribution using the LS method. In Fig. 11, it is shown in red and has a negative slope (the straight values decrease when moving from left to right). Parameter Correlation(Profits, MAE)=-0.59 allows us to estimate how close to the straight the points are distributed in the chart. Negative value shows negative slope of the fitting line.
If you look through other Participants' accounts, you will see that correlation coefficient is usually positive. In the above example, the descending slope of the line says us that it tends to get more and more drawdowns in order not to allow losing trades. Now we can understand what price has been paid for the ideal value of parameter LR Correlation=1!
Similarly, we can build a graph of distribution of Returns and MFE, as well as find the values of Correlation(Profits, MFE) = 0.77 and Correlation(MFE, MAE) = -0.59. Correlation(Profits, MFE) is positive and tends to one (0.77). This informs us that the strategy tries not to allow long "sittings out" floating profits. It is more likely that the profit is not allowed to grow enough and trades are closed by Take Profit. As you can see, distributions of MAE and MFE дgive us a visual estimate and values of Correlation(Profits, MFE) and Correlation(Profits, MAE) can inform us about the nature of trading, even without charts.
Values of Correlation(MFE, MAE), Correlation(NormalizedProfits, MAE) and Correlation(NormalizedProfits, MFE) in the Championship Participants' "Reports" are given as additional information.
Trade Result Normalization.
In development of trading systems, they usually use fixed sizes for positions. This allows easier optimization of system parameters in order to find those more optimal on certain criteria. However, after the inputs have been found, the logical question occurs: What sizing management system (Money Management, MM) should be applied. The size of positions opened relates directly to the amount of money on the account, so it would not be reasonable to trade on the account with $5 000 in the same way as on that with $50 000. Besides, an ММ system can open positions, which are not directly proportional. I mean a position opened on the account with $50 000 should not necessarily be 10 times more than that opened on a $5 000 deposit.
Position sizes may also vary according to the current market phase, to the results of the latest several trades analysis, and so on. So the money-management system applied can essentially change the initial appearance of a trading system. How can we then estimate the impact of the applied money-management system? Was it useful or did it just worsen the negative sides of our trading approach? How can we compare the trade results on several accounts having the same deposit size at the beginning? A possible solution would be normalization of trade results.
TradeProfit - profit per trade in money terms;
TradeLots - position size (lots);
MinimumLots - minimum allowable position size.
Normalization will be realized as follows: We will divide each trade's result (profit or loss) by the position volume and then multiply by the minimum allowable position size. For example, order #4399142 BUY 2.3 lots USDJPY was closed with the profit of $4 056. 20 + $118.51 (swaps) = $4 174.71. This example was taken from the account of GODZILLA (Nikolay Kositsin). Let's divide the result by 2.3 and multiply by 0.1 (the minimum allowable position size), and obtain a profit of $4 056.20/2.3 * 0.1 = $176.36 and swaps = $5.15. these would be results for the order of 0.1-lot size. Let us do the same with results of all trades and we will then obtain Normalized Profits (NP).
the first thing we think about is finding values of Correlation(NormalizedProfits, MAE) and Correlation(NormalizedProfits, MFE) and comparing them to the initial Correlation(Profits, MAE) and Correlation(Profits, MFE). If the difference between parameters is significant, the applied method has likely changed the initial system essentially. They say that applying of ММ can "kill" a profitable system, but it cannot turn a losing system into a profitable one. in the Championship, the account of TMR is a rare exception where changing Correlation(NormalizedProfits, MFE) value from 0.23 to 0.63 allowed the trader to "close in black".
How Can We Estimate the Strategy's Aggression?
We can benefit even more from normalized trades in measuring of how the MM method applied influences the strategy. It is obvious that increasing sizes of positions 10 times will cause that the final result will differ from the initial one 10 times. And what if we change the trade sizes not by a given number of times, but depending on the current developments? Results obtained by trust-managing companies are usually compared to a certain model, usually - to a stock index. Beta Coefficient shows by how many times the account deposit changes as compared to the index. If we take normalized trades as an index, we will be able to know how much more volatile the results became as compared to the initial system (0.1-lot trades).
Thus, first of all, we calculate covariance - cov(Profits, NormalizedProfits). then we calculate the dispersion of normalized trades naming the sequence of normalized trades as NP. For this, we will calculate the mathematical expectation of normalized trades named M(NP). M(NP) shows the average trade result for normalized trades. Then we will find the SSD of normalized trades from M(NP), i. e., we will sum up (NP-M(NP))^2. The obtained result will be then divided by the amount of trades and name D(NP). This is the dispersion of normalized trades. Let's divide covariance between the system under measuring, Profits, and the ideal index, NormalizedProfits cov(Profits, NormalizedProfits), by the index dispersion D(NP). The result will be the parameter value that will allow us to estimate by how many times more volatile the capital is than the results of original trades (trades in the Championship) as compared to normalized trades. This parameter is named Money Compounding in the "Reports". It shows the trading aggression level to some extent.
Profits - trade results;
NP - normalized trade results;
M(NP) - mean value of normalized trades.
Now we can revise the way we read the table of Participants of the Automated Trading Championship 2006:
The LR Standard error in Winners' accounts was not the smallest. At the same time, the balance graphs of the most profitable Expert Advisors were rather smooth since the LR Correlation values are not far from 1.0. The Sharpe Ratio lied basically within the range of 0.20 to 0.40. The only EA with extremal Sharpe Ratio=3.07 turned not to have very good values of MAE and MFE.
The GHPR per trade is basically located within the range from 1.5 to 3%. At that, the Winners did not have the largest values of GHPR, though not the smallest ones. Extreme value GHPR=12.77% says us again that there was an abnormality in trading, and we can see that this account experienced the largest fluctuations with LR Standard error=$9 208.08.
Z-score does not give us any generalizations about the first 15 Championship Participants, but values of |Z|>2.0 may draw our attention to the trading history in order to understand the nature of dependence between trades on the account. Thus, we know that Z=-3.85 for Rich's account was practically reached due to simultaneous opening of three positions. And how are things with ldamiani's account?
Finally, the last column in the above table, Money Compounding, also has a large range of values from 8 to 50, 50 being the maximal value for this Championship since the maximal allowable trade size made 5.0 lots, which is 50 times more than the minimal size of 0.1 lot. However, curiously enough, this parameter is not the largest at Winners. The Top Three's values are 17.27, 28.79 and 16.54. Did not the Winners fully used the maximal allowable position size? Yes, they did. the matter is, perhaps, that the MM methods did not considerably influence trading risks at general increasing of contract sizes. This is a visible evidence of that money management is very important for a trading system.
The 15th place was taken by payday. The EA of this Participant could not open trades with the size of more than 1. 0 lot due to a small error in the code. What if this error did not occur and position sizes were in creased 5 times, up to 5.0 lots? Would then the profit increase proportionally, from $4 588.90 to $22 944.50? Would the Participant then take the second place or would he experience an irrecoverable DrawDown due to increased risks? Would alexgomel be on the first place? His EA traded with only 1.0-лот trades, too. Or could vgc win, whose Expert Advisor most frequently opened trades of the size of less than 1.0 lot. All three have a good smooth balance graph. As you can see, the Championship's plot continues whereas it was over!
Conclusion: Don't Throw the Baby Out with the Bathwater.
Opinions differ. This article gives some very general approaches to estimation of trading strategies. One can create many more criteria to estimate trade results. Each characteristic taken separately will not provide a full and objective estimate, but taken together they may help us to avoid lopsided approach in this matter.
We can say that we can subject to a "cross-examination" any positive result (a profit gained on a sufficient sequence of trades) in order to detect negative points in trading. This means that all these characteristics do not so much characterize the efficiency of the given trading strategy as inform us about weak points in trading we should pay attention at, without being satisfied with just a positive final result - the net profit gained on the account.
Well, we cannot create an ideal trading system, every system has its benefits and implications. Estimation test is used in order not to reject a trading approach dogmatically, but to know how to perform further development of trading systems and Expert Advisors. In this regard, statistical data accumulated during the Automated Trading Championship 2006 would be a great support for every trader.
Traduzido do russo por MetaQuotes Software Corp.
The Contrarian Z-Score and Why You Should Always Strive to Reject Trading Systems.
When I first read about the z-score system some years ago I knew it was a fluke. Descriptive statistics cannot be easily converted to edges due to non-stationarity. More importantly, a quant should be always suspicious and strive to reject systems. This is the only way to survive in a market where edges are rare and hard to find.
If you are a technical trader one of your main goals should be disproving apparent edges, not trying to prove them. When you always strive to prove that ideas are good, you risk at the end of getting fooled by randomness. Instead, your goal should be trying to disprove ideas, constantly and relentlessly. In this way you risk rejecting a few good ideas but you reduce the risk of getting fooled by randomness. Which do you prefer? Getting fooled by randomness or missing an edge or two?
Mike at The Whole Street is doing an excellent job aggregating information that is useful to quant traders. I look at his RSS feed daily for interesting articles and links. The other day he posted a link to work involving the z-score contrarian system. That brought back memories of endless backtesting using descriptive statistics many years ago and reaching finally the conclusion that there can be no robust edges based on them due to the non-stationarity of the mean, standard deviation but also of higher moments. I also remembered how I reached the decision that the contrarian z-score was not only a fluke but also a dangerous system to trade.
Based on the details offered in the reference given at the end of this article, back in 2010 I coded the z-score system, I backtested it on SPY data and found out that my results agreed with those in the reference. Then, I just backtested the system not on the portfolio suggested but in GLD, an ETF that was hot at that time due to the strong uptrend in gold. To my surprise or not, the backtest results in GLD with data from inception on 11/08/2004 to 11/30/2010 revealed a disastrous system with a compound annual return of -10.3% and a falling equity line, as shown on the chart below:
The blue line is the buy and hold equity for a $10,000 starting value. In the backtest, position size was calculated based on a constant value of $10,000 and no commission and slippage were included, which would make things worse of course.
That was enough for me. If the z-score system could no profit from a market where even uninformed and random traders could make money via buying and holding for a few days, then it was a bad one. To the credit of the technical analyst in the reference below, it was acknowledged that the system had certain issues. I agree with the analysis and with the comments, which I find good. I disagree with what appears to be an attempt to prove that a system is profitable by selecting a portfolio of a few ETFs where it performed well. This is survivorship bias and should not be part of any analysis. Quants should strive to demolish apparent edges. Only then they can survive the noise.
The z-score system could not make a single dollar in a course of six years in a very dynamic market, GLD. I thus rejected it. It paid because those who continued using it in to trade SPY did not do well after 2013, when the statistics changed and the standard deviation decreased, as shown on the chart below:
From 01/02/2013 to 10/17/2014, the net return of SPY before dividend adjustments is about 29.4% but the z-score system generated a return of only 9.6% and thus underperformed the buy and hold by a margin that is wide enough to indicate that the trades were random and the profit generated was by luck alone. This can be shown mathematically but I do not wish to take more of the valuable time of my readers because the main points of this post were made already.
Você pode se inscrever aqui para notificações de novas postagens por e-mail.
Divulgação: sem posições relevantes.
Programa de gráficos: Amibroker.
Assine nossa lista de e-mails e receba atualizações na sua caixa de entrada de e-mail.
Obrigado por se inscrever.
Algo deu errado.
Nós respeitamos sua privacidade.
Categorias.
Aviso de direitos autorais.
© 2011 & # 8211; 2018 Michael Harris. Todos os direitos reservados. Concederemos uma permissão revogável para criar um hiperlink para este blog sujeito a certos Termos e Condições. Qualquer cópia não autorizada, reprodução, distribuição, publicação, exibição, modificação ou transmissão de qualquer parte deste blog é estritamente proibido sem permissão prévia por escrito.
No comments:
Post a Comment