Validando transformações de insumo-produção
O modelo é visto como uma transformação de entrada-saída para esses testes. O teste de validação consiste em comparar as saídas do sistema em consideração com as saídas do modelo para o mesmo conjunto de condições de entrada. Os dados registrados durante a observação do sistema devem estar disponíveis para realizar este teste. O resultado do modelo que é de interesse primário deve ser usado como medida de desempenho. Por exemplo, se o sistema considerado for uma unidade de fast food onde a entrada para o modelo é o tempo de chegada do cliente e a medida de desempenho de saída é o tempo médio do cliente na fila, então o tempo real de chegada e o tempo gasto na fila para os clientes na unidade seriam registrados. O modelo seria executado usando tempos reais de chegada e o tempo médio do modelo on-line seria comparado ao tempo real médio gasto na fila usando um ou mais testes.
O teste de hipótese estatística utilizando o teste t pode ser usado como base para aceitar o modelo como válido ou rejeitá-lo como inválido.
A hipótese a ser testada é.
contra.
O teste é realizado para um determinado tamanho de amostra e nível de significância ou α. Para realizar o teste, um número n de execuções estatisticamente independentes do modelo é realizado e um valor médio ou esperado, E(Y), é produzido para a variável de interesse. Em seguida, a estatística de teste, t é calculada para α, n, E (Y) e o valor observado para o sistema μ.
Sim.
rejeita H, o modelo precisa de ajuste.
Existem dois tipos de erros que podem ocorrer ao usar testes de hipóteses: rejeitar um modelo válido denominado erro Tipo I ou “risco dos construtores de modelo” e aceitar um modelo inválido denominado erro Tipo II, β, ou “risco do usuário do modelo”. O nível de significância ou α é igual à probabilidade de erro tipo I. Se α for pequeno, rejeitar a hipótese nula é uma conclusão forte. Por exemplo, se α = 0,05 e a hipótese nula for rejeitada, existe apenas uma probabilidade de 0,05 de rejeitar um modelo que seja válido. Diminuir a probabilidade de um erro tipo II é muito importante. A probabilidade de detectar corretamente um modelo inválido é 1 – β. A probabilidade de um erro tipo II depende do tamanho da amostra e da diferença real entre o valor da amostra e o valor observado. Aumentar o tamanho da amostra diminui o risco de erro tipo II.
Uma técnica estatística na qual a quantidade de precisão do modelo é especificada como um intervalo foi desenvolvida recentemente. A técnica usa testes de hipótese para aceitar um modelo se a diferença entre a variável de interesse de um modelo e a variável de interesse de um sistema estiver dentro de uma faixa de precisão específica.[6] Um requisito é que tanto os dados do sistema quanto os dados do modelo sejam aproximadamente normalmente independentes e distribuídos de forma idêntica (NIID). As estatísticas do teste t são usadas nesta técnica. Se a média do modelo for μ e a média do sistema for μ, então a diferença entre o modelo e o sistema é D = μ - μ. A hipótese a ser testada é se D está dentro da faixa aceitável de precisão. Seja L = o limite inferior de precisão e U = limite superior de precisão. Então.
contra.
É para ser testado.
A curva característica operacional (OC) é a probabilidade de que a hipótese nula seja aceita quando for verdadeira. A curva OC caracteriza as probabilidades de erros do tipo I e II. As curvas de risco para o construtor e usuário do modelo podem ser desenvolvidas a partir das curvas OC. Nas curvas de risco você pode ver facilmente a comparação de curvas com trade-offs de tamanho de amostra fixo entre o risco do criador do modelo e o risco do usuário do modelo. Se o risco do criador do modelo, o risco do usuário do modelo e os limites superior e inferior da faixa de precisão forem especificados, o tamanho da amostra necessário poderá ser calculado.
Intervalos de confiança podem ser usados para avaliar se um modelo está “suficientemente próximo” de um sistema para alguma variável de interesse. A diferença entre o valor conhecido do modelo, μ0, e o valor do sistema, μ, é verificada para ver se é menor que um valor pequeno o suficiente para que o modelo seja válido em relação àquela variável de interesse. O valor é denotado pelo símbolo ε. Para realizar o teste, um número, n, execuções estatisticamente independentes do modelo são realizadas e uma média ou valor esperado, E(Y) ou μ é produzido para a variável de saída de interesse da simulação Y, com um desvio padrão S. Um nível de confiança, 100 (1-α), é selecionado. Um intervalo, [a, b], é construído por.
Onde.
É o valor crítico da distribuição t para um determinado nível de significância e n-1 graus de liberdade.
Se as suposições estatísticas não puderem ser atendidas ou se houver dados insuficientes para o sistema, comparações gráficas dos resultados do modelo com os resultados do sistema podem ser usadas para tomar decisões subjetivas; no entanto, outros testes objetivos são preferíveis.