Algoritmos de crescimento urbano | Construpedia

Algoritmos de crescimento urbano

Introdução

Em geral

Em estatística e aprendizado de máquina, métodos de conjunto usam vários algoritmos de aprendizado para obter melhor desempenho preditivo do que poderia ser obtido apenas com qualquer um dos algoritmos de aprendizado constituintes.[1][2][3] Ao contrário de um conjunto estatístico em mecânica estatística, que normalmente é infinito, um conjunto de aprendizado de máquina consiste apenas em um conjunto finito específico de modelos alternativos, mas normalmente permite uma estrutura muito mais flexível entre essas alternativas.

Visão geral

Algoritmos de aprendizagem supervisionada realizam a tarefa de pesquisar em um espaço de hipóteses para encontrar uma hipótese adequada que faça boas previsões para um determinado problema.[4] Mesmo que o espaço de hipóteses contenha hipóteses muito adequadas para um determinado problema, pode ser muito difícil encontrar uma boa. Os conjuntos combinam múltiplas hipóteses para formar uma hipótese (espero) melhor. O termo “conjunto” é geralmente reservado para métodos que geram múltiplas hipóteses usando o mesmo aluno base. O termo mais amplo, sistemas classificadores múltiplos, também abrange a hibridização de hipóteses que não são induzidas pelo mesmo aluno base.

Avaliar a previsão de um conjunto geralmente requer mais cálculos do que avaliar a previsão de um único modelo. De certa forma, a aprendizagem em conjunto pode ser vista como uma forma de compensar algoritmos de aprendizagem deficientes, realizando muitos cálculos adicionais. Por outro lado, a alternativa é aprender muito mais em um sistema não-ensemble. Um sistema conjunto pode ser mais eficiente na melhoria da precisão geral para o mesmo aumento em recursos de computação, armazenamento ou comunicação usando esse aumento em dois ou mais métodos do que seria melhorado aumentando o uso de recursos para um único método. Algoritmos rápidos, como árvores de decisão, são frequentemente usados em métodos de conjunto (por exemplo, florestas aleatórias), embora algoritmos mais lentos também possam se beneficiar de técnicas de conjunto.

Por analogia, técnicas de conjunto também têm sido utilizadas em cenários de aprendizagem não supervisionados, por exemplo, em agrupamento de consenso ou detecção de anomalias.

teoria dos conjuntos

Algoritmos de crescimento urbano

Introdução

Em geral

Visão geral

Tipos comuns de conjuntos

Classificador bayesiano ideal

O classificador Bayesiano ideal é uma técnica de classificação. Este é um conjunto de todas as hipóteses no espaço de hipóteses. Em média, nenhum outro conjunto pode superá-lo.[16] O classificador Naive Bayes é uma versão deste que assume que os dados são condicionalmente independentes da classe e torna o cálculo mais viável. Cada hipótese recebe um voto proporcional à probabilidade de que o conjunto de dados de treinamento seria amostrado de um sistema se essa hipótese fosse verdadeira. Para facilitar dados de treinamento de tamanho finito, o voto para cada hipótese também é multiplicado pela probabilidade a priori dessa hipótese. O classificador Bayes ideal pode ser expresso com a seguinte equação:.

Onde está a classe prevista, é o conjunto de todas as classes possíveis, é o espaço de hipóteses, refere-se a uma probabilidade e são os dados de treinamento. Como conjunto, o classificador Bayes ótimo representa uma hipótese que não está necessariamente em. No entanto, a hipótese representada pelo classificador Bayes ótimo é a hipótese ótima no espaço de conjuntos (o espaço de todos os conjuntos possíveis formado apenas por hipóteses em ).

Esta fórmula pode ser reformulada utilizando o teorema de Bayes, que diz que a probabilidade posterior é proporcional à probabilidade multiplicada pela probabilidade anterior:.

portanto,.

Agregação de bootstrap (ensaque)

A agregação de bootstrap (bagging) consiste em treinar um conjunto a partir de conjuntos de dados de bootstrap. Um conjunto de bootstrap é criado selecionando o conjunto de dados de treinamento original com substituição. Portanto, um conjunto de bootstrap pode conter um exemplo dado zero, uma vez ou múltiplas vezes. Os membros do conjunto também podem ter limites de recursos (por exemplo, os nós "Nó (computação)" de uma árvore de decisão), para incentivar a exploração de diversos recursos. As informações de variação local em conjuntos de bootstrap e considerações de recursos promovem a diversidade no conjunto e podem fortalecê-lo.[18] Para reduzir o overfitting, um membro pode ser validado usando o conjunto pronto para uso (exemplos que não estão no conjunto). inicialização).[19].

A inferência é realizada votando as previsões dos membros do conjunto, o que é chamado de agregação. Isso é ilustrado abaixo com um conjunto de quatro árvores de decisão. Cada árvore classifica o exemplo de consulta. Como três dos quatro preveem a classe positiva, a classificação geral do conjunto é positiva. Florestas aleatórias como a mostrada são uma aplicação comum de montagem.

Impulsionando

Boosting consiste em treinar modelos sucessivos, enfatizando dados de treinamento mal classificados por modelos aprendidos anteriormente. Inicialmente, todos os dados (D1) têm peso igual e são utilizados para aprender um modelo base M1. Os exemplos classificados incorretamente por M1 recebem um peso maior do que aqueles classificados corretamente. Esses dados aprimorados (D2) são usados para treinar um segundo modelo base M2 e assim por diante. A inferência é feita por votação.

Em alguns casos, o reforço deu melhores resultados do que o ensacamento, mas tende a se ajustar mais. A aplicação mais comum de boosting é Adaboost"), mas alguns algoritmos mais recentes obtêm melhores resultados.

Média do modelo bayesiano

A média do modelo bayesiano (BMA) faz previsões calculando a média das previsões dos modelos ponderados por suas probabilidades a posteriori dados os dados. Sabe-se que o BMA geralmente fornece respostas melhores do que um único modelo, obtido, por exemplo, por regressão stepwise&action=edit&redlink=1 "Regressão stepwise (ainda não escrita)"), especialmente quando modelos muito diferentes têm desempenho quase idêntico no conjunto de treinamento, mas, caso contrário, podem ter desempenho muito diferente.

O problema com qualquer uso do teorema de Bayes é o anterior, ou seja, a probabilidade (talvez subjetiva) de que cada modelo seja o melhor para um determinado propósito. Conceitualmente, o BMA pode ser usado com qualquer anterior. Os pacotes R ensembleBMA[21] e BMA[22] usam a prioridade implícita no critério de informação bayesiano (BIC), seguindo Raftery (1995).[23] O pacote R BAS apoia o uso das prioridades implícitas no critério de informação de Akaike (AIC) e outros critérios em modelos alternativos, bem como prioridades nos coeficientes.[24].

A diferença entre o BIC e o AIC é a força da preferência pela parcimônia. A penalidade do BIC pela complexidade do modelo é , enquanto a do AIC é . A teoria assintótica de grandes amostras afirma que, se existir um melhor modelo, então, com o aumento do tamanho da amostra, o BIC é fortemente consistente, ou seja, é quase certo que você o encontrará, enquanto o AIC pode não, porque o AIC pode continuar a colocar probabilidade posterior excessiva em modelos que são mais complicados do que o necessário. Por outro lado, AIC e AICc são assintoticamente "eficientes" (ou seja, erro quadrático médio mínimo de predição), enquanto BIC não é.[25].

Haussler et al. (1994) mostraram que quando BMA é usado para classificação, seu erro esperado é no máximo duas vezes o erro esperado do classificador ótimo de Bayes.[26] Burnham e Anderson (1998, 2002) contribuíram muito para apresentar as ideias básicas do modelo bayesiano de média para um público mais amplo e popularizar a metodologia.[27] A disponibilidade de software, incluindo outros pacotes de código aberto gratuitos para R, além dos mencionados acima, ajudou. tornar os métodos acessíveis a um público mais amplo.[28].

Combinação bayesiana de modelos

A combinação de modelos bayesianos (BMC) é uma correção algorítmica para a média do modelo bayesiano (BMA). Em vez de amostrar cada modelo do conjunto individualmente, ele é amostrado do espaço de conjuntos possíveis (com pesos de modelo extraídos aleatoriamente de uma distribuição de Dirichlet com parâmetros uniformes). Esta modificação supera a tendência da BMA de convergir e atribuir todo o peso a um único modelo. Embora o BMC seja um pouco mais caro computacionalmente que o BMA, ele tende a produzir resultados muito melhores. Foi demonstrado que o CMO é melhor em média (com significância estatística) do que o BMA e o ensacamento.[29].

Usar a lei de Bayes para calcular os pesos dos modelos requer o cálculo da probabilidade dos dados com base em cada modelo. Normalmente, nenhum dos modelos do conjunto é exatamente a distribuição a partir da qual os dados de treinamento foram gerados, portanto todos recebem corretamente um valor próximo de zero para este termo. Isto funcionaria bem se o conjunto fosse grande o suficiente para amostrar todo o espaço do modelo, mas raramente é possível. Consequentemente, cada padrão nos dados de treinamento fará com que o peso do conjunto se desloque em direção ao modelo de conjunto que melhor corresponda à distribuição dos dados de treinamento. Em essência, tudo se resume a um método desnecessariamente complexo de realizar a seleção de modelos.

Os possíveis pesos de um conjunto podem ser visualizados como se estivessem localizados em um simplex. Em cada vértice do simplex, todo o peso é atribuído a um único modelo no conjunto. O BMA converge para o vértice mais próximo da distribuição dos dados de treinamento. Em vez disso, o BMC converge para o ponto onde esta distribuição é projetada no simplex. Ou seja, ao invés de selecionar o modelo mais próximo da distribuição gerada, procure a combinação de modelos mais próximos da distribuição gerada.

Os resultados do BMA muitas vezes podem ser aproximados usando validação cruzada para selecionar o melhor modelo de um conjunto de modelos. Da mesma forma, os resultados do BMC podem ser aproximados usando validação cruzada para selecionar a melhor combinação de conjuntos a partir de uma amostragem aleatória de pesos possíveis.

Balde de modelos

Um "cubo modelo" é uma técnica de conjunto na qual um algoritmo de seleção de modelo é usado para escolher o melhor modelo para cada problema. Quando testado em um único problema, um cubo de modelos pode não produzir melhores resultados do que o melhor modelo do conjunto, mas quando testado em muitos problemas, normalmente produzirá resultados muito melhores, em média, do que qualquer modelo do conjunto.

O método mais comumente usado para seleção de modelos é a validação cruzada (às vezes chamada de “concurso de panificação”). É descrito com o seguinte pseudocódigo:

A seleção por validação cruzada pode ser resumida como: “experimente todos eles contra o conjunto de treinamento e escolha aquele que funciona melhor”.[30].

Gating é uma generalização da seleção de validação cruzada. Consiste em treinar outro modelo de aprendizagem para decidir qual dos modelos de cubo é o mais adequado para resolver o problema. Freqüentemente, um perceptron é usado para o modelo de gate. Pode ser usado para escolher o “melhor” modelo ou para dar um peso linear às previsões de cada modelo no cubo.

Ao usar um cubo de modelos com um grande conjunto de problemas, pode ser desejável evitar o treinamento de alguns dos modelos que demoram muito para serem treinados. A aprendizagem Milestone é uma abordagem de meta-aprendizagem "Meta-aprendizagem (ciência da computação)" que tenta resolver este problema. Envolve treinar apenas os algoritmos rápidos (mas imprecisos) no cubo e, em seguida, usar o desempenho desses algoritmos para ajudar a determinar qual algoritmo lento (mas preciso) tem maior probabilidade de obter melhores resultados.[31].

Empilhamento

O empilhamento (às vezes chamado de generalização empilhada) envolve o treinamento de um modelo para combinar as previsões de outros algoritmos de aprendizagem. Primeiro, todos os outros algoritmos são treinados usando os dados disponíveis e, em seguida, um algoritmo combinador (estimador final) é treinado para fazer uma previsão final usando todas as previsões dos outros algoritmos (estimadores de base) como entradas adicionais ou usando previsões com validação cruzada dos estimadores de base, o que pode evitar overfitting.[32] Se um algoritmo combinador arbitrário for usado, o empilhamento pode, teoricamente, representar qualquer uma das técnicas de conjunto descritas neste artigo, embora na prática isso frequentemente o faça. Um modelo de regressão logística é usado como combinador.

O empilhamento normalmente fornece melhores resultados do que qualquer modelo treinado separadamente.[33] Ele tem sido usado com sucesso em tarefas de aprendizagem supervisionada (regressão,[34] classificação e ensino à distância)[35] e aprendizagem não supervisionada (estimativa de densidade).[36] Ele também tem sido usado para estimar a taxa de erro de bagging.[3][37] Foi relatado que ele supera a média bayesiana. modelos.[38] Os dois principais resultados do concurso Netflix usaram embaralhamento, que pode ser considerado uma forma de empilhamento.[39].

Voto

Votar é outra forma de assembleia. Veja, por exemplo, o algoritmo de maioria ponderada (aprendizado de máquina).

Aplicações de aprendizagem em conjunto

Contenido

En los últimos años, debido a la creciente potencia computacional, que permite el entrenamiento en el aprendizaje de grandes conjuntos en un tiempo razonable, el número de aplicaciones de aprendizaje de conjuntos ha crecido cada vez más.[45] Algunas de las aplicaciones de los clasificadores de conjuntos incluyen:.

Sensoriamento remoto

O mapeamento da cobertura do solo é uma das principais aplicações dos sensores de satélite de observação da Terra, que utilizam sensoriamento remoto e dados geoespaciais, para identificar materiais e objetos encontrados na superfície de áreas-alvo. Geralmente, as classes de materiais alvo incluem estradas, edifícios, rios, lagos e vegetação.[46] Para identificar com eficiência os objetos de cobertura do solo, diferentes abordagens de aprendizagem de conjunto baseadas em redes neurais artificiais são propostas,[47] análise de componentes principais do kernel (KPCA),[48] árvores de decisão impulsionadas,[49] floresta aleatória[46][50] e projeto automático de múltiplos sistemas classificadores[51] são propostos para identificar com eficiência objetos de cobertura do solo. a cobertura do solo.

Detecção de alterações") é um problema de análise de imagem que envolve a identificação de locais onde a cobertura da terra mudou ao longo do tempo. A detecção de alterações é amplamente utilizada em áreas como crescimento urbano, dinâmica de florestas e vegetação, uso da terra e monitoramento de desastres. detecção de pilhas de imagens.[56] Um exemplo é um método bayesiano de detecção de ponto de mudança de conjunto chamado BEAST, com o software disponível como o pacote Rbeast em R, Python e Matlab.[57].

Segurança informática

A negação de serviço distribuída é um dos ataques cibernéticos mais ameaçadores que um provedor de serviços de Internet pode sofrer.[45] Ao combinar a saída de classificadores individuais, os classificadores de conjunto reduzem o erro total de detecção e discriminação desses tipos de ataques de flashes legítimos.[58].

A classificação de códigos maliciosos, como vírus de computador, worms de computador, cavalos de Tróia, ransomware e spyware usando técnicas de aprendizado de máquina, é inspirada no problema de categorização de documentos.[59] Os sistemas de aprendizagem em conjunto demonstraram eficácia adequada nesta área.[60][61].

Um sistema de detecção de intrusão monitora a rede de computadores ou sistemas de computadores para identificar códigos de intrusão como um processo de detecção de anomalias. O aprendizado conjunto ajuda com sucesso esses sistemas de supervisão a reduzir seu erro total.[62][63].

reconhecimento facial

O reconhecimento facial, que recentemente se tornou uma das áreas de pesquisa mais populares de reconhecimento de padrões, trata da identificação ou verificação de uma pessoa usando suas imagens digitais.[64].

Conjuntos hierárquicos baseados no classificador Gabor Fisher e técnicas de pré-processamento de análise de componentes independentes são alguns dos primeiros conjuntos usados neste campo.[65][66][67].

Reconhecimento de emoções

Embora o reconhecimento de fala seja baseado principalmente em aprendizagem profunda, porque a maioria dos participantes da indústria neste campo, como Google, Microsoft e IBM, revelam que a tecnologia central de seu reconhecimento de fala é baseada nesta abordagem, o reconhecimento de emoções baseado em fala também pode ter desempenho satisfatório com aprendizagem em conjunto.[68][69].

Também está sendo usado com sucesso no reconhecimento de emoções faciais").[70][71][72].

Detecção de fraude

A detecção de fraude trata da identificação de fraudes bancárias, como lavagem de dinheiro, fraude de cartão de crédito e fraude de telecomunicações, que possuem vastos domínios de pesquisa e aplicações de aprendizado de máquina. Como a aprendizagem em conjunto melhora a robustez da modelagem do comportamento normal, ela foi proposta como uma técnica eficaz para detectar esses casos e atividades fraudulentas em sistemas bancários e de cartão de crédito.[73][74].

Tomada de decisão financeira

A precisão da previsão do fracasso empresarial é uma questão crucial na tomada de decisões financeiras. Portanto, diferentes classificadores de conjunto são propostos para prever crises financeiras e dificuldades financeiras.[75] Da mesma forma, no problema de manipulação baseada em negociação, em que os comerciantes tentam manipular os preços das ações "Ações (Finanças)") por meio de atividades de compra e venda, os classificadores de conjuntos são obrigados a analisar mudanças nos dados do mercado de ações e detectar sintomas suspeitos de manipulação de preços de ações.[75].

Medicamento

Classificadores de conjunto têm sido aplicados com sucesso em neurociência, proteômica e diagnósticos médicos, como na detecção de distúrbios neurocognitivos (por exemplo, Alzheimer ou distrofia miotônica) a partir de conjuntos de dados de ressonância magnética,[76][77][78] e na classificação de citologia cervical.[79][80].

Referências

[1] ↑ Opitz, D.; Maclin, R. (1 de agosto de 1999). «Popular Ensemble Methods: An Empirical Study». Journal of Artificial Intelligence Research (en inglés) 11: 169-198. ISSN 1076-9757. doi:10.1613/jair.614. Consultado el 5 de marzo de 2024.: https://jair.org/index.php/jair/article/view/10239
[2] ↑ Polikar, R. (2006). «"Ensemble based systems in decision making"». IEEE Circuits and Systems Magazine. doi:10.1109/MCAS.2006.1688199.: https://dx.doi.org/10.1109%2FMCAS.2006.1688199
[3] ↑ a b Rokach, L. (2010). «"Ensemble-based classifiers"». Artificial Intelligence Review. doi:10.1007/s10462-009-9124-7.: https://dx.doi.org/10.1007%2Fs10462-009-9124-7
[4] ↑ Blockeel H. (2011). «"Hypothesis Space"». Encyclopedia of Machine Learning. ISBN 978-0-387-30768-8. doi:10.1007/978-0-387-30164-8_373.: https://lirias.kuleuven.be/handle/123456789/298291
[5] ↑ Kuncheva, L. and Whitaker, C. (2003). «Measures of diversity in classifier ensembles». Machine Learning.: https://link.springer.com/content/pdf/10.1023/A:1022859003006.pdf
[6] ↑ Sollich, P. and Krogh, A. (1996). «Learning with ensembles: How overfitting can be useful». Advances in Neural Information Processing Systems, volume 8.: https://proceedings.neurips.cc/paper/1995/file/1019c8091693ef5c5f55970346633f92-Paper.pdf
[7] ↑ Brown, G. and Wyatt, J. and Harris, R. and Yao, X. (2005). «Diversity creation methods: a survey and categorisation». Information Fusion.: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.421.349&rep=rep1&type=pdf
[8] ↑ Adeva, Juan Jose Garcıa; Beresi, Ulises Cervino; Calvo, Rafael A. (1 de diciembre de 2005). «Accuracy and Diversity in Ensembles of Text Categorisers». CLEI Electronic Journal (en inglés) 8 (2): 1:1-1:12. ISSN 0717-5000. doi:10.19153/cleiej.8.2.1. Consultado el 5 de marzo de 2024.: https://www.clei.org/cleiej/index.php/cleiej/article/view/319
[9] ↑ Ho, T. (1995). «Random Decision Forests». Proceedings of the Third International Conference on Document Analysis and Recognition.
[10] ↑ Gashler, M.; Giraud-Carrier, C.; Martinez, T. (2008). «Decision Tree Ensemble: Small Heterogeneous is Better Than Large Homogeneous». Seventh International Conference on Machine Learning and Applications. ISBN 978-0-7695-3495-4. doi:10.1109/ICMLA.2008.154.: http://axon.cs.byu.edu/papers/gashler2008icmla.pdf
[11] ↑ Liu, Y.; Yao, X. (1999-12). «Ensemble learning via negative correlation». Neural Networks 12 (10): 1399-1404. ISSN 0893-6080. doi:10.1016/s0893-6080(99)00073-8. Consultado el 5 de marzo de 2024. - [https://doi.org/10.1016/S0893-6080(99)00073-8](https://doi.org/10.1016/S0893-6080(99)00073-8)
[12] ↑ Shoham, Ron; Permuter, Haim (2019). «"Amended Cross-Entropy Cost: An Approach for Encouraging Diversity in Classification Ensemble (Brief Announcement)"». Cyber Security Cryptography and Machine Learning. ISBN 978-3-030-20950-6. doi:10.1007/978-3-030-20951-3_18.: https://dx.doi.org/10.1007%2F978-3-030-20951-3_18
[13] ↑ Morishita, Terufumi; Morio, Gaku; Horiguchi, Shota; Ozaki, Hiroaki; Nukaga, Nobuo (28 de junio de 2022). «Rethinking Fano’s Inequality in Ensemble Learning». Proceedings of the 39th International Conference on Machine Learning (en inglés) (PMLR): 15976-16016. Consultado el 6 de marzo de 2024.: https://proceedings.mlr.press/v162/morishita22a.html
[14] ↑ Bonab, Hamed R.; Can, Fazli (24 de octubre de 2016). «A Theoretical Framework on the Ideal Number of Classifiers for Online Ensembles in Data Streams». Proceedings of the 25th ACM International on Conference on Information and Knowledge Management. CIKM '16 (Association for Computing Machinery): 2053-2056. ISBN 978-1-4503-4073-1. doi:10.1145/2983323.2983907. Consultado el 6 de marzo de 2024.: https://doi.org/10.1145/2983323.2983907
[15] ↑ Bonab, Hamed; Can, Fazli (2017). "Less is More: A Comprehensive Framework for the Number of Components of Ensemble Classifiers".
[16] ↑ Tom M. Mitchell (1997). Machine Learning.
[17] ↑ Salman, R., Alzaatreh, A., Sulieman, H., & Faisal, S. (2021). «A Bootstrap Framework for Aggregating within and between Feature Selection Methods». Entropy (Basel, Switzerland). doi:10.3390/e23020200.: https://dx.doi.org/10.3390%2Fe23020200
[18] ↑ Breiman, L., Bagging Predictors (1996). Machine Learning. doi:10.1007/BF00058655.: https://dx.doi.org/10.1007%2FBF00058655
[19] ↑ Brodeur, Z. P., Herman, J. D., & Steinschneider, S. (2020). «Bootstrap aggregation and cross-validation methods to reduce overfitting in reservoir control policy search». Water Resources Research. doi:10.1029/2020WR027184.: https://dx.doi.org/10.1029%2F2020WR027184
[20] ↑ Hoeting, Jennifer A.; Madigan, David; Raftery, Adrian E.; Volinsky, Chris T. (1999-11). «Bayesian model averaging: a tutorial (with comments by M. Clyde, David Draper and E. I. George, and a rejoinder by the authors». Statistical Science 14 (4): 382-417. ISSN 0883-4237. doi:10.1214/ss/1009212519. Consultado el 6 de marzo de 2024.: https://projecteuclid.org/journals/statistical-science/volume-14/issue-4/Bayesian-model-averaging--a-tutorial-with-comments-by-M/10.1214/ss/1009212519.full
[21] ↑ Chris Fraley; Adrian Raftery; J. McLean Sloughter; Tilmann Gneiting. ensembleBMA: Probabilistic Forecasting using Ensembles and Bayesian Model Averaging. Wikidata Q98972500.
[22] ↑ Sevcikova, Hana (23 de noviembre de 2023), hanase/BMA, consultado el 7 de marzo de 2024 .: https://github.com/hanase/BMA
[23] ↑ Adrian Raftery (1995). «"Bayesian model selection in social research"». Sociological Methodology. ISSN 0081-1750. doi:10.2307/271063.: https://es.wikipedia.org//portal.issn.org/resource/issn/0081-1750
[24] ↑ Merlise A. Clyde; Michael L. Littman; Quanli Wang; Joyee Ghosh; Yingbo Li; Don van den Bergh. BAS: Bayesian Variable Selection and Model Averaging using Bayesian Adaptive Sampling. Wikidata Q98974089.
[25] ↑ Gerda Claeskens; Nils Lid Hjort (2008). «Model selection and model averaging». Cambridge University Press. Wikidata Q62568358.
[26] ↑ Haussler, David; Kearns, Michael; Schapire, Robert E. (1 de enero de 1994). «Bounds on the sample complexity of Bayesian learning using information theory and the VC dimension». Machine Learning (en inglés) 14 (1): 83-113. ISSN 1573-0565. doi:10.1007/BF00993163. Consultado el 7 de marzo de 2024.: https://doi.org/10.1007/BF00993163
[27] ↑ Kenneth P. Burnham; David R. Anderson (2002). «Model Selection and Inference: A practical information-theoretic approach,». Springer Science+Business Media. Wikidata Q76889160.
[28] ↑ El artículo de Wikiversity sobre Searching R Packages menciona varias formas de encontrar paquetes disponibles para algo como esto. Por ejemplo, "sos::findFn('{Bayesian model averaging}')" desde dentro de R buscará archivos de ayuda en paquetes contribuidos que incluyan el término de búsqueda y abrirá dos pestañas en el navegador por defecto. La primera listará todos los archivos de ayuda encontrados ordenados por paquete. La segunda resume los paquetes encontrados, ordenados por la aparente fuerza de la coincidencia.
[29] ↑ Monteith, Kristine; Carroll, James; Seppi, Kevin; Martinez, Tony (2011). «Turning Bayesian Model Averaging into Bayesian Model Combination». Proceedings of the International Joint Conference on Neural Networks IJCNN'11.: http://axon.cs.byu.edu/papers/Kristine.ijcnn2011.pdf
[30] ↑ «CiteSeerX». CiteSeerX (en inglés). Consultado el 7 de marzo de 2024.: https://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.108.6096
[31] ↑ Bensusan, Hilan; Giraud-Carrier, Christophe (2000). «"Discovering Task Neighbourhoods through Landmark Learning Performances». Principles of Data Mining and Knowledge Discovery. Lecture Notes in Computer Science. Vol. 1910. ISBN 978-3-540-41066-9. doi:10.1007/3-540-45372-5_32.: https://link.springer.com/content/pdf/10.1007/3-540-45372-5_32.pdf
[32] ↑ «1.11. Ensembles: Gradient boosting, random forests, bagging, voting, stacking». scikit-learn (en inglés). Consultado el 7 de marzo de 2024.: https://scikit-learn/stable/modules/ensemble.html
[33] ↑ Wolpert (1992). «"Stacked Generalization"». Neural Networks. doi:10.1016/s0893-6080(05)80023-1.: https://dx.doi.org/10.1016%2Fs0893-6080%2805%2980023-1
[34] ↑ Breiman, Leo (1 de julio de 1996). «Stacked regressions». Machine Learning (en inglés) 24 (1): 49-64. ISSN 1573-0565. doi:10.1007/BF00117832. Consultado el 7 de marzo de 2024.: https://doi.org/10.1007/BF00117832
[35] ↑ Ozay, M.; Yarman Vural, F. T. A New Fuzzy Stacked Generalization Technique and Analysis of its Performance.
[36] ↑ Smyth, Padhraic; Wolpert, David (1999). «Linearly Combining Density Estimators via Stacking». Machine Learning. doi:10.1023/A:1007511322260.: https://link.springer.com/content/pdf/10.1023/A:1007511322260.pdf
[37] ↑ Wolpert, David H.; MacReady, William G. (1999). «"An Efficient Method to Estimate Bagging's Generalization Error"». Machine Learning. doi:10.1023/A:1007519102914.: https://link.springer.com/content/pdf/10.1023/A:1007519102914.pdf
[38] ↑ Clarke, B. (2003). «Bayes model averaging and stacking when model approximation error cannot be ignored». Journal of Machine Learning Research.: https://www.jmlr.org/papers/volume4/clarke03a/clarke03a.pdf
[39] ↑ Sill, J.; Takacs, G.; Mackey, L.; Lin, D. (2009). "Feature-Weighted Linear Stacking".
[40] ↑ Amini, Shahram M.; Parmeter, Christopher F. (2011). «Bayesian model averaging in R». Journal of Economic and Social Measurement. doi:10.3233/JEM-2011-0350.: https://core.ac.uk/download/pdf/6494889.pdf
[41] ↑ Hofmarcher, Martin Feldkircher and Stefan Zeugner and Paul (9 de agosto de 2022), BMS: Bayesian Model Averaging Library, consultado el 7 de marzo de 2024 .: https://cran.r-project.org/web/packages/BMS/index.html
[42] ↑ Clyde (ORCID=0000-0002-3595-1872), Merlise; Littman, Michael; Ghosh, Joyee; Li, Yingbo; Bersson, Betsy; Bergh, Don van de; Wang, Quanli (6 de diciembre de 2023), BAS: Bayesian Variable Selection and Model Averaging using Bayesian Adaptive Sampling, consultado el 7 de marzo de 2024 .: https://cran.r-project.org/web/packages/BAS/index.html
[43] ↑ Raftery, Adrian; Hoeting, Jennifer; Volinsky, Chris; Painter, Ian; Yeung, Ka Yee (22 de abril de 2022), BMA: Bayesian Model Averaging, consultado el 7 de marzo de 2024 .: https://cran.r-project.org/web/packages/BMA/index.html
[44] ↑ «Classification Ensembles - MATLAB & Simulink - MathWorks United Kingdom». uk.mathworks.com. Consultado el 7 de marzo de 2024.: https://uk.mathworks.com/help/stats/classification-ensembles.html
[45] ↑ a b Woźniak, Michał; Graña, Manuel; Corchado, Emilio (2014). «A survey of multiple classifier systems as hybrid systems». Information Fusion. doi:10.1016/j.inffus.2013.04.006.: https://dx.doi.org/10.1016%2Fj.inffus.2013.04.006
[46] ↑ a b Rodriguez-Galiano, V.F.; Ghimire, B.; Rogan, J.; Chica-Olmo, M.; Rigol-Sanchez, J.P. (2012). «"An assessment of the effectiveness of a random forest classifier for land-cover classification"». ISPRS Journal of Photogrammetry and Remote Sensing. doi:10.1016/j.isprsjprs.2011.11.002.: https://dx.doi.org/10.1016%2Fj.isprsjprs.2011.11.002
[47] ↑ Giacinto, Giorgio; Roli, Fabio (2001). «Design of effective neural network ensembles for image classification purposes"». Image and Vision Computing. doi:10.1016/S0262-8856(01)00045-2.: https://dx.doi.org/10.1016%2FS0262-8856%2801%2900045-2
[48] ↑ Xia, Junshi; Yokoya, Naoto; Iwasaki, Yakira (2017). «A novel ensemble classifier of hyperspectral and LiDAR data using morphological features"». 2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). ISBN 978-1-5090-4117-6. doi:10.1109/ICASSP.2017.7953345.: https://dx.doi.org/10.1109%2FICASSP.2017.7953345
[49] ↑ Mochizuki, S.; Murakami, T. (2012). «Accuracy comparison of land cover mapping using the object-oriented image classification with machine learning algorithms"». 33rd Asian Conference on Remote Sensing 2012, ACRS 2012.
[50] ↑ Liu, Dan; Toman, Elizabeth; Fuller, Zane; Chen, Gang; Londo, Alexis; Xuesong, Zhang; Kaiguang, Zhao (2018). «"Integration of historical map and aerial imagery to characterize long-term land-use change and landscape dynamics: An object-based analysis via Random Forests». Ecological Indicators. doi:10.1016/j.ecolind.2018.08.004.: https://pages.charlotte.edu/gang-chen/wp-content/uploads/sites/184/2018/08/Liu_2018_Intigration-historical-map-aerial-imagery-LCLUC.pdf
[51] ↑ Giacinto, G.; Roli, F.; Fumera, G. (2000). «"Design of effective multiple classifier systems by clustering of classifiers".». Proceedings 15th International Conference on Pattern Recognition. ICPR-2000. Vol. 2. ISBN 978-0-7695-0750-7. doi:10.1109/ICPR.2000.906039.: https://dx.doi.org/10.1109%2FICPR.2000.906039
[52] ↑ Du, Peijun; Liu, Sicong; Xia, Junshi; Zhao, Yindi (2013). «Information fusion techniques for change detection from multi-temporal remote sensing images». Information Fusion. doi:10.1016/j.inffus.2012.05.003.: https://dx.doi.org/10.1016%2Fj.inffus.2012.05.003
[53] ↑ Defined by Bruzzone et al. 2002 como "La clase de datos que recibe el mayor número de votos se toma como clase del patrón de entrada", se trata de mayoría simple, más exactamente descrita como votación por pluralidad.
[54] ↑ «1-s2.0-S0034425719301853-main.pdf». Google Docs. Consultado el 7 de marzo de 2024.: https://drive.google.com/file/d/1MFZ0FpK1NwTieVSAf5jicLgl85Lm48uh/view?usp=embed_facebook
[55] ↑ Bruzzone, Lorenzo; Cossu, Roberto; Vernazza, Gianni (2002). «"Combining parametric and non-parametric algorithms for a partially unsupervised classification of multitemporal remote-sensing images». Information Fusion. doi:10.1016/S1566-2535(02)00091-X.: http://eprints.biblio.unitn.it/105/1/24.pdf
[56] ↑ Mugiraneza, Theodomir; Nascetti, Andrea; Ban, Yifang (2020-01). «Continuous Monitoring of Urban Land Cover Change Trajectories with Landsat Time Series and LandTrendr-Google Earth Engine Cloud Computing». Remote Sensing (en inglés) 12 (18): 2883. ISSN 2072-4292. doi:10.3390/rs12182883. Consultado el 7 de marzo de 2024.: https://www.mdpi.com/2072-4292/12/18/2883
[57] ↑ zhaokg (6 de marzo de 2024), zhaokg/Rbeast, consultado el 7 de marzo de 2024 .: https://github.com/zhaokg/Rbeast
[58] ↑ Raj Kumar, P. Arun; Selvakumar, S. (2011). «Distributed denial of service attack detection using an ensemble of neural classifier». Computer Communications. doi:10.1016/j.comcom.2011.01.012.: https://dx.doi.org/10.1016%2Fj.comcom.2011.01.012
[59] ↑ Shabtai, Asaf; Moskovitch, Robert; Elovici, Yuval; Glezer, Chanan (2009). «"Detection of malicious code by applying machine learning classifiers on static features: A state-of-the-art survey"». Information Security Technical Report. doi:10.1016/j.istr.2009.03.003.: https://dx.doi.org/10.1016%2Fj.istr.2009.03.003
[60] ↑ Zhang, Boyun; Yin, Jianping; Hao, Jingbo; Zhang, Dingxing; Wang, Shulin (2007). «Malicious Codes Detection Based on Ensemble Learning». Autonomic and Trusted Computing. Lecture Notes in Computer Science. ISBN 978-3-540-73546-5. doi:10.1007/978-3-540-73547-2_48.: https://dx.doi.org/10.1007%2F978-3-540-73547-2_48
[61] ↑ Menahem, Eitan; Shabtai, Asaf; Rokach, Lior; Elovici, Yuval (2009). «"Improving malware detection by applying multi-inducer ensemble"». Computational Statistics & Data Analysis. doi:10.1016/j.csda.2008.10.015.: https://dx.doi.org/10.1016%2Fj.csda.2008.10.015
[62] ↑ Locasto, Michael E.; Wang, Ke; Keromytis, Angeles D.; Salvatore, J. Stolfo (2005). «"FLIPS: Hybrid Adaptive Intrusion Prevention"». Recent Advances in Intrusion Detection. Lecture Notes in Computer Science. PMID 978-3-540-31778-4 |pmid= incorrecto (ayuda). doi:10.1007/11663812_5.: https://es.wikipedia.org//www.ncbi.nlm.nih.gov/pubmed/978-3-540-31778-4
[63] ↑ Giacinto, Giorgio; Perdisci, Roberto; Del Rio, Mauro; Roli, Fabio (2008). «"Intrusion detection in computer networks by a modular ensemble of one-class classifiers"». Information Fusion. doi:10.1016/j.inffus.2006.10.002.: https://dx.doi.org/10.1016%2Fj.inffus.2006.10.002
[64] ↑ Mu, Xiaoyan; Lu, Jiangfeng; Watta, Paul; Hassoun, Mohamad H. (2009). «"Weighted voting-based ensemble classifiers with application to human face recognition and voice recognition".». 2009 International Joint Conference on Neural Networks. doi:10.1109/IJCNN.2009.5178708.: https://dx.doi.org/10.1109%2FIJCNN.2009.5178708
[65] ↑ Yu, Su; Shan, Shiguang; Chen, Xilin; Gao, Wen (2006). «Hierarchical ensemble of Gabor Fisher classifier for face recognition». 7th International Conference on Automatic Face and Gesture Recognition (FGR06). ISBN 978-0-7695-2503-7. doi:10.1109/FGR.2006.64.: https://dx.doi.org/10.1109%2FFGR.2006.64
[66] ↑ Su, Y.; Shan, S.; Chen, X.; Gao, W. (2006). «"Patch-Based Gabor Fisher Classifier for Face Recognition"». 18th International Conference on Pattern Recognition (ICPR'06). ISBN 978-0-7695-2521-1. doi:10.1109/ICPR.2006.917.: https://dx.doi.org/10.1109%2FICPR.2006.917
[67] ↑ Liu, Yang; Lin, Yongzheng; Chen, Yuehui (2008). «"Ensemble Classification Based on ICA for Face Recognition".». 2008 Congress on Image and Signal Processing. ISBN 978-0-7695-3119-9. doi:10.1109/CISP.2008.581.: https://dx.doi.org/10.1109%2FCISP.2008.581
[68] ↑ Rieger, Steven A.; Muraleedharan, Rajani; Ramachandran, Ravi P. (2014). «"Speech based emotion recognition using spectral feature extraction and an ensemble of KNN classifiers"». The 9th International Symposium on Chinese Spoken Language Processing. ISBN 978-1-4799-4219-0. doi:10.1109/ISCSLP.2014.6936711.: https://dx.doi.org/10.1109%2FISCSLP.2014.6936711
[69] ↑ Krajewski, Jarek; Batliner, Anton; Kessel, Silke (2010). «"Comparing Multiple Classifiers for Speech-Based Detection of Self-Confidence - A Pilot Study». 2010 20th International Conference on Pattern Recognition. ISBN 978-1-4244-7542-1. doi:10.1109/ICPR.2010.905.: https://dx.doi.org/10.1109%2FICPR.2010.905
[70] ↑ Rani, P. Ithaya; Muneeswaran, K. (2016). «"Recognize the facial emotion in video sequences using eye and mouth temporal Gabor features». Multimedia Tools and Applications. doi:10.1007/s11042-016-3592-y.: https://dx.doi.org/10.1007%2Fs11042-016-3592-y
[71] ↑ Rani, P. Ithaya; Muneeswaran, K. (2016). «"Facial Emotion Recognition Based on Eye and Mouth Regions".». International Journal of Pattern Recognition and Artificial Intelligence. doi:10.1142/S021800141655020X.: https://dx.doi.org/10.1142%2FS021800141655020X
[72] ↑ RANI, P. ITHAYA; MUNEESWARAN, K. (28 de marzo de 2018). «Emotion recognition based on facial components». Sādhanā (en inglés) 43 (3): 48. ISSN 0973-7677. doi:10.1007/s12046-018-0801-6. Consultado el 8 de marzo de 2024.: https://doi.org/10.1007/s12046-018-0801-6
[73] ↑ Louzada, Francisco; Ara, Anderson (2012). «Bagging k-dependence probabilistic networks: An alternative powerful fraud detection tool». Expert Systems with Applications. doi:10.1016/j.eswa.2012.04.024.: https://dx.doi.org/10.1016%2Fj.eswa.2012.04.024
[74] ↑ Sundarkumar, G. Ganesh; Ravi, Vadlamani (2015). «"A novel hybrid undersampling method for mining unbalanced datasets in banking and insurance"». Engineering Applications of Artificial Intelligence. doi:10.1016/j.engappai.2014.09.019.: https://dx.doi.org/10.1016%2Fj.engappai.2014.09.019
[75] ↑ a b Kim, Yoonseong; Sohn, So Young (2012). «"Stock fraud detection using peer group analysis"». Expert Systems with Applications. doi:10.1016/j.eswa.2012.02.025.: https://dx.doi.org/10.1016%2Fj.eswa.2012.02.025
[76] ↑ Savio, A.; García-Sebastián, M.T.; Chyzyk, D.; Hernandez, C.; Graña, M.; Sistiaga, A.; López de Munain, A.; Villanúa, J. (2011). «"Neurocognitive disorder detection based on feature vectors extracted from VBM analysis of structural MRI".». Computers in Biology and Medicine. doi:10.1016/j.compbiomed.2011.05.010.: https://dx.doi.org/10.1016%2Fj.compbiomed.2011.05.010
[77] ↑ Ayerdi, B.; Savio, A.; Graña, M. (2013). «Meta-ensembles of Classifiers for Alzheimer's Disease Detection Using Independent ROI Features». Natural and Artificial Computation in Engineering and Medical Applications. Lecture Notes in Computer Science. ISBN 978-3-642-38621-3. doi:10.1007/978-3-642-38622-0_13.: https://dx.doi.org/10.1007%2F978-3-642-38622-0_13
[78] ↑ Gu, Quan; Ding, Yong-Sheng; Zhang, Tong-Liang (2015). «"An ensemble classifier based prediction of G-protein-coupled receptor classes in low homology"». Neurocomputing. doi:10.1016/j.neucom.2014.12.013.: https://dx.doi.org/10.1016%2Fj.neucom.2014.12.013
[79] ↑ Xue, Dan; Zhou, Xiaomin; Li, Chen; Yao, Yudong; Rahaman, Md Mamunur; Zhang, Jinghua; Chen, Hao; Zhang, Jinpeng et al. (2020). «An Application of Transfer Learning and Ensemble Learning Techniques for Cervical Histopathology Image Classification». IEEE Access 8: 104603-104618. ISSN 2169-3536. doi:10.1109/ACCESS.2020.2999816. Consultado el 8 de marzo de 2024. Se sugiere usar |número-autores= (ayuda).: https://ieeexplore.ieee.org/document/9107128/
[80] ↑ Manna, Ankur; Kundu, Rohit; Kaplun, Dmitrii; Sinitca, Aleksandr; Sarkar, Ram (2021). «"A fuzzy rank-based ensemble of CNN models for classification of cervical cytology». Scientific Reports. PMID 34267261. doi:10.1038/s41598-021-93783-8.: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC8282795

Tipos comuns de conjuntos

Classificador bayesiano ideal

Esta fórmula pode ser reformulada utilizando o teorema de Bayes, que diz que a probabilidade posterior é proporcional à probabilidade multiplicada pela probabilidade anterior:.

portanto,.

Agregação de bootstrap (ensaque)

Impulsionando

Média do modelo bayesiano

Combinação bayesiana de modelos

Balde de modelos

O método mais comumente usado para seleção de modelos é a validação cruzada (às vezes chamada de “concurso de panificação”). É descrito com o seguinte pseudocódigo:

A seleção por validação cruzada pode ser resumida como: “experimente todos eles contra o conjunto de treinamento e escolha aquele que funciona melhor”.[30].

Empilhamento

Voto

Votar é outra forma de assembleia. Veja, por exemplo, o algoritmo de maioria ponderada (aprendizado de máquina).

Aplicações de aprendizagem em conjunto

Contenido

Sensoriamento remoto

Segurança informática

reconhecimento facial

Reconhecimento de emoções

Também está sendo usado com sucesso no reconhecimento de emoções faciais").[70][71][72].

Detecção de fraude

Tomada de decisão financeira

Medicamento

Referências

[1] ↑ Opitz, D.; Maclin, R. (1 de agosto de 1999). «Popular Ensemble Methods: An Empirical Study». Journal of Artificial Intelligence Research (en inglés) 11: 169-198. ISSN 1076-9757. doi:10.1613/jair.614. Consultado el 5 de marzo de 2024.: https://jair.org/index.php/jair/article/view/10239
[2] ↑ Polikar, R. (2006). «"Ensemble based systems in decision making"». IEEE Circuits and Systems Magazine. doi:10.1109/MCAS.2006.1688199.: https://dx.doi.org/10.1109%2FMCAS.2006.1688199
[3] ↑ a b Rokach, L. (2010). «"Ensemble-based classifiers"». Artificial Intelligence Review. doi:10.1007/s10462-009-9124-7.: https://dx.doi.org/10.1007%2Fs10462-009-9124-7
[4] ↑ Blockeel H. (2011). «"Hypothesis Space"». Encyclopedia of Machine Learning. ISBN 978-0-387-30768-8. doi:10.1007/978-0-387-30164-8_373.: https://lirias.kuleuven.be/handle/123456789/298291
[5] ↑ Kuncheva, L. and Whitaker, C. (2003). «Measures of diversity in classifier ensembles». Machine Learning.: https://link.springer.com/content/pdf/10.1023/A:1022859003006.pdf
[6] ↑ Sollich, P. and Krogh, A. (1996). «Learning with ensembles: How overfitting can be useful». Advances in Neural Information Processing Systems, volume 8.: https://proceedings.neurips.cc/paper/1995/file/1019c8091693ef5c5f55970346633f92-Paper.pdf
[7] ↑ Brown, G. and Wyatt, J. and Harris, R. and Yao, X. (2005). «Diversity creation methods: a survey and categorisation». Information Fusion.: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.421.349&rep=rep1&type=pdf
[8] ↑ Adeva, Juan Jose Garcıa; Beresi, Ulises Cervino; Calvo, Rafael A. (1 de diciembre de 2005). «Accuracy and Diversity in Ensembles of Text Categorisers». CLEI Electronic Journal (en inglés) 8 (2): 1:1-1:12. ISSN 0717-5000. doi:10.19153/cleiej.8.2.1. Consultado el 5 de marzo de 2024.: https://www.clei.org/cleiej/index.php/cleiej/article/view/319
[9] ↑ Ho, T. (1995). «Random Decision Forests». Proceedings of the Third International Conference on Document Analysis and Recognition.
[10] ↑ Gashler, M.; Giraud-Carrier, C.; Martinez, T. (2008). «Decision Tree Ensemble: Small Heterogeneous is Better Than Large Homogeneous». Seventh International Conference on Machine Learning and Applications. ISBN 978-0-7695-3495-4. doi:10.1109/ICMLA.2008.154.: http://axon.cs.byu.edu/papers/gashler2008icmla.pdf
[11] ↑ Liu, Y.; Yao, X. (1999-12). «Ensemble learning via negative correlation». Neural Networks 12 (10): 1399-1404. ISSN 0893-6080. doi:10.1016/s0893-6080(99)00073-8. Consultado el 5 de marzo de 2024. - [https://doi.org/10.1016/S0893-6080(99)00073-8](https://doi.org/10.1016/S0893-6080(99)00073-8)
[12] ↑ Shoham, Ron; Permuter, Haim (2019). «"Amended Cross-Entropy Cost: An Approach for Encouraging Diversity in Classification Ensemble (Brief Announcement)"». Cyber Security Cryptography and Machine Learning. ISBN 978-3-030-20950-6. doi:10.1007/978-3-030-20951-3_18.: https://dx.doi.org/10.1007%2F978-3-030-20951-3_18
[13] ↑ Morishita, Terufumi; Morio, Gaku; Horiguchi, Shota; Ozaki, Hiroaki; Nukaga, Nobuo (28 de junio de 2022). «Rethinking Fano’s Inequality in Ensemble Learning». Proceedings of the 39th International Conference on Machine Learning (en inglés) (PMLR): 15976-16016. Consultado el 6 de marzo de 2024.: https://proceedings.mlr.press/v162/morishita22a.html
[14] ↑ Bonab, Hamed R.; Can, Fazli (24 de octubre de 2016). «A Theoretical Framework on the Ideal Number of Classifiers for Online Ensembles in Data Streams». Proceedings of the 25th ACM International on Conference on Information and Knowledge Management. CIKM '16 (Association for Computing Machinery): 2053-2056. ISBN 978-1-4503-4073-1. doi:10.1145/2983323.2983907. Consultado el 6 de marzo de 2024.: https://doi.org/10.1145/2983323.2983907
[15] ↑ Bonab, Hamed; Can, Fazli (2017). "Less is More: A Comprehensive Framework for the Number of Components of Ensemble Classifiers".
[16] ↑ Tom M. Mitchell (1997). Machine Learning.
[17] ↑ Salman, R., Alzaatreh, A., Sulieman, H., & Faisal, S. (2021). «A Bootstrap Framework for Aggregating within and between Feature Selection Methods». Entropy (Basel, Switzerland). doi:10.3390/e23020200.: https://dx.doi.org/10.3390%2Fe23020200
[18] ↑ Breiman, L., Bagging Predictors (1996). Machine Learning. doi:10.1007/BF00058655.: https://dx.doi.org/10.1007%2FBF00058655
[19] ↑ Brodeur, Z. P., Herman, J. D., & Steinschneider, S. (2020). «Bootstrap aggregation and cross-validation methods to reduce overfitting in reservoir control policy search». Water Resources Research. doi:10.1029/2020WR027184.: https://dx.doi.org/10.1029%2F2020WR027184
[20] ↑ Hoeting, Jennifer A.; Madigan, David; Raftery, Adrian E.; Volinsky, Chris T. (1999-11). «Bayesian model averaging: a tutorial (with comments by M. Clyde, David Draper and E. I. George, and a rejoinder by the authors». Statistical Science 14 (4): 382-417. ISSN 0883-4237. doi:10.1214/ss/1009212519. Consultado el 6 de marzo de 2024.: https://projecteuclid.org/journals/statistical-science/volume-14/issue-4/Bayesian-model-averaging--a-tutorial-with-comments-by-M/10.1214/ss/1009212519.full
[21] ↑ Chris Fraley; Adrian Raftery; J. McLean Sloughter; Tilmann Gneiting. ensembleBMA: Probabilistic Forecasting using Ensembles and Bayesian Model Averaging. Wikidata Q98972500.
[22] ↑ Sevcikova, Hana (23 de noviembre de 2023), hanase/BMA, consultado el 7 de marzo de 2024 .: https://github.com/hanase/BMA
[23] ↑ Adrian Raftery (1995). «"Bayesian model selection in social research"». Sociological Methodology. ISSN 0081-1750. doi:10.2307/271063.: https://es.wikipedia.org//portal.issn.org/resource/issn/0081-1750
[24] ↑ Merlise A. Clyde; Michael L. Littman; Quanli Wang; Joyee Ghosh; Yingbo Li; Don van den Bergh. BAS: Bayesian Variable Selection and Model Averaging using Bayesian Adaptive Sampling. Wikidata Q98974089.
[25] ↑ Gerda Claeskens; Nils Lid Hjort (2008). «Model selection and model averaging». Cambridge University Press. Wikidata Q62568358.
[26] ↑ Haussler, David; Kearns, Michael; Schapire, Robert E. (1 de enero de 1994). «Bounds on the sample complexity of Bayesian learning using information theory and the VC dimension». Machine Learning (en inglés) 14 (1): 83-113. ISSN 1573-0565. doi:10.1007/BF00993163. Consultado el 7 de marzo de 2024.: https://doi.org/10.1007/BF00993163
[27] ↑ Kenneth P. Burnham; David R. Anderson (2002). «Model Selection and Inference: A practical information-theoretic approach,». Springer Science+Business Media. Wikidata Q76889160.
[28] ↑ El artículo de Wikiversity sobre Searching R Packages menciona varias formas de encontrar paquetes disponibles para algo como esto. Por ejemplo, "sos::findFn('{Bayesian model averaging}')" desde dentro de R buscará archivos de ayuda en paquetes contribuidos que incluyan el término de búsqueda y abrirá dos pestañas en el navegador por defecto. La primera listará todos los archivos de ayuda encontrados ordenados por paquete. La segunda resume los paquetes encontrados, ordenados por la aparente fuerza de la coincidencia.
[29] ↑ Monteith, Kristine; Carroll, James; Seppi, Kevin; Martinez, Tony (2011). «Turning Bayesian Model Averaging into Bayesian Model Combination». Proceedings of the International Joint Conference on Neural Networks IJCNN'11.: http://axon.cs.byu.edu/papers/Kristine.ijcnn2011.pdf
[30] ↑ «CiteSeerX». CiteSeerX (en inglés). Consultado el 7 de marzo de 2024.: https://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.108.6096
[31] ↑ Bensusan, Hilan; Giraud-Carrier, Christophe (2000). «"Discovering Task Neighbourhoods through Landmark Learning Performances». Principles of Data Mining and Knowledge Discovery. Lecture Notes in Computer Science. Vol. 1910. ISBN 978-3-540-41066-9. doi:10.1007/3-540-45372-5_32.: https://link.springer.com/content/pdf/10.1007/3-540-45372-5_32.pdf
[32] ↑ «1.11. Ensembles: Gradient boosting, random forests, bagging, voting, stacking». scikit-learn (en inglés). Consultado el 7 de marzo de 2024.: https://scikit-learn/stable/modules/ensemble.html
[33] ↑ Wolpert (1992). «"Stacked Generalization"». Neural Networks. doi:10.1016/s0893-6080(05)80023-1.: https://dx.doi.org/10.1016%2Fs0893-6080%2805%2980023-1
[34] ↑ Breiman, Leo (1 de julio de 1996). «Stacked regressions». Machine Learning (en inglés) 24 (1): 49-64. ISSN 1573-0565. doi:10.1007/BF00117832. Consultado el 7 de marzo de 2024.: https://doi.org/10.1007/BF00117832
[35] ↑ Ozay, M.; Yarman Vural, F. T. A New Fuzzy Stacked Generalization Technique and Analysis of its Performance.
[36] ↑ Smyth, Padhraic; Wolpert, David (1999). «Linearly Combining Density Estimators via Stacking». Machine Learning. doi:10.1023/A:1007511322260.: https://link.springer.com/content/pdf/10.1023/A:1007511322260.pdf
[37] ↑ Wolpert, David H.; MacReady, William G. (1999). «"An Efficient Method to Estimate Bagging's Generalization Error"». Machine Learning. doi:10.1023/A:1007519102914.: https://link.springer.com/content/pdf/10.1023/A:1007519102914.pdf
[38] ↑ Clarke, B. (2003). «Bayes model averaging and stacking when model approximation error cannot be ignored». Journal of Machine Learning Research.: https://www.jmlr.org/papers/volume4/clarke03a/clarke03a.pdf
[39] ↑ Sill, J.; Takacs, G.; Mackey, L.; Lin, D. (2009). "Feature-Weighted Linear Stacking".
[40] ↑ Amini, Shahram M.; Parmeter, Christopher F. (2011). «Bayesian model averaging in R». Journal of Economic and Social Measurement. doi:10.3233/JEM-2011-0350.: https://core.ac.uk/download/pdf/6494889.pdf
[41] ↑ Hofmarcher, Martin Feldkircher and Stefan Zeugner and Paul (9 de agosto de 2022), BMS: Bayesian Model Averaging Library, consultado el 7 de marzo de 2024 .: https://cran.r-project.org/web/packages/BMS/index.html
[42] ↑ Clyde (ORCID=0000-0002-3595-1872), Merlise; Littman, Michael; Ghosh, Joyee; Li, Yingbo; Bersson, Betsy; Bergh, Don van de; Wang, Quanli (6 de diciembre de 2023), BAS: Bayesian Variable Selection and Model Averaging using Bayesian Adaptive Sampling, consultado el 7 de marzo de 2024 .: https://cran.r-project.org/web/packages/BAS/index.html
[43] ↑ Raftery, Adrian; Hoeting, Jennifer; Volinsky, Chris; Painter, Ian; Yeung, Ka Yee (22 de abril de 2022), BMA: Bayesian Model Averaging, consultado el 7 de marzo de 2024 .: https://cran.r-project.org/web/packages/BMA/index.html
[44] ↑ «Classification Ensembles - MATLAB & Simulink - MathWorks United Kingdom». uk.mathworks.com. Consultado el 7 de marzo de 2024.: https://uk.mathworks.com/help/stats/classification-ensembles.html
[45] ↑ a b Woźniak, Michał; Graña, Manuel; Corchado, Emilio (2014). «A survey of multiple classifier systems as hybrid systems». Information Fusion. doi:10.1016/j.inffus.2013.04.006.: https://dx.doi.org/10.1016%2Fj.inffus.2013.04.006
[46] ↑ a b Rodriguez-Galiano, V.F.; Ghimire, B.; Rogan, J.; Chica-Olmo, M.; Rigol-Sanchez, J.P. (2012). «"An assessment of the effectiveness of a random forest classifier for land-cover classification"». ISPRS Journal of Photogrammetry and Remote Sensing. doi:10.1016/j.isprsjprs.2011.11.002.: https://dx.doi.org/10.1016%2Fj.isprsjprs.2011.11.002
[47] ↑ Giacinto, Giorgio; Roli, Fabio (2001). «Design of effective neural network ensembles for image classification purposes"». Image and Vision Computing. doi:10.1016/S0262-8856(01)00045-2.: https://dx.doi.org/10.1016%2FS0262-8856%2801%2900045-2
[48] ↑ Xia, Junshi; Yokoya, Naoto; Iwasaki, Yakira (2017). «A novel ensemble classifier of hyperspectral and LiDAR data using morphological features"». 2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). ISBN 978-1-5090-4117-6. doi:10.1109/ICASSP.2017.7953345.: https://dx.doi.org/10.1109%2FICASSP.2017.7953345
[49] ↑ Mochizuki, S.; Murakami, T. (2012). «Accuracy comparison of land cover mapping using the object-oriented image classification with machine learning algorithms"». 33rd Asian Conference on Remote Sensing 2012, ACRS 2012.
[50] ↑ Liu, Dan; Toman, Elizabeth; Fuller, Zane; Chen, Gang; Londo, Alexis; Xuesong, Zhang; Kaiguang, Zhao (2018). «"Integration of historical map and aerial imagery to characterize long-term land-use change and landscape dynamics: An object-based analysis via Random Forests». Ecological Indicators. doi:10.1016/j.ecolind.2018.08.004.: https://pages.charlotte.edu/gang-chen/wp-content/uploads/sites/184/2018/08/Liu_2018_Intigration-historical-map-aerial-imagery-LCLUC.pdf
[51] ↑ Giacinto, G.; Roli, F.; Fumera, G. (2000). «"Design of effective multiple classifier systems by clustering of classifiers".». Proceedings 15th International Conference on Pattern Recognition. ICPR-2000. Vol. 2. ISBN 978-0-7695-0750-7. doi:10.1109/ICPR.2000.906039.: https://dx.doi.org/10.1109%2FICPR.2000.906039
[52] ↑ Du, Peijun; Liu, Sicong; Xia, Junshi; Zhao, Yindi (2013). «Information fusion techniques for change detection from multi-temporal remote sensing images». Information Fusion. doi:10.1016/j.inffus.2012.05.003.: https://dx.doi.org/10.1016%2Fj.inffus.2012.05.003
[53] ↑ Defined by Bruzzone et al. 2002 como "La clase de datos que recibe el mayor número de votos se toma como clase del patrón de entrada", se trata de mayoría simple, más exactamente descrita como votación por pluralidad.
[54] ↑ «1-s2.0-S0034425719301853-main.pdf». Google Docs. Consultado el 7 de marzo de 2024.: https://drive.google.com/file/d/1MFZ0FpK1NwTieVSAf5jicLgl85Lm48uh/view?usp=embed_facebook
[55] ↑ Bruzzone, Lorenzo; Cossu, Roberto; Vernazza, Gianni (2002). «"Combining parametric and non-parametric algorithms for a partially unsupervised classification of multitemporal remote-sensing images». Information Fusion. doi:10.1016/S1566-2535(02)00091-X.: http://eprints.biblio.unitn.it/105/1/24.pdf
[56] ↑ Mugiraneza, Theodomir; Nascetti, Andrea; Ban, Yifang (2020-01). «Continuous Monitoring of Urban Land Cover Change Trajectories with Landsat Time Series and LandTrendr-Google Earth Engine Cloud Computing». Remote Sensing (en inglés) 12 (18): 2883. ISSN 2072-4292. doi:10.3390/rs12182883. Consultado el 7 de marzo de 2024.: https://www.mdpi.com/2072-4292/12/18/2883
[57] ↑ zhaokg (6 de marzo de 2024), zhaokg/Rbeast, consultado el 7 de marzo de 2024 .: https://github.com/zhaokg/Rbeast
[58] ↑ Raj Kumar, P. Arun; Selvakumar, S. (2011). «Distributed denial of service attack detection using an ensemble of neural classifier». Computer Communications. doi:10.1016/j.comcom.2011.01.012.: https://dx.doi.org/10.1016%2Fj.comcom.2011.01.012
[59] ↑ Shabtai, Asaf; Moskovitch, Robert; Elovici, Yuval; Glezer, Chanan (2009). «"Detection of malicious code by applying machine learning classifiers on static features: A state-of-the-art survey"». Information Security Technical Report. doi:10.1016/j.istr.2009.03.003.: https://dx.doi.org/10.1016%2Fj.istr.2009.03.003
[60] ↑ Zhang, Boyun; Yin, Jianping; Hao, Jingbo; Zhang, Dingxing; Wang, Shulin (2007). «Malicious Codes Detection Based on Ensemble Learning». Autonomic and Trusted Computing. Lecture Notes in Computer Science. ISBN 978-3-540-73546-5. doi:10.1007/978-3-540-73547-2_48.: https://dx.doi.org/10.1007%2F978-3-540-73547-2_48
[61] ↑ Menahem, Eitan; Shabtai, Asaf; Rokach, Lior; Elovici, Yuval (2009). «"Improving malware detection by applying multi-inducer ensemble"». Computational Statistics & Data Analysis. doi:10.1016/j.csda.2008.10.015.: https://dx.doi.org/10.1016%2Fj.csda.2008.10.015
[62] ↑ Locasto, Michael E.; Wang, Ke; Keromytis, Angeles D.; Salvatore, J. Stolfo (2005). «"FLIPS: Hybrid Adaptive Intrusion Prevention"». Recent Advances in Intrusion Detection. Lecture Notes in Computer Science. PMID 978-3-540-31778-4 |pmid= incorrecto (ayuda). doi:10.1007/11663812_5.: https://es.wikipedia.org//www.ncbi.nlm.nih.gov/pubmed/978-3-540-31778-4
[63] ↑ Giacinto, Giorgio; Perdisci, Roberto; Del Rio, Mauro; Roli, Fabio (2008). «"Intrusion detection in computer networks by a modular ensemble of one-class classifiers"». Information Fusion. doi:10.1016/j.inffus.2006.10.002.: https://dx.doi.org/10.1016%2Fj.inffus.2006.10.002
[64] ↑ Mu, Xiaoyan; Lu, Jiangfeng; Watta, Paul; Hassoun, Mohamad H. (2009). «"Weighted voting-based ensemble classifiers with application to human face recognition and voice recognition".». 2009 International Joint Conference on Neural Networks. doi:10.1109/IJCNN.2009.5178708.: https://dx.doi.org/10.1109%2FIJCNN.2009.5178708
[65] ↑ Yu, Su; Shan, Shiguang; Chen, Xilin; Gao, Wen (2006). «Hierarchical ensemble of Gabor Fisher classifier for face recognition». 7th International Conference on Automatic Face and Gesture Recognition (FGR06). ISBN 978-0-7695-2503-7. doi:10.1109/FGR.2006.64.: https://dx.doi.org/10.1109%2FFGR.2006.64
[66] ↑ Su, Y.; Shan, S.; Chen, X.; Gao, W. (2006). «"Patch-Based Gabor Fisher Classifier for Face Recognition"». 18th International Conference on Pattern Recognition (ICPR'06). ISBN 978-0-7695-2521-1. doi:10.1109/ICPR.2006.917.: https://dx.doi.org/10.1109%2FICPR.2006.917
[67] ↑ Liu, Yang; Lin, Yongzheng; Chen, Yuehui (2008). «"Ensemble Classification Based on ICA for Face Recognition".». 2008 Congress on Image and Signal Processing. ISBN 978-0-7695-3119-9. doi:10.1109/CISP.2008.581.: https://dx.doi.org/10.1109%2FCISP.2008.581
[68] ↑ Rieger, Steven A.; Muraleedharan, Rajani; Ramachandran, Ravi P. (2014). «"Speech based emotion recognition using spectral feature extraction and an ensemble of KNN classifiers"». The 9th International Symposium on Chinese Spoken Language Processing. ISBN 978-1-4799-4219-0. doi:10.1109/ISCSLP.2014.6936711.: https://dx.doi.org/10.1109%2FISCSLP.2014.6936711
[69] ↑ Krajewski, Jarek; Batliner, Anton; Kessel, Silke (2010). «"Comparing Multiple Classifiers for Speech-Based Detection of Self-Confidence - A Pilot Study». 2010 20th International Conference on Pattern Recognition. ISBN 978-1-4244-7542-1. doi:10.1109/ICPR.2010.905.: https://dx.doi.org/10.1109%2FICPR.2010.905
[70] ↑ Rani, P. Ithaya; Muneeswaran, K. (2016). «"Recognize the facial emotion in video sequences using eye and mouth temporal Gabor features». Multimedia Tools and Applications. doi:10.1007/s11042-016-3592-y.: https://dx.doi.org/10.1007%2Fs11042-016-3592-y
[71] ↑ Rani, P. Ithaya; Muneeswaran, K. (2016). «"Facial Emotion Recognition Based on Eye and Mouth Regions".». International Journal of Pattern Recognition and Artificial Intelligence. doi:10.1142/S021800141655020X.: https://dx.doi.org/10.1142%2FS021800141655020X
[72] ↑ RANI, P. ITHAYA; MUNEESWARAN, K. (28 de marzo de 2018). «Emotion recognition based on facial components». Sādhanā (en inglés) 43 (3): 48. ISSN 0973-7677. doi:10.1007/s12046-018-0801-6. Consultado el 8 de marzo de 2024.: https://doi.org/10.1007/s12046-018-0801-6
[73] ↑ Louzada, Francisco; Ara, Anderson (2012). «Bagging k-dependence probabilistic networks: An alternative powerful fraud detection tool». Expert Systems with Applications. doi:10.1016/j.eswa.2012.04.024.: https://dx.doi.org/10.1016%2Fj.eswa.2012.04.024
[74] ↑ Sundarkumar, G. Ganesh; Ravi, Vadlamani (2015). «"A novel hybrid undersampling method for mining unbalanced datasets in banking and insurance"». Engineering Applications of Artificial Intelligence. doi:10.1016/j.engappai.2014.09.019.: https://dx.doi.org/10.1016%2Fj.engappai.2014.09.019
[75] ↑ a b Kim, Yoonseong; Sohn, So Young (2012). «"Stock fraud detection using peer group analysis"». Expert Systems with Applications. doi:10.1016/j.eswa.2012.02.025.: https://dx.doi.org/10.1016%2Fj.eswa.2012.02.025
[76] ↑ Savio, A.; García-Sebastián, M.T.; Chyzyk, D.; Hernandez, C.; Graña, M.; Sistiaga, A.; López de Munain, A.; Villanúa, J. (2011). «"Neurocognitive disorder detection based on feature vectors extracted from VBM analysis of structural MRI".». Computers in Biology and Medicine. doi:10.1016/j.compbiomed.2011.05.010.: https://dx.doi.org/10.1016%2Fj.compbiomed.2011.05.010
[77] ↑ Ayerdi, B.; Savio, A.; Graña, M. (2013). «Meta-ensembles of Classifiers for Alzheimer's Disease Detection Using Independent ROI Features». Natural and Artificial Computation in Engineering and Medical Applications. Lecture Notes in Computer Science. ISBN 978-3-642-38621-3. doi:10.1007/978-3-642-38622-0_13.: https://dx.doi.org/10.1007%2F978-3-642-38622-0_13
[78] ↑ Gu, Quan; Ding, Yong-Sheng; Zhang, Tong-Liang (2015). «"An ensemble classifier based prediction of G-protein-coupled receptor classes in low homology"». Neurocomputing. doi:10.1016/j.neucom.2014.12.013.: https://dx.doi.org/10.1016%2Fj.neucom.2014.12.013
[79] ↑ Xue, Dan; Zhou, Xiaomin; Li, Chen; Yao, Yudong; Rahaman, Md Mamunur; Zhang, Jinghua; Chen, Hao; Zhang, Jinpeng et al. (2020). «An Application of Transfer Learning and Ensemble Learning Techniques for Cervical Histopathology Image Classification». IEEE Access 8: 104603-104618. ISSN 2169-3536. doi:10.1109/ACCESS.2020.2999816. Consultado el 8 de marzo de 2024. Se sugiere usar |número-autores= (ayuda).: https://ieeexplore.ieee.org/document/9107128/
[80] ↑ Manna, Ankur; Kundu, Rohit; Kaplun, Dmitrii; Sinitca, Aleksandr; Sarkar, Ram (2021). «"A fuzzy rank-based ensemble of CNN models for classification of cervical cytology». Scientific Reports. PMID 34267261. doi:10.1038/s41598-021-93783-8.: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC8282795

Navegación

Algoritmos de crescimento urbano

Introdução

Em geral

Visão geral

teoria dos conjuntos

Algoritmos de crescimento urbano

Introdução

Em geral

Visão geral

Definir tamanho

Tipos comuns de conjuntos

Classificador bayesiano ideal

Agregação de bootstrap (ensaque)

Impulsionando

Média do modelo bayesiano

Combinação bayesiana de modelos

Balde de modelos

Empilhamento

Voto

Implementação em pacotes estatísticos

Aplicações de aprendizagem em conjunto

Contenido

Sensoriamento remoto

Segurança informática

reconhecimento facial

Reconhecimento de emoções

Detecção de fraude

Tomada de decisão financeira

Medicamento

Referências

teoria dos conjuntos

Definir tamanho

Tipos comuns de conjuntos

Classificador bayesiano ideal

Agregação de bootstrap (ensaque)

Impulsionando

Média do modelo bayesiano

Combinação bayesiana de modelos

Balde de modelos

Empilhamento

Voto

Implementação em pacotes estatísticos

Aplicações de aprendizagem em conjunto

Contenido

Sensoriamento remoto

Segurança informática

reconhecimento facial

Reconhecimento de emoções

Detecção de fraude

Tomada de decisão financeira

Medicamento

Referências