SlideShare une entreprise Scribd logo
1  sur  21
Mineração de DadosBase Soybean Large Alunos:  Cassius Busemeyer Cristiane Luquetta
IB1- Histórico As sete pontes de Königsberg: Teoria dos grafos; Vizinho mais próximos entre outros; K-NN (vizinho mais próximo); IB1.
IB1 - Características Instance Based Learning; Pouco esforço computacional no treino; Compara-se ao J.48 (autores do algoritmo); Usa distância euclidiana para calcular similaridade.
Como funciona Compara exemplos do treino com 1 (um) exemplo da base e classifica-o escolhendo a classe da instância com maior grau de similaridade; Hãã: Pega o exemplo mais parecido do conjunto de treino.
IB1 - Algoritmo PARA CADA x pertencente aos dados de treino FAÇA 	1 PARA CADA y pertencente a base FAÇA Sim [y] = similaridade (x,y) 	2 ymax – alguns y pertencem a base com maximo sim[y] 	3 SE class(x) = class (ymax) ENTÃO classificação – correta SENÃO classificação – incorreta 	4 Classe – Classe U {x}
Deriva da Teoria dos Jogos de John Von Neumann (1926);  Albert Tucker cria o dilema do prisioneiro (1950);  John Nash mostra que existe equilíbrio entre jogos não-cooperativos (1951). Minimax - Histórico
Características
[object Object],Como funciona Hãã: cria todas as jogadas possíveis de um jogo até seu fim (ou até onde a máquina ou tempo permitir) e escolhe a melhor.
MiniMax - Algoritmo 	1. VERIFIQUE as próximas jogadas diretamente atingíveis a partir do tabuleiro corrente SE a altura máxima de busca não tiver sido alcançada; SENÃO RETORNE a estimativa (heurística) do tabuleiro corrente; 	2. ENTÃO caso uma se trate de posição de vitória, dê a ela a mais alta estimativa possível e retorne este valor; 	3. SENÃO considere todos os movimentos que o oponente possa fazer em seguida. RETORNE a pior jogada /*do oponente*/ contra a máquina.  ATIVE recursivamente a expansão de estados; 	4. ESCOLHA a jogada com a mais alta estimativa.
Voting Feature Intervals HISTÓRICO É comparado com métodos estatísticos, principalmente NBC (Naive Bayes Classifier); CARACTERÍSTICAS Algoritmo funciona de modos diferentes para valores numéricos e nominais;
Como funciona ,[object Object],Hãã: cada valor de atributo de uma instância vota numa classe e é eleita a mais votada.
Algoritmo LEIA a base de treino INÍCIO PARA CADA característica f PARA CADA classe c End_point = end_points[f] une-se com find_end_points (training Set, f,c); tipo (end_points[f]); SEf é linear  	Cada par de distintos pontos consecutivos em end_points[f] forma escala intervalar SENÃO /* é nominal */ 	Cada ponto distinto em end_points forma um ponto de intervalo   PARA CADA intervalo i na dimensão de atributos f PARA CADA Classe c 		Interval_class_count[f,i,c]= 0 			Count_instances(f,conjunto de treino); PARA CADA intervalo i nos atributos PARA CADA classe c 	Interval_class_vote[f,i,c]=interval_class_count[f,i,c]/class_count[c] 	Normalize interval_class_vote[f,i,c]; /*tal que somatório de intervalo_class_vote[f,i,c]=1 */ FIM.   Contagem de instâncias (f,conjunto de treino); INÍCIO PARA CADA instância no conjunto de treino SEef é conhecido I = encontre intervalos (f,ef) Ec= classe da instância e   SEi é um ponto de intervalo SEef= limite mais baixo de i Interval_class_count[f,i,ec]+=1 SENÃO /* é um range interval*/ SEef= limite mais baixo de i Interval_class_count[f,i-1,ec]+=0.5 						Interval_class_count[f,I,ec]+=0.5 SENÃO /* e entra no i*/ Interval_class_count[f,i,ec]+=1 FIM   Classificação do algoritmo INÍCIO PARA CADA classe c 		Vote[c]=0   PARA CADA atributo f PARA CADA classe c 			Feature_vote[f,c] = 0 SEef é um valor conhecido I= encontre intervalos (f,ef)   SEI é um ponto de intervalo SEef= limite mais baixo de i PARA CADA classe c 					Feature_vote[f,c] = intervals_class_vote[f,I,c] SENÃO /*É uma escala intervalar*/ PARA CADA classe c 		Feature_vote[f,c] = interval_class_vote[f,i-1,c] + interval_class_vote[f,I,c]/2 SENÃO  /*entra no intervalo i*/ PARA CADA classe c 				Feature_vote[f,c] =  interval_class_vote[f,I,c]   PARA CADA classe c Vote[c] = vote[c] + feature_vote[f,c];   RETORNE a classe c com maior vote[c] FIM
Base Soybean Base sobre doenças da soja. Originada de um trabalho Michalski e Chilausky; Repositório disponibiliza duas versões: 340 instâncias e 307 instâncias; Alguns autores dizem que Michalski e Chilausky não disponibilizaram os dados corretamente e não sabem como eles chegaram aos resultados divulgados; Outros autores dizem que a base disponibilizada não é a mesma do trabalho original.
Base- Soybean Large Variação dos tipos de doenças da soja.  Causador: Fungo (mais temidas); Vírus; Nematóides; Fitoplasma; Protozoários; Plantas parasitárias; Agentes variados (poluição, temperatura); Por região geográfica: Existem doenças particulares do Brasil, EUA. Etc...
KDD – Limpeza e transformação dos dados
KDD- Seleção dos algoritmos IB1; Comparado com J.48. MiniMax; V.F.I; Comparado c/ NaiveBayes.
Resultados Todos os resultados passaram de 75% na fase inicial (dito como suficiente – Witten e Frank, 2005).
Resultados
Considerações Finais Dificuldades: Entendimento da base; Pouca literatura ou literatura com informações divergentes sobre os algoritmos; Pesquisadores não responderam/etapa de validação; Próximos trabalhos: Melhor avaliação e comparação de resultados.
Obrigado!

Contenu connexe

En vedette

Arquitetura de computadores pessoais
Arquitetura de computadores pessoaisArquitetura de computadores pessoais
Arquitetura de computadores pessoais
Thalles Anderson
 
Wndw pt-ebook rede sem fio
Wndw pt-ebook rede sem fioWndw pt-ebook rede sem fio
Wndw pt-ebook rede sem fio
dercilio junior
 
Capacitancia e capacitores
Capacitancia e capacitoresCapacitancia e capacitores
Capacitancia e capacitores
Nicanor1996
 
Curso ensaios eletricos
Curso ensaios eletricosCurso ensaios eletricos
Curso ensaios eletricos
fabiofds
 

En vedette (20)

Arquitetura de computadores pessoais
Arquitetura de computadores pessoaisArquitetura de computadores pessoais
Arquitetura de computadores pessoais
 
Relatorio2012
Relatorio2012Relatorio2012
Relatorio2012
 
Manual do Usuario Tyt th f8 VHF
Manual do Usuario Tyt  th f8 VHFManual do Usuario Tyt  th f8 VHF
Manual do Usuario Tyt th f8 VHF
 
Youblisher.com 1127496-cana mix-edi_o_82
Youblisher.com 1127496-cana mix-edi_o_82Youblisher.com 1127496-cana mix-edi_o_82
Youblisher.com 1127496-cana mix-edi_o_82
 
Problemas de Picking e Transportes
Problemas de Picking e TransportesProblemas de Picking e Transportes
Problemas de Picking e Transportes
 
Fronteira Viva
Fronteira VivaFronteira Viva
Fronteira Viva
 
Panorama des énergies renouvelables au 1er semestre 2014
Panorama des énergies renouvelables au 1er semestre 2014Panorama des énergies renouvelables au 1er semestre 2014
Panorama des énergies renouvelables au 1er semestre 2014
 
Ma 149-1102
Ma 149-1102Ma 149-1102
Ma 149-1102
 
Redes 3
Redes 3Redes 3
Redes 3
 
Global Magazine 2 2014
Global Magazine 2 2014Global Magazine 2 2014
Global Magazine 2 2014
 
Wndw pt-ebook rede sem fio
Wndw pt-ebook rede sem fioWndw pt-ebook rede sem fio
Wndw pt-ebook rede sem fio
 
Redes 5
Redes 5Redes 5
Redes 5
 
Aula 2 lab_fisica_b_multimetro
Aula 2 lab_fisica_b_multimetroAula 2 lab_fisica_b_multimetro
Aula 2 lab_fisica_b_multimetro
 
Relatório Anual Gunnebo 2014
Relatório Anual Gunnebo 2014Relatório Anual Gunnebo 2014
Relatório Anual Gunnebo 2014
 
Capacitancia e capacitores
Capacitancia e capacitoresCapacitancia e capacitores
Capacitancia e capacitores
 
2contecsi B
2contecsi B2contecsi B
2contecsi B
 
Curso ensaios eletricos
Curso ensaios eletricosCurso ensaios eletricos
Curso ensaios eletricos
 
Redes sem fio
Redes sem fioRedes sem fio
Redes sem fio
 
Apostila senai
Apostila senaiApostila senai
Apostila senai
 
Catalogo silmar
Catalogo silmarCatalogo silmar
Catalogo silmar
 

Similaire à Mineração de Dados na Base Soybean Large (7)

Aprendizagem Automática
Aprendizagem AutomáticaAprendizagem Automática
Aprendizagem Automática
 
Linguagem R
Linguagem RLinguagem R
Linguagem R
 
Aprendizagem Não-Supervisionada
Aprendizagem Não-SupervisionadaAprendizagem Não-Supervisionada
Aprendizagem Não-Supervisionada
 
Algoritmos de ordenação
Algoritmos de ordenaçãoAlgoritmos de ordenação
Algoritmos de ordenação
 
Math
MathMath
Math
 
Aula5
Aula5Aula5
Aula5
 
Redes Bayesianas para Recuperação de Informação Estruturada
Redes Bayesianas para Recuperação de Informação EstruturadaRedes Bayesianas para Recuperação de Informação Estruturada
Redes Bayesianas para Recuperação de Informação Estruturada
 

Dernier

GEOGRAFIA - COMÉRCIO INTERNACIONAL E BLOCOS ECONÔMICOS - PROF. LUCAS QUEIROZ.pdf
GEOGRAFIA - COMÉRCIO INTERNACIONAL E BLOCOS ECONÔMICOS - PROF. LUCAS QUEIROZ.pdfGEOGRAFIA - COMÉRCIO INTERNACIONAL E BLOCOS ECONÔMICOS - PROF. LUCAS QUEIROZ.pdf
GEOGRAFIA - COMÉRCIO INTERNACIONAL E BLOCOS ECONÔMICOS - PROF. LUCAS QUEIROZ.pdf
RavenaSales1
 
2° ANO - ENSINO FUNDAMENTAL ENSINO RELIGIOSO
2° ANO - ENSINO FUNDAMENTAL ENSINO RELIGIOSO2° ANO - ENSINO FUNDAMENTAL ENSINO RELIGIOSO
2° ANO - ENSINO FUNDAMENTAL ENSINO RELIGIOSO
LeloIurk1
 
SSE_BQ_Matematica_4A_SR.pdfffffffffffffffffffffffffffffffffff
SSE_BQ_Matematica_4A_SR.pdfffffffffffffffffffffffffffffffffffSSE_BQ_Matematica_4A_SR.pdfffffffffffffffffffffffffffffffffff
SSE_BQ_Matematica_4A_SR.pdfffffffffffffffffffffffffffffffffff
NarlaAquino
 
matematica aula didatica prática e tecni
matematica aula didatica prática e tecnimatematica aula didatica prática e tecni
matematica aula didatica prática e tecni
CleidianeCarvalhoPer
 
Slide - EBD ADEB 2024 Licao 02 2Trim.pptx
Slide - EBD ADEB 2024 Licao 02 2Trim.pptxSlide - EBD ADEB 2024 Licao 02 2Trim.pptx
Slide - EBD ADEB 2024 Licao 02 2Trim.pptx
edelon1
 
Reta Final - CNU - Gestão Governamental - Prof. Stefan Fantini.pdf
Reta Final - CNU - Gestão Governamental - Prof. Stefan Fantini.pdfReta Final - CNU - Gestão Governamental - Prof. Stefan Fantini.pdf
Reta Final - CNU - Gestão Governamental - Prof. Stefan Fantini.pdf
WagnerCamposCEA
 
5 bloco 7 ano - Ensino Relogioso- Lideres Religiosos _ Passei Direto.pdf
5 bloco 7 ano - Ensino Relogioso- Lideres Religiosos _ Passei Direto.pdf5 bloco 7 ano - Ensino Relogioso- Lideres Religiosos _ Passei Direto.pdf
5 bloco 7 ano - Ensino Relogioso- Lideres Religiosos _ Passei Direto.pdf
LeloIurk1
 
apostila projeto de vida 2 ano ensino médio
apostila projeto de vida 2 ano ensino médioapostila projeto de vida 2 ano ensino médio
apostila projeto de vida 2 ano ensino médio
rosenilrucks
 

Dernier (20)

PROJETO DE EXTENSÃO I - TERAPIAS INTEGRATIVAS E COMPLEMENTARES.pdf
PROJETO DE EXTENSÃO I - TERAPIAS INTEGRATIVAS E COMPLEMENTARES.pdfPROJETO DE EXTENSÃO I - TERAPIAS INTEGRATIVAS E COMPLEMENTARES.pdf
PROJETO DE EXTENSÃO I - TERAPIAS INTEGRATIVAS E COMPLEMENTARES.pdf
 
PROJETO DE EXTENSÃO I - AGRONOMIA.pdf AGRONOMIAAGRONOMIA
PROJETO DE EXTENSÃO I - AGRONOMIA.pdf AGRONOMIAAGRONOMIAPROJETO DE EXTENSÃO I - AGRONOMIA.pdf AGRONOMIAAGRONOMIA
PROJETO DE EXTENSÃO I - AGRONOMIA.pdf AGRONOMIAAGRONOMIA
 
GEOGRAFIA - COMÉRCIO INTERNACIONAL E BLOCOS ECONÔMICOS - PROF. LUCAS QUEIROZ.pdf
GEOGRAFIA - COMÉRCIO INTERNACIONAL E BLOCOS ECONÔMICOS - PROF. LUCAS QUEIROZ.pdfGEOGRAFIA - COMÉRCIO INTERNACIONAL E BLOCOS ECONÔMICOS - PROF. LUCAS QUEIROZ.pdf
GEOGRAFIA - COMÉRCIO INTERNACIONAL E BLOCOS ECONÔMICOS - PROF. LUCAS QUEIROZ.pdf
 
DeClara n.º 75 Abril 2024 - O Jornal digital do Agrupamento de Escolas Clara ...
DeClara n.º 75 Abril 2024 - O Jornal digital do Agrupamento de Escolas Clara ...DeClara n.º 75 Abril 2024 - O Jornal digital do Agrupamento de Escolas Clara ...
DeClara n.º 75 Abril 2024 - O Jornal digital do Agrupamento de Escolas Clara ...
 
P P P 2024 - *CIEJA Santana / Tucuruvi*
P P P 2024  - *CIEJA Santana / Tucuruvi*P P P 2024  - *CIEJA Santana / Tucuruvi*
P P P 2024 - *CIEJA Santana / Tucuruvi*
 
2° ANO - ENSINO FUNDAMENTAL ENSINO RELIGIOSO
2° ANO - ENSINO FUNDAMENTAL ENSINO RELIGIOSO2° ANO - ENSINO FUNDAMENTAL ENSINO RELIGIOSO
2° ANO - ENSINO FUNDAMENTAL ENSINO RELIGIOSO
 
Projeto Nós propomos! Sertã, 2024 - Chupetas Eletrónicas.pptx
Projeto Nós propomos! Sertã, 2024 - Chupetas Eletrónicas.pptxProjeto Nós propomos! Sertã, 2024 - Chupetas Eletrónicas.pptx
Projeto Nós propomos! Sertã, 2024 - Chupetas Eletrónicas.pptx
 
aula de bioquímica bioquímica dos carboidratos.ppt
aula de bioquímica bioquímica dos carboidratos.pptaula de bioquímica bioquímica dos carboidratos.ppt
aula de bioquímica bioquímica dos carboidratos.ppt
 
Jogo de Rimas - Para impressão em pdf a ser usado para crianças
Jogo de Rimas - Para impressão em pdf a ser usado para criançasJogo de Rimas - Para impressão em pdf a ser usado para crianças
Jogo de Rimas - Para impressão em pdf a ser usado para crianças
 
LISTA DE EXERCICIOS envolveto grandezas e medidas e notação cientifica 1 ANO ...
LISTA DE EXERCICIOS envolveto grandezas e medidas e notação cientifica 1 ANO ...LISTA DE EXERCICIOS envolveto grandezas e medidas e notação cientifica 1 ANO ...
LISTA DE EXERCICIOS envolveto grandezas e medidas e notação cientifica 1 ANO ...
 
SSE_BQ_Matematica_4A_SR.pdfffffffffffffffffffffffffffffffffff
SSE_BQ_Matematica_4A_SR.pdfffffffffffffffffffffffffffffffffffSSE_BQ_Matematica_4A_SR.pdfffffffffffffffffffffffffffffffffff
SSE_BQ_Matematica_4A_SR.pdfffffffffffffffffffffffffffffffffff
 
matematica aula didatica prática e tecni
matematica aula didatica prática e tecnimatematica aula didatica prática e tecni
matematica aula didatica prática e tecni
 
Slide - EBD ADEB 2024 Licao 02 2Trim.pptx
Slide - EBD ADEB 2024 Licao 02 2Trim.pptxSlide - EBD ADEB 2024 Licao 02 2Trim.pptx
Slide - EBD ADEB 2024 Licao 02 2Trim.pptx
 
Nós Propomos! Autocarros Elétricos - Trabalho desenvolvido no âmbito de Cidad...
Nós Propomos! Autocarros Elétricos - Trabalho desenvolvido no âmbito de Cidad...Nós Propomos! Autocarros Elétricos - Trabalho desenvolvido no âmbito de Cidad...
Nós Propomos! Autocarros Elétricos - Trabalho desenvolvido no âmbito de Cidad...
 
Reta Final - CNU - Gestão Governamental - Prof. Stefan Fantini.pdf
Reta Final - CNU - Gestão Governamental - Prof. Stefan Fantini.pdfReta Final - CNU - Gestão Governamental - Prof. Stefan Fantini.pdf
Reta Final - CNU - Gestão Governamental - Prof. Stefan Fantini.pdf
 
5 bloco 7 ano - Ensino Relogioso- Lideres Religiosos _ Passei Direto.pdf
5 bloco 7 ano - Ensino Relogioso- Lideres Religiosos _ Passei Direto.pdf5 bloco 7 ano - Ensino Relogioso- Lideres Religiosos _ Passei Direto.pdf
5 bloco 7 ano - Ensino Relogioso- Lideres Religiosos _ Passei Direto.pdf
 
PROJETO DE EXTENSÃO - EDUCAÇÃO FÍSICA BACHARELADO.pdf
PROJETO DE EXTENSÃO - EDUCAÇÃO FÍSICA BACHARELADO.pdfPROJETO DE EXTENSÃO - EDUCAÇÃO FÍSICA BACHARELADO.pdf
PROJETO DE EXTENSÃO - EDUCAÇÃO FÍSICA BACHARELADO.pdf
 
PROJETO DE EXTENSÃO I - SERVIÇOS JURÍDICOS, CARTORÁRIOS E NOTARIAIS.pdf
PROJETO DE EXTENSÃO I - SERVIÇOS JURÍDICOS, CARTORÁRIOS E NOTARIAIS.pdfPROJETO DE EXTENSÃO I - SERVIÇOS JURÍDICOS, CARTORÁRIOS E NOTARIAIS.pdf
PROJETO DE EXTENSÃO I - SERVIÇOS JURÍDICOS, CARTORÁRIOS E NOTARIAIS.pdf
 
apostila projeto de vida 2 ano ensino médio
apostila projeto de vida 2 ano ensino médioapostila projeto de vida 2 ano ensino médio
apostila projeto de vida 2 ano ensino médio
 
Projeto_de_Extensão_Agronomia_adquira_ja_(91)_98764-0830.pdf
Projeto_de_Extensão_Agronomia_adquira_ja_(91)_98764-0830.pdfProjeto_de_Extensão_Agronomia_adquira_ja_(91)_98764-0830.pdf
Projeto_de_Extensão_Agronomia_adquira_ja_(91)_98764-0830.pdf
 

Mineração de Dados na Base Soybean Large

  • 1. Mineração de DadosBase Soybean Large Alunos: Cassius Busemeyer Cristiane Luquetta
  • 2. IB1- Histórico As sete pontes de Königsberg: Teoria dos grafos; Vizinho mais próximos entre outros; K-NN (vizinho mais próximo); IB1.
  • 3. IB1 - Características Instance Based Learning; Pouco esforço computacional no treino; Compara-se ao J.48 (autores do algoritmo); Usa distância euclidiana para calcular similaridade.
  • 4.
  • 5. Como funciona Compara exemplos do treino com 1 (um) exemplo da base e classifica-o escolhendo a classe da instância com maior grau de similaridade; Hãã: Pega o exemplo mais parecido do conjunto de treino.
  • 6. IB1 - Algoritmo PARA CADA x pertencente aos dados de treino FAÇA 1 PARA CADA y pertencente a base FAÇA Sim [y] = similaridade (x,y) 2 ymax – alguns y pertencem a base com maximo sim[y] 3 SE class(x) = class (ymax) ENTÃO classificação – correta SENÃO classificação – incorreta 4 Classe – Classe U {x}
  • 7. Deriva da Teoria dos Jogos de John Von Neumann (1926); Albert Tucker cria o dilema do prisioneiro (1950); John Nash mostra que existe equilíbrio entre jogos não-cooperativos (1951). Minimax - Histórico
  • 9.
  • 10. MiniMax - Algoritmo 1. VERIFIQUE as próximas jogadas diretamente atingíveis a partir do tabuleiro corrente SE a altura máxima de busca não tiver sido alcançada; SENÃO RETORNE a estimativa (heurística) do tabuleiro corrente; 2. ENTÃO caso uma se trate de posição de vitória, dê a ela a mais alta estimativa possível e retorne este valor; 3. SENÃO considere todos os movimentos que o oponente possa fazer em seguida. RETORNE a pior jogada /*do oponente*/ contra a máquina. ATIVE recursivamente a expansão de estados; 4. ESCOLHA a jogada com a mais alta estimativa.
  • 11. Voting Feature Intervals HISTÓRICO É comparado com métodos estatísticos, principalmente NBC (Naive Bayes Classifier); CARACTERÍSTICAS Algoritmo funciona de modos diferentes para valores numéricos e nominais;
  • 12.
  • 13. Algoritmo LEIA a base de treino INÍCIO PARA CADA característica f PARA CADA classe c End_point = end_points[f] une-se com find_end_points (training Set, f,c); tipo (end_points[f]); SEf é linear Cada par de distintos pontos consecutivos em end_points[f] forma escala intervalar SENÃO /* é nominal */ Cada ponto distinto em end_points forma um ponto de intervalo   PARA CADA intervalo i na dimensão de atributos f PARA CADA Classe c Interval_class_count[f,i,c]= 0 Count_instances(f,conjunto de treino); PARA CADA intervalo i nos atributos PARA CADA classe c Interval_class_vote[f,i,c]=interval_class_count[f,i,c]/class_count[c] Normalize interval_class_vote[f,i,c]; /*tal que somatório de intervalo_class_vote[f,i,c]=1 */ FIM.   Contagem de instâncias (f,conjunto de treino); INÍCIO PARA CADA instância no conjunto de treino SEef é conhecido I = encontre intervalos (f,ef) Ec= classe da instância e   SEi é um ponto de intervalo SEef= limite mais baixo de i Interval_class_count[f,i,ec]+=1 SENÃO /* é um range interval*/ SEef= limite mais baixo de i Interval_class_count[f,i-1,ec]+=0.5 Interval_class_count[f,I,ec]+=0.5 SENÃO /* e entra no i*/ Interval_class_count[f,i,ec]+=1 FIM   Classificação do algoritmo INÍCIO PARA CADA classe c Vote[c]=0   PARA CADA atributo f PARA CADA classe c Feature_vote[f,c] = 0 SEef é um valor conhecido I= encontre intervalos (f,ef)   SEI é um ponto de intervalo SEef= limite mais baixo de i PARA CADA classe c Feature_vote[f,c] = intervals_class_vote[f,I,c] SENÃO /*É uma escala intervalar*/ PARA CADA classe c Feature_vote[f,c] = interval_class_vote[f,i-1,c] + interval_class_vote[f,I,c]/2 SENÃO /*entra no intervalo i*/ PARA CADA classe c Feature_vote[f,c] = interval_class_vote[f,I,c]   PARA CADA classe c Vote[c] = vote[c] + feature_vote[f,c];   RETORNE a classe c com maior vote[c] FIM
  • 14. Base Soybean Base sobre doenças da soja. Originada de um trabalho Michalski e Chilausky; Repositório disponibiliza duas versões: 340 instâncias e 307 instâncias; Alguns autores dizem que Michalski e Chilausky não disponibilizaram os dados corretamente e não sabem como eles chegaram aos resultados divulgados; Outros autores dizem que a base disponibilizada não é a mesma do trabalho original.
  • 15. Base- Soybean Large Variação dos tipos de doenças da soja. Causador: Fungo (mais temidas); Vírus; Nematóides; Fitoplasma; Protozoários; Plantas parasitárias; Agentes variados (poluição, temperatura); Por região geográfica: Existem doenças particulares do Brasil, EUA. Etc...
  • 16. KDD – Limpeza e transformação dos dados
  • 17. KDD- Seleção dos algoritmos IB1; Comparado com J.48. MiniMax; V.F.I; Comparado c/ NaiveBayes.
  • 18. Resultados Todos os resultados passaram de 75% na fase inicial (dito como suficiente – Witten e Frank, 2005).
  • 20. Considerações Finais Dificuldades: Entendimento da base; Pouca literatura ou literatura com informações divergentes sobre os algoritmos; Pesquisadores não responderam/etapa de validação; Próximos trabalhos: Melhor avaliação e comparação de resultados.