Este documento apresenta um resumo de três frases:
1) O documento descreve um método para classificar eventos anômalos em uma usina nuclear em uma de três classes possíveis (acidentes/transientes), usando o algoritmo de otimização por enxame de partículas.
2) O PSO é usado para encontrar o melhor vetor protótipo para cada classe, maximizando o número de classificações corretas, e a métrica de Minkowski é usada para medir a similaridade entre eventos e vetores protótipos.
Diagnóstico de Classe utilizando Inteligência de Enxames aplicado ao problema de Identificação de Transiente Nuclear
1. UNIVERSIDADE ESTADUAL DO CEARÁ
INSTITUTO FEDERAL DE EDUCAÇÃO CIÊNCIAS E
TECNOLOGIA DO CEARÁ
CONVÊNIO COM A UNIVERSIDADE FEDERAL DO RIO DE
JANEIRO
MANOEL VILLAS BÔAS JÚNIOR
DIAGNÓSTICO DE CLASSE UTILIZANDO INTELIGÊNCIA DE
ENXAMES APLICADO AO PROBLEMA DE IDENTIFICAÇÃO DE
TRANSIENTES NUCLEARES
Fortaleza - Ceará
2011
2. MANOEL VILLAS BÔAS JÚNIOR
DIAGNÓSTICO DE CLASSE UTILIZANDO INTELIGÊNCIA DE ENXAMES
APLICADO AO PROBLEMA DE IDENTIFICAÇÃO DE TRANSIENTES
NUCLEARES
Dissertação de Mestrado apresentada ao Curso de
Mestrado Profissional em Computação Aplicada,
MPCOMP, da Universidade Estadual do Ceará,
como requisito parcial para obtenção do grau de
Mestre em Computação Aplicada, tendo como
área de concentração Sistemas de Apoio a
Decisão.
Orientador: Prof. Ph. D. Edilberto Strauss
Fortaleza - Ceará
2011
3.
4. MANOEL VILLAS BÔAS JÚNIOR
DIAGNÓSTICO DE CLASSE UTILIZANDO INTELIGÊNCIA DE ENXAMES
APLICADO AO PROBLEMA DE IDENTIFICAÇÃO DE TRANSIENTES
NUCLEARES
Dissertação de Mestrado apresentada ao Curso de
Mestrado Profissional em Computação Aplicada,
MPCOMP, da Universidade Estadual do Ceará,
como requisito parcial para obtenção do grau de
Mestre em Computação Aplicada, tendo como
área de concentração Sistemas de Apoio a
Decisão.
Aprovada em ___/___/_____
BANCA EXAMINADORA
__________________________________________
Prof. Edilberto Strauss, Ph. D. (MPCOMP - POLI/UFRJ)
Orientador
__________________________________________
Prof. Lauro Dornelles Facó, D. Sc. (DCC/IM – UFRJ)
1º Membro Externo
__________________________________________
Prof. Airton Fontenele Sampaio Xavier, LDc. (MPCOMP-UECE/IFCE)
1º Membro Interno
__________________________________________
Prof. Marcos José Negreiros Gomes, D. Sc. (MPCOMP-UECE/IFCE)
2º Membro Interno
5. "O sucesso nasce do querer. Sempre que o homem aplicar a determinação e a
persistência para um objetivo, ele vencerá os obstáculos e, se não atingir o alvo, pelo
menos fará coisas admiráveis."
José de Alencar.
6. DEDICATÓRIA
As duas estrelas brilhantes que fazem parte de minha constelação, meu pai e
minha mãe, que mais uma vez irradiaram uma intensa luz que me conduziu até o fim
deste meu trabalho.
Ao meu anjo negro, que me proporcionou a imensa alegria de torna-se minha
esposa pela compreensão, incentivo, ajuda e que dedica a vida a conceder-me carinho,
paciência e, sobretudo preenche de amor minha vida.
Ao pequeno e ao mesmo tempo imenso sentido de vida que meu neto e meus
futuros filhos oferecem e que me inspira a novos objetivos. A minha filha que me
proporcionou as imensas alegrias de ter simplesmente nascido e de ter me dado meu
neto e que orgulhosamente exibe o orgulho que nutre pelo seu pai.
A todos da minha família que torcem pelo meu crescimento intelectual e pessoal.
A minha sogra e ao meu sogro e toda a família por estarem sempre dispostos a
incentivar o meu crescimento.
7. AGRADECIMENTO
Certa vez eu li que sempre devemos ter palavras que expressem o agradecimento
sincero, procuro estas palavras para referenciar ao professor Roberto Schirru. Porém
nenhuma delas expressa mais os sentimentos de agradecimento do que um “muito
obrigado por tudo”.
Aos meus amigos do LMP pelo total apoio e incentivo dado a este trabalho,
dedicação e ensinamentos que contribuíram de forma incontável para minha formação,
permitindo o meu completo esforço sobre o desenvolvimento deste, sendo na maioria
das vezes complacente com os prazos profissionais.
A Andressa pelo auxilio, carinho, presteza e por efetuar criticas embasadas
quando necessário, assim como por retirar dúvidas sobre questões importantes para o
desenvolvimento deste trabalho.
Aos professores Flávio, Negreiros e Xavier pelos preciosos ensinamentos nos
Seminários.
Ao professor Strauss pela orientação no desenvolvimento deste trabalho, sempre
atencioso e disponível para direcionar e resolver as dúvidas existentes.
8. RESUMO
Este trabalho apresenta um modelo de Sistema de Diagnóstico para apoio a
decisão, baseado na identificação de classes, usando-se o algoritmo de Otimização por
Enxame de Partículas, traduzido do inglês, Particle Swarm Optimization (PSO). O
método proposto tem como objetivo classificar um evento anômalo dentro de 3
possíveis classes de acidentes/transientes conhecidos na literatura, postulados para a
Usina Nuclear Angra 2. O algoritmo PSO é utilizado como método de separação de
classes, sendo responsável por encontrar o melhor vetor protótipo de cada
acidente/transiente, ou seja, conceitualmente equivalente ao tradicional Vetor de
Voronoi que maximiza o número de acertos do mesmo. Para efetuar o cálculo do grau
de similaridade, entre o conjunto de variáveis do evento anômalo, em um determinado
instante t, e o vetor protótipo das variáveis dos acidentes/transientes, foi utilizada a
métrica de Minkowski (e suas variações para as métricas de Manhattan e Euclidiana).
Os resultados obtidos pelo método proposto foram compatíveis, e até superiores aos
resultados encontrados na literatura, permitindo uma solução que se aproxima da ideal,
ou seja, dos Vetores de Voronoi num espaço restrito do .
Palavras-Chave: Inteligência de Enxames, PSO, Otimização, Voronoi, etc.
9. ABSTRACT
This work presents a model of Diagnosis System for decision support, based on
the identification of classes, using the algorithm of Particle Swarm Optimization,
translated from English, Particle Swarm Optimization (PSO). The proposed method
aims to classify an anomalous event within three possible types of accident/transient
known in the literature, postulates for the Angra 2 nuclear plant. The PSO algorithm is
used as a method of separation of classes, being responsible for finding the best
prototype vector of each accident/transient, that is conceptually equivalent to the
traditional Voronoi Vector that maximizes the number of hits it. To make the
calculation of the degree of similarity between the set of variables anomalous event in a
given time t, and the prototype vector of variables of accidents/transients, we used the
Minkowski metric (and its variations for the Manhattan and Euclidean metrics). The
results obtained by the proposed method were compatible, and even higher than those
reported in the literature, allowing a solution that approximates the ideal, ie the Voronoi
Vectors in a restrict space .
Key-Words: Swarm Intelligence, PSO, Optimization, Voronoi, etc.
10. SUMÁRIO
LISTA DE FIGURAS........................................................................................................................................................................xiii
LISTA DE TABELAS........................................................................................................................................................................xv
INTRODUÇÃO .........................................................................................................................................................................................1
1. FUNDAMENTAÇÃO TEÓRICA .......................................................................................................................................6
1.1. Etapas do Processo de Separação de Dados Baseado em Classes ...............................................8
1.2. Medidas do Grau de Similaridade .......................................................................................................................9
1.2.1. Métrica Euclidiana.........................................................................................................................................10
1.2.2. Métrica de Manhattan..................................................................................................................................12
1.2.3. Métrica de Minkowski ................................................................................................................................13
1.3. Métodos de Separação de Dados Baseada em Classes.......................................................................14
2. METAHEURÍSTICA E INTELIGÊNCIA DE ENXAMES........................................................................16
2.1. Inteligência Computacional ...................................................................................................................................17
2.2. Inteligência de Enxames ..........................................................................................................................................18
2.3. Enxame de Partículas (Particle Swarm Optimization – PSO) ......................................................19
3. IDENTIFICAÇÃO DE ACIDENTES NUCLEARES ......................................................................................27
3.1. Principais Acidentes de base de projeto de uma Usina Nuclear – PWR ...............................31
11. 4. IMPLEMENTAÇÃO DO METÓDO PROPOSTO ...........................................................................................35
4.1. Sistema Protótipo de Identificação de Acidentes/Transientes ......................................................36
4.2. Seleção dos Acidentes/Transientes de Base de Projeto .....................................................................37
4.3. Normalização de Dados............................................................................................................................................45
4.4. Configuração do PSO.................................................................................................................................................46
4.5. Análise e Resultados ...................................................................................................................................................49
4.6. Comparação do PSO utilizando as Métricas Manhattan, Euclidiana e
Minkowski com os Resultados obtidos na Literatura .......................................................................................52
4.7. Comparação do PSO utilizando as Métricas Manhattan, Euclidiana e
Minkowski com 18 variáveis e 17 variáveis (excluindo a variável tempo) .....................................64
4.8. Fase 2: Diagnóstico em Tempo Real ..............................................................................................................67
4.8.1. Acumulação de Evidência – Resposta “Não Sei” ....................................................................70
4.8.2. Testes com acidentes/transientes nucleares para a Usina de Angra 2 ........................72
4.8.2.1. Protótipo do Sistema em Tempo Real (Fase 2) ...............................................................72
4.8.2.2. Resultados para Sinal Sem Ruído ..............................................................................................74
4.8.2.3. Resultados para Sinal Com Ruído Aleatório de 1% e 2%. ......................................74
CONCLUSÕES .......................................................................................................................................................................................76
PROPOSTAS DE TRABALHOS FUTUROS ...............................................................................................................78
APÊNDICE A ...........................................................................................................................................................................................79
12. A.1. Evolução Temporal de 61 segundos...............................................................................................................79
A.1. Evolução Temporal de 59 segundos...............................................................................................................83
REFERÊNCIAS BIBLIOGRÁFICAS.................................................................................................................................89
REFERÊNCIAS WEB ......................................................................................................................................................................94
13. xiii
LISTA DE FIGURAS
Figura 1.1 - Separação baseada em classes de um conjunto de dados originais ............................................6
Figura 1.2 - Exemplo de classes com formas e tamanhos diferentes ....................................................................7
Figura 1.3 - Representação Euclidiana para 2 dimensões ...........................................................................................11
Figura 1.4 - Representação Euclidiana para 3 dimensões ...........................................................................................11
Figura 1.5 - Distância Manhattan e Euclidiana ...................................................................................................................13
Figura 1.6 - Ilustração do cálculo de Minkoswki ..............................................................................................................14
Figura 2.1 - Aves voando "alinhadas" em busca de alimento ...................................................................................21
Figura 2.2 - Atualização de uma partícula ..............................................................................................................................21
Figura 2.3 - PSO - Reflexão de uma partícula nas bordas do espaço de busca ............................................23
Figura 2.4 - Pseudocódigo genérico do PSO ........................................................................................................................25
Figura 2.5 - Convergência Exemplo do PSO ........................................................................................................................26
Figura 3.1 - Ações de um operador ..............................................................................................................................................27
Figura 3.2 - Tempo de resposta do operador.........................................................................................................................28
Figura 4.1 - Exemplo de classificação de uma amostra, onde os pontos em laranja são os
vetores protótipos dos acidentes 1, 2 e 3, respectivamente e d1, d2 e d3 as
respectivas distâncias entre os vetores protótipos dos acidentes e a amostra
a ser classificada...........................................................................................................................................................37
Figura 4.2 - Assinatura das variáveis de estado para cada um dos 3 acidentes postulados
considerando a Usina operando a 100% de potência nominal ....................................................43
Figura 4.3 - Assinatura das variáveis de estado do BLACKOUT considerando a Usina
operando a 100% de potência nominal ........................................................................................................44
Figura 4.4 - Assinatura das variáveis de estado do LOCA considerando a Usina
operando a 100% de potência nominal ........................................................................................................44
Figura 4.5 - Assinatura das variáveis de estado do SGTR considerando a Usina
operando a 100% de potência nominal ........................................................................................................45
Figura 4.6 - Fluxograma do Método de Acerto/Erro com a métrica Euclidiana .........................................48
Figura 4.7 - Convergência do PSO ..............................................................................................................................................52
Figura 4.8 - Gráfico de acertos do PSO ....................................................................................................................................54
Figura 4.9 – Resultado da quantidade de acertos (177) obtida na variação de w para
métrica de Manhattan ..............................................................................................................................................58
14. xiv
Figura 4.10 - Resultado da quantidade de acertos (177) obtida na variação de w para a
métrica Minkowski com o parâmetro q = 3...........................................................................................58
Figura 4.11 - Resultado da quantidade de acertos (177) obtida na variação de w para a
métrica Minkowski com o parâmetro q = 6...........................................................................................59
Figura 4.12 - Resultado da quantidade de acertos (177) obtida na variação de w para a
métrica Minkowski com o parâmetro q = 9...........................................................................................59
Figura 4.13 - Gráfico de Convergência da métrica de Manhattan .........................................................................63
Figura 4.14 - Gráfico de Convergência da métrica de Minkowski q = 6..........................................................63
Figura 4.15 - Gráfico de Convergência da métrica de Minkowski q = 9..........................................................63
Figura 4.16 - Diagrama da Arquitetura em duas fases (off-line e on-line) .....................................................68
Figura 4.17 - Sistema Protótipo ......................................................................................................................................................73
15. xv
LISTA DE TABELAS
Tabela 2.1 - Resultado Exemplo do PSO ................................................................................................................................26
Tabela 4.1 - Variáveis de estado dos acidentes/transientes ........................................................................................42
Tabela 4.2(a) - Vetor do indivíduo do PSO com 18 variáveis..................................................................................46
Tabela 4.2(b) - Vetor do indivíduo do PSO com 17 variáveis .................................................................................47
Tabela 4.3 - Resultado variação do parâmetro de Minkowski ............................................................................50
Tabela 4.4 - Configuração do PSO para teste das métricas ........................................................................................51
Tabela 4.5 - Resultados do PSO.....................................................................................................................................................51
Tabela 4.6 - Comparação entre PSO com as métricas de Manhattan, Minkowski e
Euclidiana com a literatura .................................................................................................................................54
Tabela 4.7 - Primeira linha de cada acidente/transiente ................................................................................................55
Tabela 4.8 - Segunda linha de cada acidente/transiente ................................................................................................56
Tabela 4.9 - Resultado das métricas para 177 acertos ....................................................................................................57
Tabela 4.10 - Resultado das 3 métricas com população=500 ...................................................................................60
Tabela 4.11 - Resultado das 3 métricas com população=100 ...................................................................................60
Tabela 4.12 - Vetor Protótipo da métrica de Manhattan...............................................................................................61
Tabela 4.13 - Vetor Protótipo da métrica de Minkowski com q = 6 ....................................................................62
Tabela 4.14 - Vetor Protótipo da métrica de Minkowski com q = 9 ...................................................................62
Tabela 4.15 - Resultado das métricas para 177 acertos (17 variáveis) ..............................................................64
Tabela 4.16 - Resultado das 3 métricas com população=500 (17 variáveis) ................................................65
Tabela 4.17 - Resultado das 3 métricas com população=100 (17 variáveis) ................................................66
Tabela 4.18 - Resultado variação do parâmetro de Minkowski (17 variáveis) .......................................67
Tabela 4.19 - Resultado sem superposição de ruídos .....................................................................................................74
Tabela 4.20 - Resultado ruídos de 1% .......................................................................................................................................75
Tabela 4.21 - Resultado ruídos de 2% .......................................................................................................................................75
Tabela A.1 - Resultado população=100 e geração=200 ...............................................................................................79
Tabela A.2 - Resultado população=200 e geração=400 ..............................................................................................80
Tabela A.3 - Resultado variação de ..........................................................................................80
16. xvi
Tabela A.4 - Resultado variação de ...........................................................................................81
Tabela A.5 - Resultado variação de ...........................................................................................81
Tabela A.6 - Resultado variação de ...........................................................................................81
Tabela A.7 - Resultado variação de ...........................................................................................82
Tabela A.8 - Resultado variação de ...........................................................................................82
Tabela A.9 - Resultado variação de .......................................................................................................................................83
Tabela A.10 - Resultado população=100 e geração=200.............................................................................................83
Tabela A.11 - Resultado população=200 e geração=400.............................................................................................84
Tabela A.12 - Resultado variação de ........................................................................................84
Tabela A.13 - Resultado variação de ........................................................................................85
Tabela A.14 - Resultado variação de ........................................................................................85
Tabela A.15 - Resultado variação de ........................................................................................85
Tabela A.16 - Resultado variação de ........................................................................................86
Tabela A.17 - Resultado variação de ........................................................................................86
Tabela A.18 - Resultado variação de ....................................................................................................................................87
Tabela A.19 - Resultado variação do parâmetro de Minkowski ........................................................................87
Tabela A.20 - Resultado sem variável tempo .......................................................................................................................88
17. 1
Introdução
Uma importante e natural atividade humana é o processo de agrupar pessoas,
fatos e objetos em classes similares (VIANA, 2008). Na computação diversos sistemas
se utilizam deste conceito humano, como por exemplo, sistemas de banco de dados,
sistemas de mineração de dados e sistemas de apoio a decisão. Incluem-se neste ramo os
sistemas de diagnóstico baseado em classes, esses sistemas são ferramentas importantes
que auxiliam a medir o grau de associatividade entre dados de um problema
identificando qual classe uma determinada amostra deve estar associada. O grau de
similaridade, entre os dados de uma classe, normalmente esta relacionada a uma medida
de distância entre os mesmos.
Os sistemas de diagnósticos baseado em classes podem ser utilizados tanto na
área científica, quanto na engenharia e no mundo dos negócios, onde a maioria dos
dados é da forma multidimensional. Ou seja, conjuntos de dados que contém
tipicamente mais de três atributos. A representação, análise e classificação de tal
natureza de dados tem sido um desafio motivando constantes pesquisas em várias áreas
do conhecimento.
Diversos problemas podem ser modelados através do conceito de separação
baseado em classes, onde a área de engenharia nuclear possui uma diversidade destes
problemas. Por exemplo, com o objetivo de diagnosticar um possível acidente, o
operador de uma usina nuclear, em seu processo de tomada de decisão, durante uma
condição adversa, necessita analisar e classificar diversas informações do evento em
curso. Devido ao grande número de instrumentos, e a dinâmica de cada grandeza
medida, os operadores na execução de suas atividades possuem dificuldades no
monitoramento das informações obtidas. Desta forma, o processo de análise,
identificação do evento em curso, e tomada de decisão no caso de uma condição
adversa, é um processo complexo e exige uma grande carga cognitiva.
18. 2
Sistemas de apoio a decisão, tais como sistemas de diagnóstico e classificação de
acidentes/transientes de uma Usina Nuclear, podem auxiliar o operador a reduzir, ou
minimizar a sua carga cognitiva no momento de uma condição adversa. Tais
ferramentas de apoio podem ser incorporadas ao sistema de operação da usina, com o
objetivo de auxiliar o operador em uma tomada de decisão rápida e correta,
minimizando o risco de uma ação, ou identificação errônea do evento em curso.
Com a proposta de auxiliar os operadores em sua tomada de decisão, no caso da
identificação e diagnóstico de um acidente/transiente, diversos trabalhos foram
publicados com base em sistemas especialistas, redes neurais artificiais (RNAs), lógicas
nebulosas, algoritmos genéticos, inteligência de enxames e algoritmos de inspiração
quântica.
Uma das primeiras propostas utilizando técnicas de inteligência artificial para
sistemas de identificação de acidentes/transientes foi concebida por BARTLETT e
UHRIG (1992), que utilizou redes neurais para o diagnóstico de condições adversas.
BASU e BARTLETT (1994) aperfeiçoaram o trabalho de BARTLETT e UHRIG
(1992), utilizando uma arquitetura composta de duas RNAs.
FURUKAWA, UEDA e KITAMURA (1995), propuseram um sistema de
classificação de acidente/transientes baseado em um classificador independente para
cada variável observada.
JEONG, FURUTA e KONDO (1996), propuseram um método alternativo de
identificação de acidente/transientes denominado “Adaptative Template Matching”. O
método foi baseado em RNAs do tipo “feedforward” (sem alimentações internas)
permitindo não só identificar os acidentes/transientes diferentes, mas sim avaliar vários
acidente/transientes do mesmo tipo em diferentes níveis de severidade.
ALVARENGA (1997), utilizou redes neurais artificiais do tipo AVQ
(“Adaptative Vector Quantization”), algoritmos genético e lógica nebulosa. As RNAs
eram responsáveis por gerar os centróides protótipos das classes representativas dos
acidentes/transientes postulados. Os centróides eram utilizados para particionar os eixos
19. 3
das variáveis em conjuntos nebulosos, e estabelecer zonas de influência de cada
acidente. Os algoritmos genéticos tinham o papel de posicionar os centróides gerados
pelas RNAs no eixo do tempo, de modo a encontrar a melhor posição dos centróides
que determinava uma classificação final de mínima incerteza.
PEREIRA, SCHIRRU e MARTINEZ (1998), propôs uma nova metodologia
onde um algoritmo genético foi utilizado como algoritmo de otimização de um sistema
de classificação, baseado em medidas diretas de distância Euclidiana.
ALMEIDA (2001), aprimorou o método desenvolvido por PEREIRA,
SCHIRRU e MARTINEZ (1998), substituindo o critério de classificação baseado em
medidas diretas de distâncias Euclidianas, por outro, baseado no Método de
Classificação Possibilística que consiste em interpretar as subclasses como conjuntos
nebulosos (ZADEH (1965)) que induzem possibilidades para a classificação da amostra.
MOL (2002), em sua tese de doutorado propôs um sistema de identificação de
acidente/transientes baseado em redes neurais artificiais, com capacidade da resposta
“não sei” na identificação dinâmica de eventos não pertencentes ao conjunto de
aprendizado utilizado durante seu treinamento.
MEDEIROS (2005), em sua tese de doutorado, propôs um sistema de
identificação de acidente/transientes com o particionamento do espaço de busca, onde o
algoritmo de Otimização por Enxame de Partículas, traduzido do inglês Particle Swarm
Optimization (PSO), (KENNEDY, EBERHART e SHI (2001)) foi usado para encontrar
o menor número de partições (menor número de protótipos) de 3 classes de
acidente/transientes.
NICOLAU (2010), em sua dissertação de mestrado, propôs um sistema de
identificação de acidente/transientes, onde o algoritmo de inspiração quântica Quantum
Inspired Evolutionary Algorithm (QEA) foi usado para encontrar os vetores protótipos
centróides de 3 classes de acidente/transientes.
20. 4
Dentro deste contexto, é apresentado nesta dissertação o desenvolvimento de um
modelo de sistema de diagnóstico que classifica um evento anômalo dentro das
assinaturas de 3 classes de acidente/transientes de base de projeto, onde o algoritmo
PSO é utilizado como ferramenta de otimização para encontrar a melhor posição dos
vetores protótipos (Vetores de Voronoi, HAYKIN (1994)), similares aos vetores
centroides dos acidentes/transientes de base de projeto, que maximizam o número de
classificações corretas. Para efetuar o cálculo da distância entre o conjunto de variáveis
do evento anômalo, em um determinado instante t, e o vetor protótipo das variáveis do
acidente/transientes, foram utilizadas as métricas Manhattan, Euclidiana e Minkowski.
Será demonstrada a viabilidade do algoritmo PSO, como método de separação de
classes, através da busca do melhor vetor protótipo de cada acidente/transiente para o
problema de identificação e classificação. O PSO mostrou-se eficaz na busca de
soluções, sem necessidade de conhecimento prévio sobre a complexidade dos espaços
de busca envolvidos.
Para apresentar o método, seus fundamentos teóricos e os resultados obtidos,
esta dissertação foi organizada em 6 capítulos descritos a seguir.
O capítulo 1 apresenta uma descrição dos principais fundamentos teóricos que
embasaram o desenvolvimento desta dissertação. Inicialmente é efetuado uma breve
descrição dos métodos de separação de classes, e em seguida, as métricas que foram
utilizadas nesta dissertação.
O capítulo 2 apresenta os principais fundamentos da Inteligência de Enxames, e
as principais características do algoritmo de Otimização por Enxame de Partículas
(PSO).
O capítulo 3 apresenta as características do problema de identificação de
acidentes/transientes de uma Usina Nuclear e os principais acidentes/transientes de base
de projeto da Usina Nuclear Angra 2 PWR (Pressurized Water Reactor).
O capítulo 4 apresenta a implementação do método proposto, juntamente com os
testes e resultados encontrados.
21. 5
O Anexo I, mostra os resultados de todos os testes realizados, com diversos
valores para os parâmetros do PSO e das métricas Manhattan, Euclidiana e Minkowski.
22. 6
Capítulo 1
Fundamentação Teórica
De acordo com OLIVEIRA (2008), a separação de dados pode oferecer uma
maneira de entender e extrair informações significativas de grandes conjuntos de dados.
A intenção é que dados de um mesmo grupo tenham mais características em comum, do
que com dados pertencentes a um diferente grupo.
A principal diferença entre classificação, e separação de dados, é que na
primeira os dados são atribuídos a grupos já previamente conhecidos, enquanto que na
segunda, esses grupos são definidos conforme o grau de similaridades entre
características. A Figura 1.1 (a) mostra um conjunto de dados antes da separação em
classes, e maneiras diferentes de associá-los em classes, figura 1.1 (b e c).
FIGURA 1.1 - Separação baseada em classes de um conjunto de dados originais.
Diversos fatores devem ser levados em consideração por um algoritmo de
separação de dados baseado em classes, tais como: a representação dos dados, como
mensurar a similaridade entre dados e entre classes, como avaliar a qualidade do
resultado gerado, entre outros. Os parâmetros a serem ajustados inicialmente e a forma
de abordar cada um desses fatores são as principais diferenças entre os algoritmos de
23. 7
separação de dados baseado em classes, influenciando diretamente na qualidade da
divisão das classes.
Conjuntos de dados podem ter grupos de diferentes formas, densidades e
tamanhos. Restringir alguns desses atributos pode levar a uma distribuição errônea dos
dados. Diversos algoritmos clássicos de separação de dados baseado em classes são
incapazes de detectar classes como os da Figura 1.2 que possuem tamanhos diferentes e
formas côncavas, por exemplo, os algoritmos que restringem a identificação de classe
de forma elipsoidal. Outro exemplo são os algoritmos que restringem a identificação de
classes de forma esférica. Esses algoritmos utilizam centros como representantes de
cada classe, onde o grau de similaridade entre as classes são calculadas de acordo com o
grau de similaridade entre os centros e podem apresentar dificuldades em identificar
classes de formas e tamanhos variados.
FIGURA 1.2 - Exemplo de classes com formas e tamanhos diferentes.
Além da detecção de classes de formas diversas, uma estrutura hierárquica de
classes produz várias possibilidades de um mesmo conjunto de dados ser dividido. Nos
métodos hierárquicos, cada classe é representada por um centroide, isto é, um ponto que
traduz toda a disposição dos dados na classe, e o grau de similaridade entre classes é
medida através do grau de similaridade entre esses centroides. Nesta abordagem
existem dificuldades quando dados de uma classe encontram-se mais próximos do
centroide de outra classe do que do centroide de sua própria classe. Como por exemplo,
quando a forma das classes é côncava, e no caso em que há uma grande variação no
tamanho das classes.
Uma forma de representar esta hierarquia é através de uma árvore, onde as
folhas são o conjunto de dados e a cada vez que a árvore cresce de altura os dados são
24. 8
agrupados em classes, desta forma cada nível da árvore corresponde a uma divisão do
conjunto de dados, e a raiz da árvore é formada por uma classe com todos os dados.
Outro método são as estruturas não hierárquicas, onde o objetivo principal é de
agrupar os dados através de uma partição simples em C classes, onde C é o número de
classes previamente especificado, ou determinado pelo algoritmo. Estas abordagens da
separação de dados baseado em classes são pesquisadas, implementadas e discutidas em
diversas técnicas de inteligência computacional, tais como: inteligência coletiva e
algoritmos genéticos para resolver problemas de otimização, e tem sido aplicado com
sucesso em várias áreas, inclusive na área de engenharia nuclear e apresentam a
vantagem de precisarem de pouca informação para encontrar a solução do problema.
Nesta dissertação será dado o enfoque aos métodos de características não
hierárquicos, uma vez que no problema em questão, existe um número pré-definido de
classes. No entanto, o método usado representa uma nova abordagem dentro do
problema de classificação destas classes, pois faz uso de vetores protótipos
(conceitualmente equivalente ao Vetor de Voronoi), similares aos dos centroides, que
são característica dos métodos hierárquicos.
1.1 – Etapas do Processo de Separação de Dados Baseado em Classes
Diversos fatores devem ser levados em consideração para garantir a eficiência da
separação de dados baseada em classes, tais como: coleta dos dados, seleção das
variáveis, medidas de grau de similaridade, algoritmo de separação, validação e análise
dos resultados obtidos (JAIN et al. (1999)). A seguir são apresentadas as etapas que
compõem o processo de separação de dados baseada em classe:
1. Pré-processamento e seleção de variáveis
Nesta etapa há a identificação das variáveis ou atributos mais relevantes
do conjunto inicial de dados. Neste ponto, variáveis podem ser eliminadas (por
exemplo, quando todos os valores das variáveis são iguais) e os dados coletados
25. 9
são formatados para que o algoritmo de separação de dados baseado em classes
possa processá-los.
2. Medidas de grau de similaridade
Para quantificar a proximidade entre dados, torna-se necessário a adoção
de alguma medida de similaridade ou dissimilaridade, entre eles. Existem
diversas formas de quantificar este grau de similaridade entre pares de dados, e a
escolha desta medida de quantificação é fundamental para a separação baseada
em classes. Normalmente, estas medidas utilizadas indicam a dissimilaridade e
geralmente são calculadas através da métrica Euclidiana.
3. Algoritmos de separação de dados baseado em classes
Neste ponto é definida a forma de separação dos dados, podendo ser
realizado de diferentes formas. Os algoritmos de separação de dados baseado em
classes são qualificados pela técnica que utilizam na separação dos dados.
Dentre esses algoritmos destacam-se os de características hierárquicas e os de
características não hierárquicas. Como resultado, esta etapa fornece a divisão do
conjunto de dados inicial em classes.
4. Validação e análise dos resultados
Neste procedimento é avaliada a eficiência e eficácia do método de
geração de classes. Pode ser realizada em índices estatísticos, ou através de
comparação desse resultado com diferentes algoritmos. A análise dos resultados
obtidos pode indicar a redefinição dos atributos escolhidos, ou a adoção de uma
nova medida do grau de similaridade.
1.2 – Medidas do Grau de Similaridade
Segundo OLIVEIRA (2008), a proximidade entre dois dados e é denotada
por ( ), e uma forma de efetuar a medição do grau de similaridade, é através do
cálculo da distância entre eles. A distância é considerada uma métrica quando satisfizer
as seguintes condições:
26. 10
( )
( )
( ) ( )
( ) ( ) ( )
Onde .
1.2.1 – Métrica Euclidiana
A métrica Euclidiana utiliza-se do princípio de que o caminho mais curto entre
dois pontos é uma reta e a mensuração dessa reta provém da geometria Euclidiana.
Em uma geometria plana, ou geometria euclidiana, a distância entre dois pontos
e , considerando somente uma dimensão, pode ser facilmente calculada por:
(1)
Para duas dimensões, conforme demonstrado na figura 1.3, essa distância será
obtida por intermédio do "Teorema de Pitágoras", onde o quadrado da hipotenusa de um
triângulo retângulo e igual à soma dos quadrados dos catetos.
√ (2)
27. 11
FIGURA 1.3 - Representação Euclidiana para 2 dimensões.
Para três dimensões, conforme demonstrado na figura 1.4, essa distância será
obtida através da relação dada por:
√ (3)
FIGURA 1.4 - Representação Euclidiana para 3 dimensões.
As expressões citadas acima fornecem a distância entre dois pontos em uma
geometria euclidiana, não sendo importante se estão afastados ou próximos. No entanto,
28. 12
embora a maioria dos problemas seja descrito por três dimensões espaciais, uma grande
parte possui mais de 3 dimensões. Generalizando as expressões mostradas acima, a
distância entre dois pontos ( ) e ( ), para um
espaço euclidiano n-dimensional pode ser calculado por:
√( ) ( ) ( ) (4)
1.2.2 – Métrica de Manhattan
A Métrica de Manhattan, também conhecida como a métrica do Taxi, é mais
utilizada em problemas logísticos, onde existe uma rede de vias urbanas, devido a sua
maior coerência com os traçados perpendiculares das rotas constituídas de ruas e
avenidas, normalmente exibidos nas cidades modernas ou planejadas, e possui base
teórica na métrica do valor absoluto (FUZZO (2003)).
A métrica de Manhattan é calculada pela equação (5) e pode ser relacionada com
a métrica Euclidiana como demonstrado na figura 1.5.
( ) ( ) ( ) (5)
Onde,
( )
29. 13
FIGURA 1.5 - Distância Manhattan e Euclidiana
1.2.3 – Métrica de Minkowski
A métrica de Minkowski é utilizada no cálculo da similaridade ou
dissimilaridade entre dois pontos, sendo uma generalização das distâncias Manhattan e
Euclidiana. A distância de Minkowski é calculada pela equação (6), onde é o número
de dimensões (OLIVEIRA, 2008).
( ) √∑ ( ) (6)
A variação do parâmetro define as três variações mais comuns da distância
Minkowski, sendo calculadas pelas equações 7, 8 e 9 (JAIN e DUBES, 1998) e
demonstradas como na figura 1.6.
Distância Manhattan,
( ) ∑ (7)
Distância Euclidiana,
( ) √∑ ( ) (8)
30. 14
Distância “supremo”,
( ) (9)
Na figura 1.6 temos que:
o Se então ( )
o Se então ( ) √
o Se então ( )
FIGURA 1.6 - Ilustração do cálculo de Minkoswki
1.3 – Métodos de Separação de Dados Baseada em Classes
Na Seção 2.3 foram descritas medidas para quantificar a similaridade ou
dissimilaridade entre dados. As medidas de similaridade que representam essa
proximidade são as entradas para os métodos de separação de dados baseada em classes.
Os métodos de separação de dados baseada em classes podem ser classificados como:
baseado em densidade, hierárquico e não hierárquico (como descrito no capitulo 2.1).
Na dissertação são enfocados os métodos hierárquicos e não hierárquicos.
31. 15
Existem diversos métodos não hierárquicos de separação de dados baseados em
classes, tais como: utilizando redes neurais (KOSKO (1992) e HAYKIN (1994)),
classes nebulosas ou possibilisticas (ZADEH (1965,1978)) e em classes estendidas
(KAYMARK e SETNES. (2000)). Dentre os métodos hierárquicos, podemos citar
classes nebulosas por centroide (OLIVEIRA (2005)),
O método proposto nesta dissertação pode ser considerado de características não
hierárquico, pois no problema em questão, existe um número pré-definido de classes.
Porém deve-se ressaltar que o método usado representa uma nova abordagem dentro do
problema de classificação destas classes, pois faz uso de vetores protótipos, similares
aos dos centroides, que são característica dos métodos hierárquicos.
O método de diagnóstico e identificação do sistema proposto é baseado em
distância e utiliza métricas para efetuar a medição da distância entre o vetor de variáveis
do evento anômalo, em um determinado instante t, e o vetor protótipo dos
acidentes/transientes de base de projeto selecionados. O PSO, como ferramenta de
otimização, é utilizado para encontrar a melhor posição dos vetores protótipos de cada
um dos três acidentes/transientes, e desta forma maximizar o número de classificações
corretas.
Como não há obrigação que os vetores protótipos para a classificação sejam os
centroides das classes, o algoritmo foi utilizado na busca de vetores protótipos que
maximizam o número de acertos para a classificação de todos os acidentes. Com esta
abordagem, é estabelecido um modelo de solução que corresponde à pesquisa dos
Vetores de Voronoi para a identificação das classes de acidentes/transientes.
32. 16
Capítulo 2
METAHEURÍSTICA E INTELIGÊNCIA DE ENXAMES
Como descrito em SOUZA (2005), uma grande parte das heurísticas para a
solução de problemas específicos é ineficiente (ou não aplicáveis), na solução de um
objetivo mais amplo de problemas reais. A solução de problemas mais complexos, a
partir do conjunto de conceitos das áreas de Otimização e Inteligência Artificial resultou
na construção de metaheurísticas.
Segundo BLUM, e ROLI (2003), ainda não há uma definição comumente aceita.
A conceituação, “Uma metaheurística é formalmente definida como um processo de
geração iterativo, que guia uma heurística subordinada pela combinação de diferentes
conceitos inteligentes para explorar o espaço de busca. Estratégias de aprendizagem
são usadas para estruturar informações com a finalidade de encontrar, de forma
eficiente, soluções próximas do ótimo.”, de OSMAN e LAPORTE (1996), é uma das
mais apropriadas para a solução do problema proposto.
As metaheurísticas podem ter sua inspiração na adaptação dos seres vivos, onde
os algoritmos agem no conjunto de possíveis soluções para o problema, que evolui
através da interação entre seus elementos buscando a melhor solução no decorrer das
iterações e gerações, sem comprometer a diversidade.
Um processo de otimização utilizando metaheurísticas, proporciona um
equilíbrio dinâmico entre as habilidades de exploração e de intensificação da busca
(MARIA MARTA (2007)). A exploração permite visitar novas regiões do espaço de
busca, enquanto que a intensificação prioriza as buscas em regiões próximas a pontos já
visitados, onde melhores soluções podem eventualmente ser encontradas.
33. 17
Nos últimos anos, uma grande variedade de metaheurísticas tem sido propostas
para a solução de problemas de otimização, uma das principais abordagens atualmente
empregadas na solução de problemas de otimização é através das metaheurísticas da
Inteligência Computacional.
2.1 – Inteligência Computacional
Problemas compostos de múltiplas variáveis e diferentes soluções estão
presentes em uma grande variedade de situações reais. Esses problemas normalmente
são caracterizados por circunstâncias que se deseja maximizar ou minimizar em um
contexto em que podem existir restrições.
A solução de problemas de otimização através das metaheurísticas da
Inteligência Computacional, vem se tornando um assunto emergente ao longo dos
últimos anos. Esse enfoque enfatiza a distribuição do problema em interação direta ou
indireta entre agentes. O número de aplicações bem sucedidas vem crescendo
exponencialmente em áreas como otimização combinatória, redes de comunicação,
robótica e etc.
Dentre os algoritmos de Inteligência Computacional podemos destacar: os
Algoritmos Evolucionários e a metáfora do comportamento social de insetos, também
conhecida como Inteligência de Enxames ou Inteligência Coletiva. Entre os Algoritmos
Evolucionários destaca-se o Algoritmo Genético (GOLDBERG (1989)), enquanto que
na área da Inteligência de Enxames destaca-se o Algoritmo de Otimização por Enxame
de Partículas (Particle Swarm Optimization - PSO).
Entre as vantagens de resolver problemas com técnicas de Inteligência de
Enxames está a necessidade de pouca informação sobre o mesmo para encontrar a
solução, além de terem sido aplicadas com sucesso em diversos problemas não somente
da área de computação como também, por exemplo, na engenharia nuclear e na
engenharia mecânica. A seguir iremos destacar a inteligência de enxames, pois a mesma
será utilizada como ferramenta de otimização neste trabalho.
34. 18
2.2 – Inteligência de Enxames
A Inteligência de Enxames é uma técnica computacional desenvolvida no final
da década de 1980. Foi baseada no comportamento coletivo auto-organizado de
sistemas descentralizados constituídos por um número elevado de agentes, com o
objetivo de realizar uma determinada tarefa. A Inteligência de Enxame pode ser
definida como a subárea dos Sistemas de Inteligência Artificial onde o comportamento
coletivo dos indivíduos em uma população pode obter soluções coerentes (VON
ZUBEN e CASTRO (2004)).
Qualquer coleção estruturada de agentes capazes de interagir pode ser
genericamente utilizada como ilustração para o termo enxame ou população. Um
enxame de abelhas é um exemplo clássico. Outros sistemas de maneira similar também
podem ser considerados enxames, como por exemplo, um jogo de futebol onde os
agentes são os jogadores, um engarrafamento onde os agentes são os carros, uma
revoada de pássaros onde os agentes são os pássaros e até uma colônia de formigas, onde
os agentes são as formigas.
A noção de enxame sugere um aspecto de movimento coletivo no espaço, todavia
todos os tipos de comportamentos coletivos merecem a atenção e não somente o
espacial. As interações coletivas dentro do sistema, muitas vezes levam a algum tipo de
comportamento ou inteligência coletiva. Qualquer tentativa de projetar algoritmos ou
dispositivos distribuídos de solução de problemas sem ter um controle centralizado,
inspirado no comportamento coletivo de agentes sociais e outras sociedades animais
pode ser incluída neste ramo da Inteligência Artificial.
A inteligência coletiva é uma propriedade de sistemas compostos por agentes
com capacidade individual limitada que apresentam comportamentos coletivos
inteligentes. Tais comportamentos seguem as propriedade descritas abaixo:
Proximidade: os agentes devem ser capazes de interagir;
35. 19
Qualidade: os agentes devem ser capazes de avaliar seus
comportamentos;
Diversidade: o sistema reage a situações inesperadas;
Estabilidade: as variações ambientais podem afetar o comportamento de
um agente;
Adaptabilidade: capacidade de se adequar as variações ambientais.
Uma das principais metaheurísticas utilizadas pela Inteligência de Enxame é o
Enxame de Partículas (Particle Swarm Optimization - PSO).
2.3 – Enxame de Partículas (Particle Swarm Optimization - PSO)
KENNEDY e EBERHART (1995), introduzem o conceito de enxame de
partículas para otimização de funções contínuas não-lineares, e teve como base de
modelagem a simulação de grupos sociais simplificados. Trata-se de uma técnica de
otimização baseada em populações, que efetua sua implementação através da metáfora
do comportamento social e da interação de bandos de pássaros ou cardumes de peixes.
Como descrito em MENEZES, MACHADO e SCHIRRU (2008), na sociologia
vê-se discussões sobre a vantagem competitiva de se realizar aprendizado individual a
partir do conhecimento de outros componentes do grupo (KENNEDY e EBERHART
(1995)). Em muitas espécies, inclusive nos seres humanos, esta habilidade pode ser
observada, porém com uma diferença, enquanto as demais espécies realizam este
aprendizado para funções instintivas, como a procura de alimentos e parceiros, os seres
humanos também o aplicam nos campos da abstração cognitiva.
No inicio da década de 90, foi proposto um novo modelo de movimento com
base no aprendizado coletivo (KENNEDY e EBERHART (1995)). O modelo proposto
era similar aos já existentes, mas com um diferencial, os pássaros, isto é, os agentes
desta nova modelagem eram atraídos para uma área de pouso ao invés de continuarem
em vôo. Quando um dos pássaros sobrevoasse uma determinada área, este seria atraído.
36. 20
Com o aprendizado coletivo e a passagem do tempo, os demais pássaros tenderiam a se
movimentar com o intuito de pousar.
Foi observado por KENNEDY e EBERHART (1995), que localizar um ponto de
pouso e mover-se em direção a ele são procedimentos semelhantes aos seguidos por
técnicas de otimização. A capacidade sócio cognitiva é fundamental no comportamento
do enxame, pois um pássaro ao encontrar uma posição cuja solução pode ser
considerada boa sob algum aspecto pode vir a influenciar outros do enxame, fazendo
com que caminhem em sua direção, existindo a possibilidade de passarem por alguma
posição no espaço de busca ainda melhor. Neste caso, aumentariam as chances de serem
descobertos melhores resultados no espaço de busca conforme a evolução do algoritmo.
Os membros de uma população que procura por soluções de um problema
proposto passaram a ser designados pelo termo “partículas”, levando-se em
consideração que características como volume, massa e dimensões dos agentes não são
consideradas para a resolução de problemas ou para o processo de otimização.
A partícula individualmente não consegue avaliar se sua atual posição é boa ou
ruim. É necessário que a partícula envie estas coordenadas encontradas para uma função
que as avalie quantitativamente, fornecendo um número como resultado. Esta é a
chamada função objetivo, ou fitness, que é uma medida de aptidão, indicativa de quão
boa é uma posição em relação à outra historicamente encontrada pela partícula.
Na busca de melhores resultados no PSO, uma nova posição encontrada deve ser
comparada tanto com a melhor posição individual, obtida até o momento pela própria
partícula ( pBest ), quanto com a melhor posição de todo o enxame ( gBest ). No
entanto, não se devem atribuir às partículas, individualmente, capacidades cognitivas, já
que não possuem cérebros individualizados.
Utilizando uma analogia, o termo “partícula” simboliza os pássaros, como na
figura 2.1, e representa as possíveis soluções do problema a ser resolvido. A área
sobrevoada pelos pássaros é equivalente ao espaço de busca, e encontrar o local com
comida, corresponde à solução ótima.
37. 21
FIGURA 2.1 - Aves voando "alinhadas" em busca de alimento
Como descrito em WAINTRAUB (2009), no PSO é simulado um enxame de
partículas candidatas a solução de um determinado problema, onde em um espaço de
busca n-dimensional as partículas são atraídas por regiões de alto valor de adaptação,
conforme figura 2.2.
FIGURA 2.2 - Atualização de uma partícula.
A posição da partícula representa uma candidata a solução, enquanto a topologia
do espaço de busca é dada pela função objetivo do problema. A cada partícula é
atribuída uma velocidade, onde se encontram as informações de direção e taxa de
38. 22
mudança de posição em função do tempo, e o atributo de desempenho ou adequação,
obtido pela avaliação da função objetivo na posição da partícula.
A mudança da posição da partícula e de sua velocidade é guiada por sua
informação histórica das regiões boas e ruins pelas quais já passou, bem como pela
observação de seus vizinhos bem sucedidos.
Sejam X i t xi ,1 t ,....., xi ,n t e V i t vi ,1 t ,....., vi , n t , respectivamente, a
posição (o próprio vetor candidato a solução) e a velocidade (sua taxa de mudança) da
partícula i no tempo t, em um espaço de busca n-dimensional. Considerando-se também
pBest i (t ) pBesti ,1 t ,....., pBesti , n t , a melhor posição já encontrada pela partícula i
até o tempo t e gBest t gBest1 t ,....., gBest n t a melhor posição já encontrada pelo
enxame até o tempo t. As regras de atualização do PSO para a velocidade e posição, no
PSO canônico, são dadas por:
vi , j (t 1) vi , j t c1.r1 ( pBesti , j t xi , j (t )) c2 .r2 ( gBest j t xi , j (t )) (14)
xi , j (t 1) xi , j t vi , j t 1 (15)
Onde { } (número total de partículas), { } (dimensão do
espaço de busca), r1 e r2 são números randômicos uniformemente distribuídos entre 0 e
1. Os coeficientes c1 e c2 são as constantes de aceleração (geralmente chamadas de
aceleração cognitiva e social, respectivamente) relativas a pBest e gBest
respectivamente, e n indica os componentes do indivíduo em questão, nas equações (14)
e (15) acima.
Quando o PSO localiza a região do ótimo, dentro desta região ele pode enfrentar
dificuldades em ajustar o seu incremento de velocidade para prosseguir em uma busca
mais refinada, resultando em uma perda de eficiência do seu método. Para resolver este
problema introduz-se um peso para a velocidade anterior da partícula, denominado peso
inercial, w, cuja regra é considerada crítica para a convergência do PSO. Com isto, a
39. 23
equação da velocidade da partícula, anteriormente descrita pela equação (14), passa a
ser:
vi , j (t 1) w.vi , j t c1.r1 ( pBesti , j t xi , j (t )) c2 .r2 ( gBest j t xi , j (t )) (16)
Valores elevados de w promovem a exploração e prospecção globais, enquanto
que valores baixos conduzem a uma busca local. Uma aproximação comumente
utilizada para aumentar o desempenho do PSO, promovendo um balanço entre a busca
global e local, consiste em inicializar w com um valor alto e ir decrescendo, linearmente
ou não, durante a execução do PSO (SHI e EBERHART (1998)).
Ao observar as equações (14) e (15), não existe um mecanismo que limite a
velocidade de uma dada partícula. Esta falta pode resultar em uma baixa eficiência para
o PSO, quando comparado a outras técnicas de computação evolucionaria. Valores
muito altos de velocidade podem fazer com que a partícula saia do espaço de busca.
Neste caso, algumas estratégias podem ser utilizadas, como por exemplo, parar a
partícula nos limites do espaço de busca ou, mais natural e eficiente, refletir a partícula
para dentro do espaço de busca, conforme ilustrado na figura 2.3, que considera busca
em duas dimensões:
FIGURA 2.3 - PSO - Reflexão de uma partícula nas bordas do espaço de busca.
40. 24
Tal tratamento, entretanto, pode ocasionar a necessidade de varias reflexões em
caso de velocidades muito altas, podendo diminuir a eficiência do PSO. É adequado
uma limitação do valor da velocidade da partícula em um valor máximo. Quando a
velocidade exceder este limite, ela será fixada no valor máximo. No PSO canônico,
todas as partículas navegam por um espaço de busca n-dimensional, delimitado pelos
intervalos de variação dos n parâmetros de otimização. O enxame é classificado como
sendo de vizinhança global, onde todas as partículas são informadas quando um novo
melhor ponto de mínimo/máximo é encontrado no espaço de busca.
No algoritmo PSO, o enxame é inicializado randomicamente (posições e
velocidades) e enquanto o critério de parada (no caso um número máximo de iterações)
não é atingido, executa-se um loop contendo os seguintes passos:
1. Partículas são avaliadas de acordo com a função objetivo, e os valores de
aptidão de cada partícula são determinados;
2. Valores de pBest e gBest são atualizados;
3. Partículas são movimentadas de acordo com as equações de atualização
de velocidade e posição (Equações (14) e (15)).
A figura 2.4 mostra o pseudocódigo do PSO.
41. 25
FIGURA 2.4 - Pseudocódigo genérico do PSO.
Existem algumas variações do PSO padrão que visam aumentar a diversidade
populacional, fato este que geralmente resulta em melhores resultados WAINTRAUB
(2009).
O PSO pode ser utilizado para resolução de uma grande diversidade de
problemas como exemplo, podemos definir um problema simples onde o objetivo é o de
minizar o resultado. A função objetivo é denotada por ( ) , e foi realizado o
experimento em 20 gerações, para uma população aleatória de 100 indivíduos. O
parâmetro , as constantes foram mantidas fixas e com os valores 2.3 e
1.7 respectivamente. A tabela 2.1 mostra o resultado obtido para cada geração e a figura
2.5 mostra a convergência do algoritmo.
43. 27
Capítulo 3
IDENTIFICAÇÃO DE ACIDENTES NUCLEARES
O papel de um operador durante situações anormais de funcionamento da planta
pode ser extremamente complexo e a sua tomada de decisão pode envolver diversos
tipos de tarefas, conforme mostrado na figura 3.1,
FIGURA 3.1 - Ações de um operador.
No caso de uma condição adversa deve ser dado um tempo suficiente para que o
operador possa realizar as ações adequadas, isto implica que: o diagnóstico do possível
acidente deve ocorrer suficientemente cedo para permitir que o operador corrija o
defeito e as informações não devem exceder o patamar que o operador seja capaz de
manusear. Um exemplo de uma possível relação entre estes fatores é mostrado na figura
3.2, no caso de uma perda de refrigerante, onde é notado que existe uma margem, A,
44. 28
entre o limite normal de funcionamento e a outra margem fixa, B, entre o ponto em que
o operador mantem a perturbação sob controle.
FIGURA 3.2 - Tempo de resposta do operador.
Como descrito em NICOLAU (2010), em uma usina nuclear existem diversos
sistemas envolvidos em sua operação e que a qualquer momento podem apresentar uma
falha. Se a evolução desta condição adversa não for corretamente diagnosticada, ou
ainda, se não houver tempo hábil para sua solução, provavelmente haverá
consequências ambientais ou humanas indesejáveis.
Com o objetivo de obter uma operação mais segura, diversos sistemas devem ser
monitorados, fornecendo desta forma informações ao operador sobre seu estado para
que as devidas decisões possam ser efetuadas. Na execução de suas atividades, os
operadores efetuam o monitoramento de um grande número de medidas, obtidas através
da instrumentação dos sistemas, e no caso de uma condição adversa devem identificar e
diagnosticar a situação a partir de uma análise, e posterior classificação das medições
correspondentes ao evento em curso.
O grande número de instrumentos e a dinâmica da variação das medidas das
grandezas associadas ao evento em curso acrescentam uma grande dificuldade ao
processo de identificação e tomada de decisão por parte do operador, aumentando a
45. 29
probabilidade de ações inadequadas, e desta forma, podendo produzir resultados
catastróficos, como no caso do acidente de Three Mile Island (TMI) (NUREG (1979)).
No acidente de TMI, falhas técnicas, humanas e operacionais não permitiram o
resfriamento normal do reator nuclear e por consequência desses atos a Usina foi levada
a condições não previstas em sua base de projeto e teve fins catastróficos (MOL
(2002)).
Várias consequências regulatórias foram concebidas após o acidente e talvez a
maior delas tenha sido a da emissão de documentos normativos, pela Comissão de
Regulamentação Nuclear (NRC), que tem o objetivo de aumentar a segurança e
funcionamento eficaz da Usina e desta forma aumentar a capacidade de resposta do
operador, no caso de situações anormais.
Neste ponto foram introduzidos os conceitos dos Sistemas de Funções Críticas
de Segurança (SFCS) e exigida a implementação de sistemas computadorizados de
apoio a operação, na sala de controle das Usinas Nucleares, genericamente
denominados de Safety Parameter Display System (SPDS) (PEREIRA et. al. (1998)).
Outros exemplos dessas modificações, principalmente em relação aos Fatores Humanos
podem ser evidenciados em NUREG 0933.
Os grupos de parâmetros responsáveis por evitar o derretimento do núcleo do
reator ou minimizar a quantidade de radiação liberada para o meio ambiente, são
denominados de funções críticas de segurança. Estes grupos de parâmetros encontram-
se associados às barreiras de proteção das Usinas, sendo responsável pelo inventário do
refrigerante do reator, a pressão do reator e por controlar a criticalidade, sendo também,
de sua responsabilidade o transporte do calor do reator do circuito primário para o
secundário. Em caso de condições anormais, são seguidos procedimentos operacionais
de recuperação dessas funções para garantir a integridade das barreiras de proteção da
Usina.
Os sistemas computadorizados de auxilio à operação na sala de controle são
úteis no gerenciamento global das condições de segurança da Usina e, no auxílio à
46. 30
tomada de decisões de emergência. Em situações anormais de funcionamento da Usina
são responsáveis por auxiliarem os operadores nas tomadas de decisões e como
conseqüência reduzem a carga cognitiva do operador, aumentando o tempo disponível
para ações rápidas e corretas, que consequentemente minimizam o risco de um
diagnóstico incorreto do estado da Usina.
MOL (2002), considera que os órgãos reguladores possuem como filosofia
básica, o objetivo de garantir a segurança no projeto, construção e operação de Usinas
Nucleares, sendo desta forma chamada de defesa em profundidade e se expressa em
termos de três níveis de segurança.
No primeiro nível, o do projeto do reator, os órgãos reguladores enfatizam de
maneira especial à qualidade dos materiais e da mão de obra utilizada na construção da
Usina. O projeto e a construção devem sempre levar em consideração que a Usina deve
resistir aos fenômenos naturais e de modo a detectar possíveis falhas, permitir o
monitoramento contínuo ou periódico dos sistemas e componentes.
No segundo nível de segurança predomina o enfoque sobre mecanismos
utilizados para prevenir os incidentes que venham a ocorrer durante o ciclo de vida, e a
necessidade de meios para o tratamento desses eventos.
No terceiro nível de segurança são incorporadas as ideias dos sistemas adicionais
e barreiras radioativas para a proteção do meio-ambiente e da população. É indicado que
falhas de componentes e sistemas sejam postulados e que suas conseqüências devam ser
analisadas. A análise de cada evento hipotético determina um conjunto de acidentes de
base de projeto, e sistemas de segurança são, então, projetados para controlá-los.
INSAG-12. (IAEA-1999), serve como referência para maiores detalhes e
objetivos de segurança para uma Usina Nuclear.
47. 31
3.1 - Principais Acidentes de base de projeto de uma Usina Nuclear -
PWR
O Relatório Final de Análise de Segurança (FSAR) efetua a análise de um
conjunto de eventos iniciadores internos, postulados para uma Usina Nuclear, e que tem
por finalidade demonstrar o cumprimento de três objetivos de segurança:
1. O desligamento seguro da Usina;
2. A remoção do calor residual do núcleo do reator;
3. A limitação quanto à liberação da radioatividade.
Os eventos são classificados em três categorias de acordo com a freqüência de
ocorrência, essas categorias de evento são classificadas em: transientes operacionais;
acidentes e transientes antecipados com falha no desligamento rápido do reator.
No caso de transientes operacionais, assegura que:
1. Os sistemas de controle, limitação e desligamento rápido do reator são
suficientes para manter a integridade das barreiras de proteção da Usina;
2. Os sistemas e componentes da Usina funcionando dentro dos limites
permitidos de operação normal;
3. Evitar a liberação de radioatividade para o meio ambiente fora dos
limites permitidos para a operação normal.
Os eventos conhecidos como transientes operacionais são:
TOP-1. Abertura inadvertida de uma válvula de “bypass” do Sistema de Vapor
principal;
TOP-2. Desligamento da turbina (TRIPTUR);
TOP-3. Isolamento de uma válvula de isolamento do Sistema de Vapor principal;
TOP-4. Perda de água de alimentação devido à falha de uma bomba de
alimentação;
TOP-5. Perda de água de alimentação devido à falha de todas as bombas de
48. 32
alimentação;
TOP-6. Perda de uma bomba de refrigeração do reator;
TOP-7. Desligamento de todas as bombas de refrigeração do reator;
TOP-8. Retirada descontrolada do banco de barras de controle a partir de uma
condição subcrítica;
TOP-9. Retirada descontrolada do banco de barras de controle em operação
normal;
TOP-10. Partida de uma bomba de refrigeração inativa em um nível de potência
incorreto;
TOP-11. Atuação inadvertida do Sistema de Injeção de Segurança durante a
operação normal;
TOP-12. Diluição descontrolada de boro;
TOP-13. Abertura inadvertida da válvula de alívio de segurança do pressurizador;
TOP-14. Perda de alimentação elétrica externa para a operação de equipamentos
auxiliares (BLACKOUT).
Na categoria de acidentes, assegura-se que:
1. As funções realizadas pelo sistema de proteção do reator são suficientes
para manter a integridade das barreiras de proteção da Usina;
2. Os sistemas e componentes funcionando dentro dos limites permitidos
para a condição de acidente;
3. Evitar-se a liberação de radioatividade para o meio ambiente fora dos
limites permitidos para a condição de acidente.
Nesta categoria estão incluídos os seguintes eventos:
A. Abertura inadvertida de todas as válvulas de “bypass” do Sistema de vapor
principal;
B. Perda de refrigerante do reator, resultante de rupturas na tubulação do primário
(LOCA);
C. Ruptura de tubos de gerador de vapor (SGTR);
49. 33
D. Ruptura das linhas de vapor (STMLIBR);
E. Isolamento da linha de vapor principal (MFWISO);
F. Ruptura da linha de alimentação principal (MFWBR);
G. Abertura inadvertida de uma válvula de alivio do gerador de vapor;
Os transientes antecipados com falha no desligamento rápido do reator (ATWS)
podem ser causados devido ao fato do sinal de desligamento não conseguir percorrer o
caminho até os magnetos de sustentação das barras de controle. Mesmo neste caso, onde
há a inserção ou queda de barras de controle ainda é possível efetuar o tratamento
através da limitação da potência do reator.
Uma segunda hipótese para a falha no desligamento é uma falha mecânica das
barras de controle (presas), neste ponto não se consegue a movimentação das barras de
controle, nem mesmo com o sistema de limitação de potência do reator. Porém os meios
utilizados para tratar este evento são suficientes para: assegurar a remoção de calor
originário do sistema de refrigeração do reator e manter os limites da pressão do sistema
de refrigeração do reator.
Apesar de ser considerado um evento hipotético, são previstas ações no Sistema
de Limitação do Reator, que atuam em casos de ATWS para conduzir a Usina a uma
condição segura.
Na maioria dos casos, os transientes sem o desligamento rápido conduzem a uma
elevação da temperatura e da pressão no circuito primário. Com o calor produzido não
sendo removido, ocorre em consequência, uma atuação das válvulas de segurança com
redução de pressão e perda parcial de refrigerante do reator. A formação de bolhas no
refrigerante do reator, provocada pela redução da pressão, evapora parcialmente
acarretando uma considerável piora da moderação, com isto, um ganho de reatividade
negativa, o que ocasiona o desligamento do reator.
Este comportamento neste tipo de acidente, com desligamento próprio onde as
barras de controle não atuam, porém sem consequências para a Usina, encontra-se de
acordo com o conceito de segurança intrínseca (MOW).
50. 34
É realizada a monitoração da queda de barras de controle, além da segurança
intrínseca, se após a presença da ativação do sinal de desligamento do reator nuclear, as
barras de controle não atingirem um limite de queda definida, ocorrerá à injeção de
ácido bórico com as bombas de boração adicional dos tanques de armazenamento da
água borada, com a qual a potência será também reduzida.
51. 35
Capítulo 4
IMPLEMENTAÇÃO DO MÉTODO PROPOSTO
Neste capitulo, é proposto um modelo de diagnóstico de acidentes/transientes
baseado no algoritmo PSO. O modelo foi implementado em um sistema protótipo que
identifica um evento anômalo da Usina Angra 2, dentre um conjunto de 3
acidentes/transiente de base de projeto, gerados por simulação computacional, qual
melhor caracteriza o evento em curso. A arquitetura deste modelo é baseada em duas
fases, descritas a seguir:
Fase 1: obtenção dos vetores protótipos de cada classe
Os vetores protótipos que devem ser encontrados são
conceitualmente semelhantes aos Vetores de Voronoi das classes em
estudo. O PSO foi utilizado para identificar a melhor posição dos
vetores protótipos (Vetores de Voronoi), de cada um dos três
acidentes/transientes selecionados (BLACKOUT, LOCA, SGTR), de
modo que essas posições maximizam o número de classificações
corretas. O sistema de diagnóstico proposto classifica o evento
anômalo através da menor distância entre os vetores protótipos,
gerados pelo PSO, e a assinatura, ou seja, cada vetor de estado da
evolução temporal das variáveis do evento anômalo. Desta forma, e
com o objetivo de comparação, foram utilizadas 3 métricas de
distâncias: Manhattan, Euclidiana e Minkowski.
Fase 2: diagnóstico em tempo real
Nesta fase o sistema, para um determinado instante t e em tempo
real, classifica o vetor de estados do evento anômalo dentre um dos
três acidentes de base de projeto. Esta classificação será feita através
52. 36
da menor distância, isto é, o evento será classificado como
pertencente à classe cujo vetor protótipo for mais próximo ao seu
vetor de estados, em outras palavras, o de maior similaridade.
4.1 – Sistema Protótipo de Identificação de Acidentes/Transientes
O método de diagnóstico e identificação do sistema proposto é baseado em
distância e utiliza as métricas de Manhattan, Euclidiana e Minkowski para efetuar a
medição da distância entre o vetor de variáveis do evento anômalo, em um determinado
instante t, e o vetor protótipo dos acidentes/transientes de base de projeto selecionados.
O PSO, como ferramenta de otimização, é utilizado para encontrar a melhor posição dos
vetores protótipos de cada um dos três acidentes/transientes, e desta forma maximizar o
número de classificações corretas. Caso o número máximo de classificações corretas
seja igual ao número de amostras das classes, podemos dizer que o vetor protótipo
comporta-se, para este problema em particular, como o Vetor de Voronoi da classe.
Como não há obrigação que os vetores protótipos para a classificação sejam os
centroides resultantes de alguma função do particionamento do espaço de busca, o
algoritmo foi utilizado na busca de vetores protótipos que maximizam o número de
acertos para a classificação de todos os acidentes. Com esta abordagem, é estabelecido
um modelo de solução que corresponde à pesquisa dos Vetores de Voronoi para a
identificação das classes de acidentes/transientes.
Os acidente/transientes foram representados pela evolução temporal de 18
variáveis de estado, consideradas necessárias e suficientes para o reconhecimento de
cada transiente, no intervalo de 0 a 60 segundos, de um em um segundo, onde o
primeiro segundo corresponde a queda das barras (TRIP) do reator. A classificação do
evento anômalo foi feita pela medida da menor distância entre o conjunto de variáveis
(assinatura) do evento anômalo, em um determinado instante t, e o vetor protótipo de
cada acidente/transiente, como exemplificado na figura 4.1.
53. 37
Na figura 4.1, são mostrados três conjuntos simbólicos de dados dos três tipos de
acidentes, representados pelos seus vetores protótipos. No caso da figura 4.1, a
classificação da amostra é feita através da menor distância medida entre o vetor
protótipo do acidente e o vetor que representa a amostra. Observando a figura 4.1,
conclui-se que a amostra será classificada como sendo o acidente 2, pois a distância d2
é a menor que o sistema devera encontrar.
FIGURA 4.1 - Exemplo de classificação de uma amostra, onde os pontos em laranja são
os vetores protótipos dos acidentes 1, 2 e 3, respectivamente e d1, d2 e d3 as respectivas
distâncias entre os vetores protótipos dos acidentes e a amostra a ser classificada.
4.2 – Seleção dos Acidentes/Transientes de Base de Projeto
Para a proposta deste trabalho, o conjunto de acidentes/transientes selecionados
para testar o sistema protótipo de diagnóstico, teve por base os acidentes de projeto
postulados para a Usina Nuclear Angra 2, que constam no capítulo 15 do Relatório
Final de Análise de Acidentes (FSAR), exigido pela Comissão Nacional de Energia
Nuclear.
Os acidentes/transientes selecionados foram:
BLACKOUT (Evento Transiente)
Consiste na perda de alimentação elétrica externa.
54. 38
A coincidente perda de potência da Usina e rede externa
pode ocorrer se por exemplo, a transferência para a rede externa
falhar após o TRIP da turbina. Neste caso existirá uma perda de
potência para os auxiliares da planta tais como: bombas de água
de circulação.
No lado do secundário, a estação de “bypass” de vapor
principal é bloqueada devido à perda das bombas de condensado
e das bombas de água de circulação, e a remoção de calor é
suprida pelas válvulas de alívio e de segurança do vapor
principal.
O suprimento de água de alimentação para os geradores
de vapores (GVs) é executado pelas bombas de partida e parada.
O modo de alimentação elétrica de emergência em curto prazo é
classificado como um transiente operacional. A planta se
estabiliza com a remoção de calor do lado secundário, sendo
realizada pelas válvulas de controle de alívio do vapor principal
até que o suprimento de potência auxiliar seja recuperado.
Caso o suprimento de potência não seja restaurado em 12
horas, a planta tem que ser transferida para a condição de
subcrítico frio. Este evento de longo prazo é analisado com
respeito a liberações radioativas no vapor aliviado para a
atmosfera.
LOCA (Evento Acidente)
Consiste na perda de refrigeração do reator
Neste trabalho exploramos a ocorrência de um pequeno
LOCA, sendo que existem as categorias grande e médio LOCA,
que é definido como uma ruptura com área de seção reta de
aproximadamente 5 cm de diâmetro das tubulações de
refrigerante do reator ou linhas de conexão, onde a pressão no
55. 39
Sistema de Refrigeração do Reator (SRR) se estabiliza entre 109
bar e 9 bar.
O núcleo permanece coberto, apesar de o nível do
Pressurizador (PZR) cair para < 2.28 m. Como a remoção de
calor no núcleo através do vazamento e da injeção do refrigerante
não é suficiente (no caso de seção de retas de ruptura muito
pequenas), a remoção de calor é auxiliada pelo lado secundário.
Sendo assumido para este cenário, modo de alimentação
elétrica de emergência coincidente. A característica típica de um
LOCA pequeno é que o vazamento do refrigerante pode ser
reposto dentro de uma faixa de pressão entre 109 e 9 bar, isto é,
as bombas de injeção de segurança e as bombas de boração
possivelmente auxiliadas pelos acumuladores, repõem o
vazamento e desenvolvem uma pressão no Sistema de
Refrigeração do Reator (SRR) a um nível maior que o da pressão
de saturação, que esta caindo de 25 bar, os acumuladores não
descarregam.
Uma parte do calor é retirada através do lado secundário
pelo resfriamento a 100 Km/h, uma vez que o SRR está cheio e
subresfriado, a transferência de calor no núcleo é mantida,
enquanto a circulação natural (as Barras do Sistema de
Resfriamento (BRRS) estão desligadas), permite a transferência
de calor para o lado secundário, a outra parte do calor
(dependendo do tamanho da ruptura) é descarregada através da
ruptura. Apenas uma leve pressão (teoricamente até
aproximadamente 1 bar), se desenvolve na contenção. A
liberação da radioatividade é interrompida pelo isolamento da
ventilação do prédio de contenção.
SGTR (Evento Acidente)
56. 40
Consiste em rupturas nos tubos geradores de vapor.
Na ocorrência de vazamentos nos tubos em U dos geradores de
vapor, haverá uma transferência de refrigerante radioativo para o circuito
de água vapor, devido à alta diferença de refrigerante radioativo para
circuito de água vapor e, a alta diferença de pressão existente entre o lado
primário e o secundário.
As principais funções das ações automáticas e manuais que se
desenvolvem, são as de restringir a perda de refrigerante e a de limitar os
efeitos do acidente para que não haja liberação de vapor radioativo
através das válvulas de alívio para a atmosfera, para isso as potências do
reator e do gerador devem ser reduzidas o mais rápido possível.
Com o funcionamento das Barras do Sistema de Resfriamento
(BRRS), é mantida a circulação forçada evitando a formação de bolhas
de vapor na região da tampa do vaso de pressão do reator, com a pressão
do sistema de refrigeração do reator reduzida.
Com o condensador como fonte fria evita-se que o vapor
principal radioativo seja liberado para o meio ambiente. Com a redução
da potência, e com a redução da pressão do sistema de refrigeração a
diferença de pressão entre o lado primário e secundário é reduzida
diminuindo a taxa de vazamento.
ALVARENGA (1997) programou a simulação da variação temporal dos
acidentes/transientes apresentados acima. O tempo total da amostragem foi de 61
segundos, onde o primeiro segundo corresponde a condição normal de potência e o
segundo segundo o início do TRIP do reator.
O tempo de 61 segundos foi considerado suficiente para que os acidentes
possam ser destacados uns dos outros, devido à evolução de uma ou mais variáveis de
estado do sistema, consideradas como aquelas que mais contribuem para a
57. 41
caracterização dos acidentes/transientes em questão. As amostragens dessas variáveis
foram feitas com intervalos de um segundo.
Existem diversas variáveis na Usina Nuclear, as variáveis de processo
selecionadas para o reconhecimento do evento em curso, foram escolhidas por seu
sentido físico em relação aos acidentes, sendo assim, primeiramente não foi levado em
consideração à quantidade de variáveis e sim quais possuem relacionamento físicos com
os acidentes em questão. Desta forma, neste trabalho, principalmente para efeitos de
comparação com os trabalhos desenvolvidos por ALMEIDA (2001), MEDEIROS
(2005) e NICOLAU (2010), as variáveis selecionadas encontram-se listadas na tabela
4.1.
58. 42
TABELA 4.1 - Variáveis de estado dos acidentes/transientes.
1. Vazão do núcleo (%)
2. Temperatura da perna quente (C)
3. Temperatura da perna fria (C )
4. Vazão no núcleo (kg/s )
5. Nível no gerador de vapor – faixa larga (% )
6. Nível no gerador de vapor – faixa estreita (% )
7. Pressão no gerador de vapor (Mpa)
8. Vazão de água de alimentação (kg/s )
9. Vazão de vapor (kg/s )
10. Vazão na ruptura (kg/s )
11. Vazão no circuito primário (kg/s )
12. Tempo (s)
13. Pressão no sistema primário (Mpa )
14. Potência térmica (% )
15. Potência nuclear (%)
16. Margem de sub-resfriamento (C)
17. Nível do pressurizador (%)
18. Temperatura média no primário (C)
59. 43
A figura 4.2 mostra a evolução temporal (assinatura) de todas as variáveis de
estado listadas na tabela 4.1 para os três acidentes/transientes selecionados,
considerando a Usina operando a 100% de potência nominal. A linha em vermelho
representa o SGTR, a linha em verde representa o LOCA e a linha em azul representa o
BLACKOUT, onde os índices das variáveis nas figuras correspondem as variáveis de
estado listadas na tabela 4.1.
FIGURA 4.2 - Assinatura das variáveis de estado para cada um dos 3 acidentes
postulados considerando a Usina operando a 100% de potência nominal.
A figura 4.3 mostra a evolução temporal do BLACKOUT, a figura 4.4 a
evolução temporal do LOCA e a figura 4.5 mostra a evolução temporal do SGTR.
60. 44
FIGURA 4.3 - Assinatura das variáveis de estado do BLACKOUT considerando a
Usina operando a 100% de potência nominal.
FIGURA 4.4 - Assinatura das variáveis de estado do LOCA considerando a Usina
operando a 100% de potência nominal.
61. 45
FIGURA 4.5 - Assinatura das variáveis de estado do SGTR considerando a Usina
operando a 100% de potência nominal.
4.3 – Normalização de Dados
As variáveis dos acidentes/transientes selecionados neste trabalho, como descrito
na tabela 4.1, possuem valores em diferentes escalas (unidades de medida). A
necessidade de harmonizar estas escalas foi suprida através da normalização dos valores
dos atributos.
O método de normalização escolhido para este trabalho foi o MAX-MIN
Equalizado (THOME (2008)), que utiliza o valor máximo e mínimo para normalizar
linearmente os dados entre [0,1], sendo utilizada a seguinte equação:
( )
( ) ( )
(17)
( )
Onde ( ) é o valor normalizado da variável , ( ) é o menor dos valores
da variável e ( ) é o maior dos valores da variável .