1) O documento apresenta conceitos de machine learning, incluindo definições, exemplos de tarefas como classificação e regressão, e métodos de aprendizado supervisionado e não supervisionado.
2) Regressão linear é explicada como um exemplo de aprendizado supervisionado, onde um modelo é treinado para prever valores Y com base em valores X, minimizando o erro entre previsões e valores reais.
3) O método de aprendizado busca estimar os parâmetros a e b da equação linear Y = aX + b que melhor se ajustam aos dados de trein
2. Short bio
SENAI: Torneiro Mecânico + Mecânico Multifuncional
FGV/EAESP: Graduação em Administração de Empresas
ETEC Rubens de Faria: Técnico em Mecânica
ITA : Mestrado em Eng. Da Computação
Fundador/CEO da J!Quant
APIs de IA/Otimização
Soluções – Enterprise SaaS
4. O que é Machine Learning?
4
Inteligência Artificial
5. O que é Machine Learning?
5
Inteligência Artificial
Fraca Forte
6. O que é Machine Learning?
6
Inteligência Artificial
Fraca Forte
Um algoritmo que tenha
comportamentos
semelhantes à mente
humana.
Um algoritmo que
constitua, seja uma
mente como a humana.
7. Definição de Machine Learning
7
"A computer program is said to learn from experience E
with respect to some class of tasks T and performance
measure P, if its performance at tasks in T, as measured
by P, improves with experience E"
Mitchell, T. (1997). Machine Learning, McGraw Hill. p.2.
9. Definição de Machine Learning
9
Aprendizado = generalização do conhecimento
Dados conhecidos
Ex: Vendas dos últimos 3 anos
10. Definição de Machine Learning
10
Aprendizado = generalização do conhecimento
Dados conhecidos
Ex: Vendas dos últimos 3 anos
Modelo
“treinamento”
11. Definição de Machine Learning
11
Aprendizado = generalização do conhecimento
Dados conhecidos
Ex: Vendas dos últimos 3 anos
Modelo
“treinamento” “previsão”
Dados desconhecidos
Ex: Vendas do próximo ano
12. Classificação
12
Tarefa Tipo
Classificação Supervisionado / Semi-Supervisionado
Regressão Supervisionado
Clusterização Não-Supervisionado
Estimativa de Densidade Não-Supervisionado
Redução de Dimensionalidade Não-Supervisionado
+ Aprendizagem por Reforço *
17. 17
Natureza dos algoritmos
𝒙𝒙𝟐𝟐 − 𝟓𝟓𝟓𝟓 + 𝟔𝟔
Como resolver?
Método Newton-Raphson
Começar de um “chute inicial”
e melhorar aos poucos.
18. 18
Natureza dos algoritmos
𝒙𝒙𝟐𝟐 − 𝟓𝟓𝟓𝟓 + 𝟔𝟔
Como resolver?
Método Newton-Raphson
Começar de um “chute inicial”
e melhorar aos poucos.
iterativamente
29. 29
Regressão
X Y
0 2,898319
1 5,839758
2 7,850841
3 6,523894
4 10,33009
5 13,21322
6 15,56836
7 14,09511
8 16,04708
9 21,49065
10 ?
11 ?
12 ?
13 ?
Dados conhecidos!
Você está mostrando, para cada X, qual é o Y correto.
30. 30
Regressão
X Y
0 2,898319
1 5,839758
2 7,850841
3 6,523894
4 10,33009
5 13,21322
6 15,56836
7 14,09511
8 16,04708
9 21,49065
10 ?
11 ?
12 ?
13 ?
Dados conhecidos!
Você está mostrando, para cada X, qual é o Y correto.
Aprendizagem ~SUPERVISIONADA~
31. 31
Regressão
X Y
0 2,898319
1 5,839758
2 7,850841
3 6,523894
4 10,33009
5 13,21322
6 15,56836
7 14,09511
8 16,04708
9 21,49065
10 ?
11 ?
12 ?
13 ?
Método de Aprendizado
Método de Previsão
32. 32
Regressão (linear)
X Y
0 2,898319
1 5,839758
2 7,850841
3 6,523894
4 10,33009
5 13,21322
6 15,56836
7 14,09511
8 16,04708
9 21,49065
10 ?
11 ?
12 ?
13 ?
Método de Aprendizado
Y = aX + b
33. 33
Regressão (linear)
X Y
0 2,898319
1 5,839758
2 7,850841
3 6,523894
4 10,33009
5 13,21322
6 15,56836
7 14,09511
8 16,04708
9 21,49065
10 ?
11 ?
12 ?
13 ?
Método de Aprendizado
Y = aX + b
Precisamos achar a e b !
34. 34
Regressão (linear)
X Y
0 2,898319
1 5,839758
2 7,850841
3 6,523894
4 10,33009
5 13,21322
6 15,56836
7 14,09511
8 16,04708
9 21,49065
10 ?
11 ?
12 ?
13 ?
Método de Aprendizado
Y = aX + b
Precisamos achar a e b !
Com qual propósito?
35. 35
Regressão (linear)
X Y
0 2,898319
1 5,839758
2 7,850841
3 6,523894
4 10,33009
5 13,21322
6 15,56836
7 14,09511
8 16,04708
9 21,49065
10 ?
11 ?
12 ?
13 ?
Método de Aprendizado
Y = aX + b
Precisamos achar a e b !
Com qual propósito objetivo?
44. 44
Classificação
• Mesma idéia da regressão
• Output não é um número real
• Avalia o acerto da classificação em categorias
• Regressão Regressão Logística
Input Método
Categoria A
Categoria B
Categoria C
1
2
3
55. 55
Clusterização
• Objetivo: Agrupar dados semelhantes (formar clusters)
•
• Não é dado um “gabarito” ao algoritmo (ele seria a resposta, não?)
• Necessária uma regra de “similaridade”
• Ex: Distância Euclideana
Aprendizagem ~NÃO-SUPERVISIONADA~
59. 59
Clusterização
X Y
3,63 5,25
4,70 5,48
5,07 5,66
5,70 7,43
6,02 7,46
6,26 5,05
7,24 5,99
12,58 20,47
13,60 20,05
13,02 18,62
12,89 20,27
12,80 17,83
13,97 20,19
12,42 20,36
Cluster A
Centroide (médias em X e Y)
X = 7,16
Y = 8,75
Cluster B
Centroide (médias em X e Y)
X = 8,75
Y = 20,27
60. 60
Clusterização Cluster A
Distância média de cada ponto
até o centroide do cluster
45,22/9 = 5,02
Cluster B
X Y Dist
3,63 5,25 4,97
4,70 5,48 4,09
5,07 5,66 3,73
5,70 7,43 1,97
6,02 7,46 1,72
6,26 5,05 3,81
7,24 5,99 2,76
12,58 20,47
13,60 20,05
13,02 18,62 11,47
12,89 20,27
12,80 17,83 10,69
13,97 20,19
12,42 20,36
61. 61
Clusterização Cluster A Cluster B
X Y Dist
3,63 5,25
4,70 5,48
5,07 5,66
5,70 7,43
6,02 7,46
6,26 5,05
7,24 5,99
12,58 20,47 0,55
13,60 20,05 0,55
13,02 18,62
12,89 20,27 0,21
12,80 17,83
13,97 20,19 0,88
12,42 20,36 0,68
2,86/5 = 0,5745,22/9 = 5,02
Distância média de cada ponto
até o centroide do cluster
Distância média de cada ponto
até o centroide do cluster
62. 62
Clusterização Cluster A Cluster B
Devemos alterar os membros de cada cluster
até alcançar a distância mínima entre os pontos
de cada cluster e seu centroide!
45,22/9 = 5,02
Distância média de cada ponto
até o centroide do cluster
Distância média de cada ponto
até o centroide do cluster
2,86/5 = 0,57
63. 63
Clusterização Cluster A Cluster B
Centróide (médias em X e Y)
X = 5,52
Y = 6,05
Centróide (médias em X e Y)
X = 13,04
Y = 19,68
X Y Dist
3,63 5,25 2,05
4,70 5,48 1,00
5,07 5,66 0,59
5,70 7,43 1,39
6,02 7,46 1,51
6,26 5,05 1,24
7,24 5,99 1,73
12,58 20,47 0,91
13,60 20,05 0,67
13,02 18,62 1,07
12,89 20,27 0,60
12,80 17,83 1,87
13,97 20,19 1,06
12,42 20,36 0,91
64. 64
Clusterização Cluster A Cluster B
9,50/7 = 1,36
Distância média de cada ponto
até o centroide do cluster
Distância média de cada ponto
até o centroide do cluster
7,10/7 = 1,01
X Y Dist
3,63 5,25 2,05
4,70 5,48 1,00
5,07 5,66 0,59
5,70 7,43 1,39
6,02 7,46 1,51
6,26 5,05 1,24
7,24 5,99 1,73
12,58 20,47 0,91
13,60 20,05 0,67
13,02 18,62 1,07
12,89 20,27 0,60
12,80 17,83 1,87
13,97 20,19 1,06
12,42 20,36 0,91
68. 68
Aprendizagem por Reforço (Reinforcement Learning / Neuro-dynamic programming)
Você não consegue dizer ao seu cachorro o que
fazer, mas ainda sim consegue ensiná-lo ao dar
bonificações/penalizações de acordo com suas
ações.
69. 69
Aprendizagem por Reforço (Reinforcement Learning / Neuro-dynamic programming)
• Tomada de decisão sequencial
• Maximização da soma das recompensas descontadas
Agente
Ambiente
Recompensa
Estado
Ação