Aprendizagem de Máquina (cont.)
Parte 1
Observe o exemplo dos comboios de Michalski apresentado na primeira
aula prática (ver Figura 1 aqui).
- Faça uma representação de cada comboio, em formato de tabela (no
excel ou similar), onde cada linha
representa a descrição de um comboio e cada coluna representa uma
de suas características (atributos). Adicione uma coluna extra para indicar se o
comboio vai para o leste ou para o oeste. Salve o seu ficheiro em formato CSV
(Comma-Separated Values).
- Abra o software WEKA (já deve estar instalado nas máquinas do
lab). Clique em "Explorer". A seguir, na aba "Preprocess", clique em
"Open file..." e abra o ficheiro CSV. Inspecione os atributos.
- Mude para a aba "Classify". A seguir, logo abaixo de
"Classifier", clique em "Choose" e selecione "trees". A seguir,
selecione "J48". Clique em "Start".
- No painel inferior esquerdo "Result list", selecione e clique com o botão da direita do
mouse. Selecione "Visualize tree".
Parte 2
Observe a forma de cálculo do ganho de informação para
os atributos do exemplo dos restaurantes, dado na aula teórica.
- Calcule o ganho de informação para os dois primeiros atributos da
sua tabela de comboios e diga qual deles teria prioridade para ser
adicionado mais próximo da raiz da árvore de decisão gerada.
Parte 3
Repita os passos da Parte 1 para o exemplo dos restaurantes.