Aprendizagem de Máquina (cont.)

Parte 1

Observe o exemplo dos comboios de Michalski apresentado na primeira aula prática (ver Figura 1 aqui).
  1. Faça uma representação de cada comboio, em formato de tabela (no excel ou similar), onde cada linha representa a descrição de um comboio e cada coluna representa uma de suas características (atributos). Adicione uma coluna extra para indicar se o comboio vai para o leste ou para o oeste. Salve o seu ficheiro em formato CSV (Comma-Separated Values).

  2. Abra o software WEKA (já deve estar instalado nas máquinas do lab). Clique em "Explorer". A seguir, na aba "Preprocess", clique em "Open file..." e abra o ficheiro CSV. Inspecione os atributos.
  3. Mude para a aba "Classify". A seguir, logo abaixo de "Classifier", clique em "Choose" e selecione "trees". A seguir, selecione "J48". Clique em "Start".
  4. No painel inferior esquerdo "Result list", selecione e clique com o botão da direita do mouse. Selecione "Visualize tree".

Parte 2

Observe a forma de cálculo do ganho de informação para os atributos do exemplo dos restaurantes, dado na aula teórica.
  1. Calcule o ganho de informação para os dois primeiros atributos da sua tabela de comboios e diga qual deles teria prioridade para ser adicionado mais próximo da raiz da árvore de decisão gerada.

Parte 3

Repita os passos da Parte 1 para o exemplo dos restaurantes.