Apresenta195167195es dos AlunosTopObjectivos, Programa, DocenteAvaliação e funcionamento das aulas

Avaliação e funcionamento das aulas

Num total de 10:

  1. Trabalho em grupo: 5 Valores
  2. Teste: 5 Valores

Mini Projeto

A entrega consiste num arquivo zip ou tar a enviar por mail com o subject BIOINFO: Mini-Projeto. O arquivo zip deverá conter o código e um pequeno relatório de 1 ou no máximo 2 páginas por trabalho descrevendo a implementação, e dando exemplos.

  1. Implementação de Algoritmos de Programação Dinâmica:
  2. Utilização de Blast:
  3. Implementação de Árvores Filogenéticas:

Projectos de Trabalho

Propôe-se um conjunto de projectos a realizar durante o curso. A entrega de cada projecto deverá incluir:

Os trabalhos de aprendizagem devem incluir avaliação de confiança nos resultados, usando técnicas como validação cruzada.

Métodos de Alinhamento Múltiplo

Dada famílias de proteínas do PFAM experimente várias ferramentas de alinhamento múltiplo de proteínas e compare:

Exemplos de ferramentas incluem CLUSTALW, T-COFFEE, ALIGN-M e MUSCLE.

Árvores filogenéticas

Dada famílias de proteínas do PFAM experimente várias ferramentas de construção de árvores filogenéticas:

Exemplos de ferramentas incluem PHYLIP, Mesquite, PAUP, mrbayes, e PHYML.

Alinhamento de genomas completos

Dado genoma de várias vertebrados tente alinhar regiões semelhantes usando ferramentas como Mulan e Pecan

Identificação de sítios de splicing

Expressão de Genes com Learning

Para os seguintes conjuntos de dados tente avaliar as as seguintes técnicas: árvores de decisão, k-NN, naive bayes e SVMs para identificar se um determinado um padrão pertence a cada classe. O desempenho dos classificadores gerados deverá ser avaliado primeiro por validação cruzada e depois com o conjunto de teste, se disponível.

Antes de começar a desenvolver os experimentos, como há muitos atributos no conjunto de dados considerado (e poucos exemplos), é esperado que muitos desses atributos sejam irrelevantes para a discriminação entre as classes, ou seja, terminam agindo mais como ruído. Portanto, é desejável usar um filtro para fazer uma seleção de atributos (por exemplo, selecionar apenas aqueles atributos que sejam mais importantes para a discriminação entre as classes no conjunto de treinamento). Use as ferramentas do Weka para remoção de atributos.

Depois de ter feito o pré-processamento acima:

  1. Treine uma classificador usando o seguinte conjunto de atributos:
  2. Compare os resultados obtidos com as diferentes escolhas de limiar (500, 100 e 50 genes) para cada um dos métodos separadamente (árvores de decisão, perceptrons e k-NN). Também compare os resultados obtidos entre os diferentes métodos.

Encontrar Padrões em Moléculas

O objectivo do trabalho é o de encontrar padrões típicos em pequenas moléculas:

ncRnA

Procure várias famílias de ncRNA na base de dados RFAM:

Artigos de Investigação

Os seguintes artigos não são um estudo exaustivo da área, mas tentam mostrar algumas áreas de interesse:


Vítor Santos Costa, October 9, 2012


Apresenta195167195es dos AlunosTopObjectivos, Programa, DocenteAvaliação e funcionamento das aulas