Classificação de Nucleotídeos Utilizando Redes Perceptron

    O Perceptron é muito utilizado em problemas de classificação simples. Mostraremos então, esta rede sendo utilizada para classificar bases de nucleotideos.

    Na verdade, esta aplicação possui caráter didático, mostrando tanto o funcinamento do Perceptron, como a codificação de dados biológicos.

Nucleotídeos

    O DNA é formado por um encadeamenteo de nucleotídeos e organizado em duas fitas, formando uma dupla hélice e sua função relaciona-se com armazenamento e transmissão da informação genética de um organismo. Os nucleotídeos que formam o DNA, são moléculas formadas por uma pentose ( 2'desoxyribose) ligada a uma base orgânica e a um ácido fosfórico. Estas bases orgânicas podem ser Adenina, Guanina, Citosina e Timina, comumente representadas por sua letra inicial, A, G, C, T, respectivamente.

    As bases orgânicas que compõem os nucleotídeos são formadas por anéis contendo carbono e nitrogênio. A Adenina e a Guanina, possuem dois destes aneis e são classificadas como purinas. Já a Citosina e a Timina, possem apenas um anel formado de carbono e nitrogênio e são classificadas como pirimidinas.

    Para manter a estrutura do DNA, estas bases são combinadas aos pares, de forma que uma purina seja ligada a uma pirimidina. As ligações padrão são A - T, uma purina (Adenina), com uma pirimidina (Timina) ou G - C, uma purina (Guanina) com uma pirimidina (Citosina). Apesar de ocorrerem outras combinações, são alterações muito raras.

Modelo do Classificador

    Uma Rede Perceptron foi construída de forma a classificar com sucesso as bases de nucleotídeos em purinas ou pirimidinas. É dado como entrada, a inicial da base que se deseja classificar, que é codificada segundo um padrão e a resposta é purina, caso a saída seja acima de 0, ou pirimidina, caso a saída seja igual a zero.

    Para representar a entrada ao Perceptron, a codificação utilizada retrata algumas características das bases orgânicas, que diferenciam uma classe da outra:

    Utilizando tal codificação para a classificação das bases, o Perceptron chega à seguinte área de decisão:

    Observa-se que, para a codificação utilizada, as classes são linearmente separáveis e, portanto, podem ser classificadas por um Perceptron simples.

    A figura abaixo mostra a arquitetura utilizada:

 

Código Fonte

O programa do Perceptron foi escrito em C: listagem do código

Próxima Página