Project

General

Profile

Overview

Atualmente a maior parte dos problemas de tomada de decisão não tem por desafio o tratamento numérico, mas a transformação de dados e informações em conhecimento, principalmente quando as bases de dados dizem respeito à saúde. Tais bases, em geral, possuem grande número de atributos (variáveis), pequeno número de ocorrências (instâncias) e grande número de valores ausentes, tornando os dados redundantes e irrelevantes, do ponto de vista da aprendizagem de máquina. O propósito central deste projeto é a experimentação de métodos de aprendizagem de máquina simples (J48), combinado com métodos de aprendizagem mais sofisticados (BAGGING e BOOSTING) sobre bases da área da saúde, a fim de se verificar a eficiência destes métodos e sugerir soluções eficientes para a descoberta de conhecimento. A verificação da eficiência dos métodos será feita por meio de curvas de aprendizagem resultantes da aplicação de cada um destes métodos ao mesmo conjunto de bases de dados da área da saúde. Para cada conjunto de bases de treinamento dever-se-á obter também o impacto do número de classificadores combinados sob a eficiência dos métodos BAGGING e BOOSTING. Um viés importante será à análise das bases na sua forma original e submetidas a uma técnica de seleção de atributos. A contribuição deste projeto será a realização de uma análise detalhada dos resultados que deverá culminar na recomendação de um dos métodos.