DC-UFRPE/Bacharelado em Ciência da Computação/Inteligência Artificial/aprendizado nao supervisionado
No aprendizado não supervisionado não existe um agente externo indicando a resposta desejada para os padrões de entrada. Temos apenas os padrões de entrada sem as saídas desejadas, só é possível realizar com redundância dos dados. Exemplo: separar laranjas de maçãs (tamanho, formato).
Separação do conjunto de dados:
- Conjunto de treinamento: Disponível na fase de modelagem.
- Conjunto de validação: Tem a finalidade de evitar a super adaptação do modelo aos dados de treinamento. A ideia é que durante o treino se vá estimando o erro de generalização no conjunto de validação (quando o erro neste conjunto aumentar, o treino deve parar).
- Conjunto de teste: Avalia o quão bom é o modelo gerado para a generalização.
Quando o modelo aprende o conjunto de treinamento sem decorá-lo, ocorre a generalização. O modelo também pode atingir 2 extremos durante o processo de aprendizagem:
- Overfitting: modelo se super ajusta ao conjunto de treinamento.
- Underfitting: Modelo não aprende o suficiente sobre o conjunto de treinamento nem do de validação.