- Gustavo Henrique Martins
- Ícaro Botelho
- Maria Clara Seixa Scheffel
- Maruan Biasi El Achkar
- Ricardo Falcão Schlieper
- Detalhado em: /dataset
- Fonte: https://www.kaggle.com/datasets/jsphyg/weather-dataset-rattle-package
- K-Nearest Neighbors (KNN)
- Decision Tree Classifier (Tree-Based)
- Random Forest Classifier (Tree-Based)
- XGBoost Classifier (Tree-Based)
- LightGBM Classifier (Tree-Based)
- CatBoost Classifier (Tree-Based)
- Perceptron
- Gaussian Naive Bayes (Naive Bayes)
- Support Vector Classification (SVC)
- Multi-Layer Perceptron (MLPClassifier)
- AdaBoost Classifier (Ensemble Methods)
- Quadratic Discriminant Analysis (QDA)
Objetivo:
- Criar um programa classificador (comitê de Classificadores) com aprendizagem supervisionada e empregando ao menos 2 (dois) classificadores em um Data Set que possua rótulos verdadeiros da classe. Deve escolher um Data Set para aplicar a classificação. Após a classificação, deverá comparar os classificadores para chegar à conclusão de qual algoritmo de aprendizado de máquinas teve o melhor resultado.
Algoritmos Sugeridos:
- KNN
- Árvores de Decisão
- Redes Neurais
- Naive Bayes
- SVM
- etc.
Etapas para documentação:
-
Pesquisar e escolher um Data Set. Estudar o Data Set para conhecer as instâncias, as classes, as características dos atributos e as quantidades de instâncias e atributos, entre outras informações pertinentes.
-
Definir as informações do Data Set, das Instâncias e dos Atributos. Deve descrever a Base de Dados, explicando as variáveis, o que cada uma representa, quais os tipos de variáveis.
-
Definir qual será a variável target (rótulo da classe) que usará no projeto. Variável target será a variável de saída, a variável que se deseja “prever” algo, qual será a conclusão que se quer chegar.
-
Escolher no mínimo 2 (dois) algoritmos de Machine Learning para criar o comitê de classificadores.
-
O documento deve conter os resultados obtidos em cada Classificador. Apresentar as seguintes métricas: acurácia (taxa de acerto); taxa de erro; matriz de confusão com as métricas Precisão e Sensibilidade/Recall, F1. Esses resultados devem estar justificados.
-
Comparar os resultados do Comitê de Classificadores. Usar um gráfico do tipo Curva ROC (Receiver Operating Characteristics) para exibir a comparação entre os classificadores.
-
A entrega deve ser feita por um link Google Colab (outros formatos devem ser solicitados a priori).