Skip to content

Explore Python para análise de dados com este repositório. Desenvolva um modelo de regressão linear para prever casos de dengue e utilize aprendizado de máquina para classificar dados do conjunto Iris.

Notifications You must be signed in to change notification settings

eudavidreis-odev/python_data_manage_example

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 

Repository files navigation

Projetos de Estudos em Python para Análise de Dados

Este repositório contém dois projetos de estudos em Python para análise de dados.

Projeto 1: Regressão Linear para Previsão de Casos de Dengue

Este projeto da faculdade de Ciência da Computação utiliza regressão linear para prever o número de casos de dengue com base em dados históricos de anos anteriores.

Descrição

O objetivo deste projeto é desenvolver um modelo de regressão linear simples para prever o número de casos de dengue em um determinado ano com base nos dados históricos de casos de anos anteriores. O modelo é desenvolvido utilizando a biblioteca scikit-learn em Python.

Pré-requisitos

Antes de executar este projeto, é necessário ter o seguinte instalado:

  • Python 3
  • Bibliotecas Python: scikit-learn, matplotlib, pandas

Como usar

  1. Clone este repositório:
    git clone https://github.com/eudavidreis-odev/python_data_manage_example.git
  1. Navegue até o diretório do projeto:
    cd python_data_manage_example
  1. Instale as dependências:
    pip install -r requirements.txt
  1. Execute o script principal:
    python regressao.py

Projeto 2: Python Aplicado a Big Data

Este projeto faz parte dos meus estudos na faculdade, onde estou explorando Python aplicado a Big Data. O objetivo é utilizar técnicas de aprendizado de máquina para análise de dados.

Descrição

Neste projeto, utilizamos o conjunto de dados Iris e técnicas de aprendizado de máquina para classificação. O conjunto de dados Iris é um conjunto de dados clássico frequentemente usado para fins de aprendizado de máquina.

Pré-processamento

Nesta etapa, realizamos o pré-processamento dos dados, que incluiu a coleta, integração e particionamento dos dados.

    from sklearn.datasets import load_iris
    from sklearn.model_selection import train_test_split

    # Coleta e Integração
    iris = load_iris()
    caracteristicas = iris.data
    rotulos = iris.target

    # Partição dos dados
    carac_treino, carac_teste, rot_treino, rot_teste = train_test_split(caracteristicas, rotulos)

Mineração de Dados

Nesta seção, aplicamos técnicas de aprendizado de máquina para extrair informações úteis dos dados.

Árvore de Decisão

    from sklearn.tree import DecisionTreeClassifier
    from sklearn.metrics import accuracy_score
    from sklearn.tree import export_text

    # Criação e treinamento do modelo
    arvore = DecisionTreeClassifier(max_depth=2)
    arvore.fit(X=carac_treino, y=rot_treino)

    # Avaliação do modelo
    rot_preditos = arvore.predict(carac_teste)
    acuracia_arvore = accuracy_score(rot_teste, rot_preditos)

    # Exibição da estrutura da árvore
    r = export_text(arvore, feature_names=iris['feature_names'])
    print("Estrutura da árvore")
    print(r)

    print("Acurácia Árvore de Decisão:", round(acuracia_arvore, 5))

Máquina de Vetor de Suporte (SVM)

    from sklearn.svm import SVC

    # Criação e treinamento do modelo
    clf = SVC()
    clf.fit(X=carac_treino, y=rot_treino)

    # Avaliação do modelo
    rot_preditos_svm = clf.predict(carac_teste)
    acuracia_svm = accuracy_score(rot_teste, rot_preditos_svm)

    print("Acurácia SVM:", round(acuracia_svm, 5))

Pós-processamento

Na etapa final, exibimos os resultados obtidos após a mineração de dados.

    print("Acurácia Árvore de Decisão:", round(acuracia_arvore, 5))
    print("Acurácia SVM:", round(acuracia_svm, 5))

Este projeto visa não apenas aplicar algoritmos de aprendizado de máquina, mas também entender o processo de análise de dados e como esses algoritmos são utilizados para resolver problemas do mundo real.

About

Explore Python para análise de dados com este repositório. Desenvolva um modelo de regressão linear para prever casos de dengue e utilize aprendizado de máquina para classificar dados do conjunto Iris.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages