Skip to content

Project ini tentang implementasi dari Streaming Data yang bersumber dari Twitter. Data tersebut berupa Tweet, user id serta tangggal tweet tersebut dibuat. Dalam streaming data dari twitter tersebut, digunakan library Apache Kafka menyimpan nya dalam database phpmyadmin

Notifications You must be signed in to change notification settings

rezasputra/Streaming-data-twitter

Repository files navigation

Streaming-data-twitter

Project ini tentang implementasi dari Streaming Data yang bersumber dari Twitter. Data tersebut berupa Tweet, user id serta tangggal tweet tersebut dibuat. Dalam streaming data dari twitter tersebut, digunakan library Apache Kafka menyimpan nya dalam database phpmyadmin

Twitter data stream.py berisikan program untuk terhubung dengan twitter api dan melakukan streaming menggunakan kafka

ETL proses.py berikan program untuk melakukan proses ekstraksi dari consumer kafka, transform untuk merubah data agar sesuai dengan skema yang telah ditentukan sehingga dapat dilakukan load kedalam phpmyadmin

Dump data.py berisikan program untuk mengambil seluruh data yang telah di load untuk dijadikan sebagai file csv

Contoh evaluasi Machine learning yang digunakan adalah Clustering yang dapat di lihat pada https://colab.research.google.com/drive/1mkUqC8y_iAIVnMvELVOez5cvRBvWEvTH?usp=sharing

About

Project ini tentang implementasi dari Streaming Data yang bersumber dari Twitter. Data tersebut berupa Tweet, user id serta tangggal tweet tersebut dibuat. Dalam streaming data dari twitter tersebut, digunakan library Apache Kafka menyimpan nya dalam database phpmyadmin

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published