Sequence Clusterers

Framework of Methods for Clustering of Heterogeneous Event Sequences.

To train model:

python3 run.py --config_name config_thp.yaml +task_type=train

To use pretrained model for inference only:

python3 run.py --config_name config_ts.yaml +task_type=infer_only

To reproduce experiments, one should edit several config files:

- param. "data_name" in ~/configs/config_name.yaml to choose corresponging dataset; 
- hyperparams of corresponding method in ~/configs/model/name_of_method.yaml;
- training parameters (device, number of epochs, etc.) in ~/configs/trainer/default.yaml;
- hyperparameters of data preprocessing (max sequence length, batch size, etc.) in ~/configs/datamodule/name_of_datamodule.yaml;

Datasets: LinkedIn, Age, ATM, IPTV, Synthetic Hawkes processes realizations

The datasets are taken from cloud drive

Overview of the project: The project is the implementation of sequences clusterization methods using the common API and code structure that follows best practices of formatting. In the project we focus on proprietary method (aka Cohortney) and several baselines, including Convolutional Autoencoder, Transformer Hawkes Process, TsFresh and TsLearn feature extractors. The methods are refactored to fit Pytorch Lightning framework.

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
configs		configs
src		src
README.md		README.md
poppy_demo.ipynb		poppy_demo.ipynb
requirements.txt		requirements.txt
run.py		run.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Sequence Clusterers

About

Releases

Packages

Languages

adasegroup/pyDMHP

Folders and files

Latest commit

History

Repository files navigation

Sequence Clusterers

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages