Skip to content

TKLB-OECU/MWS2021-n-gram-glove

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

n-gram + GloVeによる分散表現の作成

環境構築

docker-compose build
docker-compose up -d 
docker exec -it python3_malware bash
cd glove 
git clone https://github.com/stanfordnlp/glove
cd glove && make

実行方法

まず、はじめにdocker exec -it python3_malware bashを実行しDocker内に入る。

学習データの作成

FFRI2021 Dataから学習データを作成する。
share/data内にFFRI2021 Datasetを配置し、malwareの学習データを作成するshare/program/create_dataset_malware.pyとcleanの学習データを作成するshare/program/create_dataset_cleanware.pyを実行することで学習データを作成することができる。

n-gram + GloVeによる分散表現

そして、n-gram + GloVeによる分散表現を行う。
share/grobe内に移動し、python main.pyを実行する。
hydraを使用しているためpython main.py -m glove.N_gram=2,3,4,5,6,7のように実行することでn-gramの範囲を2〜7として実行できる。

ライブラリ

GloVe:https://nlp.stanford.edu/projects/glove/
hydra:https://github.com/facebookresearch/hydra

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published