DEVHARAM
diff --git a/‎.gitignore
Lines changed: 1 addition & 0 deletions b/‎.gitignore
Lines changed: 1 addition & 0 deletions
diff --git a/‎FFP/README.md
100644100755 b/‎FFP/README.md
100644100755
diff --git a/‎FFP/bar.py
Lines changed: 8 additions & 0 deletions b/‎FFP/bar.py
Lines changed: 8 additions & 0 deletions
diff --git a/‎FFP/load.py
100644100755
Lines changed: 18 additions & 19 deletions b/‎FFP/load.py
100644100755
Lines changed: 18 additions & 19 deletions
diff --git a/‎FFP/main.py
100644100755
Lines changed: 71 additions & 80 deletions b/‎FFP/main.py
100644100755
Lines changed: 71 additions & 80 deletions
diff --git a/‎FFP/module/__pycache__/ffp.cpython-36.pyc
100644100755 b/‎FFP/module/__pycache__/ffp.cpython-36.pyc
100644100755
diff --git a/‎FFP/module/__pycache__/frequency.cpython-36.pyc
100644100755 b/‎FFP/module/__pycache__/frequency.cpython-36.pyc
100644100755
diff --git a/‎FFP/module/__pycache__/initial.cpython-36.pyc
100644100755 b/‎FFP/module/__pycache__/initial.cpython-36.pyc
100644100755
diff --git a/‎FFP/module/ffp.py
100644100755
Lines changed: 41 additions & 46 deletions b/‎FFP/module/ffp.py
100644100755
Lines changed: 41 additions & 46 deletions
diff --git a/‎FFP/module/ffp.pyc
100644100755 b/‎FFP/module/ffp.pyc
100644100755
@@ -0,0 +1 @@
+FFP/save_model.sav
@@ -0,0 +1,8 @@
+import matplotlib.pyplot as plt
+
+y = [0.99, 0.93]
+x = ["Train" "Test"]
+
+plt.title("FFP")
+plt.bar(x, y)
+plt.show()
@@ -1,30 +1,29 @@
 import pickle
 from sklearn.metrics import accuracy_score
-from sklearn.metrics import classification_report,confusion_matrix
-from sklearn.svm import SVC
-import sys
-sys.path.append('module')
-import ffp
+from sklearn.metrics import classification_report
+from FFP.module import ffp
 
-def load(train_path,test_path,k):
-	 features=ffp.parsing(train_path,k)
-	 train=ffp.matrix(train_path,features,k)
 
-	 train_data=train[:,0:len(features)-1]
-	 train_label=train[:,len(features)-1]
+def load(train_path, test_path, k):
+	features = ffp.parsing(train_path, k)
+	train = ffp.matrix(train_path, features, k)
 
-	 test=ffp.matrix(test_path,features,k)
+	train_data = train[:, 0:len(features)-1]
+	train_label = train[:, len(features)-1]
 
-	 test_data=test[:,0:len(features)-1]
-	 test_label=test[:,len(features)-1]
-	 
-	 loaded_model = pickle.load(open("save_model.sav", 'rb'))
+	test = ffp.matrix(test_path, features, k)
 
-	 pred=loaded_model.predict(test_data)
+	test_data = test[:, 0:len(features)-1]
+	test_label = test[:, len(features)-1]
 
-	 print("Test k :"+str(k)+" = "+str(accuracy_score(test_label,pred)))
+	loaded_model = pickle.load(open("save_model.sav", 'rb'))
+
+	pred = loaded_model.predict(test_data)
+
+	print("Test k :"+str(k)+" = "+str(accuracy_score(test_label,pred)))
+
+	print(classification_report(test_label, pred, target_names=['class 0', 'class 2']))
+	return accuracy_score(test_label, pred)
 
-	 print(classification_report(test_label, pred, target_names=['class 0','class 2']))
-	 return accuracy_score(test_label,pred)
 
 load("public/train.txt","public/test.txt",2)
@@ -1,98 +1,89 @@
-import numpy as np
-import pydotplus
-import collections
 from sklearn.svm import SVC
 from sklearn.metrics import accuracy_score
-from sklearn.metrics import classification_report,confusion_matrix
+from sklearn.metrics import classification_report
 from sklearn.model_selection import GridSearchCV
-import sys
-sys.path.append('module')
-import ffp
-import matplotlib as mpl
-import matplotlib.pylab as plt
-import multiprocessing as mp
-import initial
-import frequency
+from FFP.module import ffp, initial, frequency
 import pickle
 
-def preprocess(path,p):
-	 count=0
-	 
-	 indexs=frequency.convert_index(path,"public/first.txt",p)
-
-	 with open("public/first.txt",'r') as f:
-		  read=f.read()
-		  for index in indexs:
-				 read=read.replace(index,initial.initial(index))
-
-	 with open("public/second.txt",'w') as f:
-		  for line in read.split('\n'):
-				 if line != '\n':
-					  f.write(line+'\n')
-
-	 with open("public/second.txt",'r') as In:
-		  with open("public/third.txt",'w') as Out:
-				 for line in iter(lambda: In.readline(),''): 
-					  if line[0]=='2' or line[0]=='0' :
-						   print(line)
-						   count+=1
-						   Out.write(line)
-	 
-	 train_num = int(count*0.8)
-	 test_num = count-train_num
-
-	 with open("public/third.txt",'r') as In:
-		  with open("public/train.txt",'w') as train:
-				 for i in range(train_num):
-					  train.write(In.readline())
-
-		  with open("public/test.txt",'w') as test:
-				 for i in range(test_num):
-					  test.write(In.readline())
-
-
-def work(train_path,test_path,k):
-
-	 features=ffp.parsing(train_path,k)
-	 train=ffp.matrix(train_path,features,k)
-
-	 train_data=train[:,0:len(features)-1]
-	 train_label=train[:,len(features)-1]
-	 
-	 test=ffp.matrix(test_path,features,k)
-	  
-	 test_data=test[:,0:len(features)-1]
-	 test_label=test[:,len(features)-1]
-	 gamma_range=[0.01,0.1,1.0,10.0]
-
-	 parameter_grid=[
-				{'gamma':gamma_range,'kernel':['rbf']},
+
+def preprocess(path, p):
+	count = 0
+
+	indexs=frequency.convert_index(path, "public/first.txt", p)
+
+	with open("public/first.txt", 'r') as f:
+		read=f.read()
+		for index in indexs:
+			read=read.replace(index,initial.initial(index))
+
+	with open("public/second.txt", 'w') as f:
+		for line in read.split('\n'):
+			if line != '\n':
+				f.write(line+'\n')
+
+	with open("public/second.txt",'r') as In:
+		with open("public/third.txt",'w') as Out:
+			for line in iter(lambda: In.readline(), ''):
+				if line[0] == '2' or line[0] == '0':
+					print(line)
+					count += 1
+					Out.write(line)
+
+	train_num = int(count*0.8)
+	test_num = count-train_num
+
+	with open("public/third.txt", 'r') as In:
+		with open("public/train.txt", 'w') as train:
+			for i in range(train_num):
+				train.write(In.readline())
+
+		with open("public/test.txt", 'w') as test:
+			for i in range(test_num):
+				test.write(In.readline())
+
+
+def work(train_path, test_path, k):
+
+	features = ffp.parsing(train_path, k)
+	train = ffp.matrix(train_path, features, k)
+
+	train_data = train[:, 0:len(features)-1]
+	train_label = train[:, len(features)-1]
+
+	test=ffp.matrix(test_path, features, k)
+
+	test_data = test[:, 0:len(features)-1]
+	test_label = test[:, len(features)-1]
+	gamma_range = [0.01, 0.1, 1.0, 10.0]
+
+	parameter_grid = [
+				{'gamma': gamma_range, 'kernel': ['rbf']},
 				]
-	 grid=GridSearchCV(SVC(),parameter_grid,scoring='accuracy',cv=5)
-	 grid.fit(train_data,train_label)
-	 print('best params:',grid.best_params_)
+	grid=GridSearchCV(SVC(), parameter_grid, scoring='accuracy', cv=5)
+	grid.fit(train_data, train_label)
+	print('best params:', grid.best_params_)
 
 #insert best params to test
-	 clf=SVC(**grid.best_params_)
-	 clf=clf.fit(train_data,train_label)
+	clf = SVC(**grid.best_params_)
+	clf = clf.fit(train_data, train_label)
 
-	 filename = 'save_model.sav'
-	 pickle.dump(clf, open(filename, 'wb'))
+	filename = 'save_model.sav'
+	pickle.dump(clf, open(filename, 'wb'))
 
-	 pred=clf.predict(train_data)
-	 print("Train k :"+str(k)+" = "+str(accuracy_score(train_label,pred))) 
+	pred = clf.predict(train_data)
+	print("Train k :"+str(k)+" = "+str(accuracy_score(train_label, pred)))
 
-	 print(classification_report(train_label, pred, target_names=['class 0','class 1']))
+	print(classification_report(train_label, pred, target_names=['class 0', 'class 1']))
 
-	 pred=clf.predict(test_data)
-	 print("Test k :"+str(k)+" = "+str(accuracy_score(test_label,pred)))
+	pred=clf.predict(test_data)
+	print("Test k :"+str(k)+" = "+str(accuracy_score(test_label, pred)))
 
-	 print(classification_report(test_label, pred, target_names=['class 0','class 1']))
-	 return accuracy_score(test_label,pred)
+	print(classification_report(test_label, pred, target_names=['class 0', 'class 1']))
+	return accuracy_score(test_label, pred)
 
-preprocess("simple.txt",1)
+preprocess("simple.txt", 1)
 
-work("public/train.txt","public/test.txt",2)
+work("public/train.txt", "public/test.txt", 2)
 
 """
 p = mp.Pool(3)
 
@@ -14,58 +14,53 @@
 
 """
 import numpy as np
-import pandas as pd
-from pandas import ExcelWriter
-from pandas import ExcelFile
 
-
-def matrix(path,features,k):
-
-	 num_lines=0
+def matrix(path, features, k):
+	num_lines = 0
 
 #count line
-	 with open(path, 'r') as f:
-		  for line in f:
-				 num_lines += 1
+	with open(path, 'r') as f:
+		for line in f:
+			num_lines += 1
 
-	 array = np.zeros([num_lines,len(features)],dtype='i')
-	 count=0
-	 with open(path,'r') as file_in:
-		  for read in iter(lambda: file_in.readline(),''):
-				 for num in range(1,int(len(read)/k)):
-					 feature=read[num:num+k]
-					 try:
-						  array[count][features.index(feature)]+=1
-					 except Exception:
-						  1+1
-					 if read[0]=='2':
-						  array[count][-1]=2
-					 else:
-						  array[count][-1]=0
-				 count+=1
+	array = np.zeros([num_lines, len(features)], dtype='i')
+	count=0
+	with open(path, 'r') as file_in:
+		for read in iter(lambda: file_in.readline(), ''):
+			for num in range(1, int(len(read)/k)):
+				feature=read[num:num+k]
+				try:
+					array[count][features.index(feature)]+=1
+				except Exception:
+					1+1
+				if read[0] == '2':
+					array[count][-1] = 2
+				else:
+					array[count][-1] = 0
+			count += 1
 
-	 return array
+	return array
 
-def parsing(path,k):
+def parsing(path, k):
+	features=[]
+	with open(path, 'r') as file_in:
+		for read in iter(lambda: file_in.readline(), ''):
+			for num in range(1, int(len(read)/k)):
+				feature = read[num:num+k]
+				if not feature in features:
+					features.append(feature)
+	features.append("score")
+	return features
 
-    features=[]
-    with open(path,'r') as file_in:
-        for read in iter(lambda: file_in.readline(),''):
-            for num in range(1,int(len(read)/k)):
-                feature=read[num:num+k]
-                if not feature in features:
-                    features.append(feature)
-    features.append("score")
-    return features
 
 def main():
-    k_range=list(range(2,4))
-    p_range=list(range(0.5,1,1.5))
-    for i in k_range:
-        features=parsing("test.txt",i)
-        result = matrix("test.txt",features,i)
-        final=np.shape(result)
-    '''
-    print(np.shape(result))
-    np.savetxt('foo.csv',result,delim
-	 '''
+	k_range = list(range(2, 4))
+	p_range = list(range(0.5, 1, 1.5))
+	for i in k_range:
+		features = parsing("test.txt", i)
+		result = matrix("test.txt", features, i)
+		final = np.shape(result)
+	'''
+	print(np.shape(result))
+	np.savetxt('foo.csv',result,delim
+	'''