unit-mesh
diff --git a/‎code/text-to-repository.py‎
Lines changed: 10 additions & 6 deletions b/‎code/text-to-repository.py‎
Lines changed: 10 additions & 6 deletions
diff --git a/‎datasets/sql/llm-prompts.json‎
Lines changed: 1 addition & 0 deletions b/‎datasets/sql/llm-prompts.json‎
Lines changed: 1 addition & 0 deletions
@@ -8,27 +8,31 @@
 # open datasets/sql/prompts.json
 # create id map for prompts in datasets/sql/prompts.json
 id_prompt_map = {}
-with open('../datasets/sql/prompts.json', 'r') as f:
+with open('../datasets/sql/llm-prompts.json', 'r') as f:
     data = json.loads(f.read())
     for row in data:
-        id_prompt_map[row['id']] = row['prompt']
+        id_prompt_map[row['id']] = row['requiredType']
 
 
 with open('../datasets/sql/repositories-5k.jsonl', 'r') as f:
     data = [json.loads(row) for row in f.readlines()]
 
     with open('../datasets/sql/repository-5k-train.jsonl', 'w') as f:
         for row in data:
-            print(row)
+            requiredType = ""
             id = int(row['id'])
+            if id in id_prompt_map:
+                # id_prompt_map[id] is a list, check if it is empty
+                if id_prompt_map[id]:
+                    requiredType = "###" + " ".join(id_prompt_map[id]) + "###"
+
             item = {
                 'instruction': 'text to kotlin repository with class',
-                'input': row['output'],
+                'input': row['output'] + "\n" + requiredType,
                 'output': row['input']
             }
 
-        f.write(json.dumps(item) + '\n')
-
+            f.write(json.dumps(item) + '\n')
 
     # 5kl to csv
     with open('../datasets/sql/repository-5k.csv', 'w') as f: