NHLOCAL
diff --git a/‎machine-learn/custom_ner_model29+23-1git/config.cfg
Lines changed: 130 additions & 0 deletions b/‎machine-learn/custom_ner_model29+23-1git/config.cfg
Lines changed: 130 additions & 0 deletions
diff --git a/‎machine-learn/custom_ner_model29+23-1git/iteration_data.json
Lines changed: 122 additions & 0 deletions b/‎machine-learn/custom_ner_model29+23-1git/iteration_data.json
Lines changed: 122 additions & 0 deletions
diff --git a/‎machine-learn/custom_ner_model29+23-1git/meta.json
Lines changed: 40 additions & 0 deletions b/‎machine-learn/custom_ner_model29+23-1git/meta.json
Lines changed: 40 additions & 0 deletions
diff --git a/‎machine-learn/custom_ner_model29+23-1git/ner/cfg
Lines changed: 13 additions & 0 deletions b/‎machine-learn/custom_ner_model29+23-1git/ner/cfg
Lines changed: 13 additions & 0 deletions
diff --git a/‎machine-learn/custom_ner_model29+23-1git/ner/model
3.66 MB b/‎machine-learn/custom_ner_model29+23-1git/ner/model
3.66 MB
diff --git a/‎machine-learn/custom_ner_model29+23-1git/ner/moves
Lines changed: 1 addition & 0 deletions b/‎machine-learn/custom_ner_model29+23-1git/ner/moves
Lines changed: 1 addition & 0 deletions
diff --git a/‎machine-learn/custom_ner_model29+23-1git/tokenizer
Lines changed: 3 additions & 0 deletions b/‎machine-learn/custom_ner_model29+23-1git/tokenizer
Lines changed: 3 additions & 0 deletions
diff --git a/‎machine-learn/custom_ner_model29+23-1git/vocab/key2row
Lines changed: 1 addition & 0 deletions b/‎machine-learn/custom_ner_model29+23-1git/vocab/key2row
Lines changed: 1 addition & 0 deletions
diff --git a/‎machine-learn/custom_ner_model29+23-1git/vocab/lookups.bin
Lines changed: 1 addition & 0 deletions b/‎machine-learn/custom_ner_model29+23-1git/vocab/lookups.bin
Lines changed: 1 addition & 0 deletions
@@ -0,0 +1,130 @@
+[paths]
+train = null
+dev = null
+vectors = null
+init_tok2vec = null
+
+[system]
+seed = 0
+gpu_allocator = null
+
+[nlp]
+lang = "he"
+pipeline = ["ner"]
+disabled = []
+before_creation = null
+after_creation = null
+after_pipeline_creation = null
+batch_size = 1000
+tokenizer = {"@tokenizers":"spacy.Tokenizer.v1"}
+vectors = {"@vectors":"spacy.Vectors.v1"}
+
+[components]
+
+[components.ner]
+factory = "ner"
+incorrect_spans_key = null
+moves = null
+scorer = {"@scorers":"spacy.ner_scorer.v1"}
+update_with_oracle_cut_size = 100
+
+[components.ner.model]
+@architectures = "spacy.TransitionBasedParser.v2"
+state_type = "ner"
+extra_state_tokens = false
+hidden_width = 64
+maxout_pieces = 2
+use_upper = true
+nO = null
+
+[components.ner.model.tok2vec]
+@architectures = "spacy.HashEmbedCNN.v2"
+pretrained_vectors = null
+width = 96
+depth = 4
+embed_size = 2000
+window_size = 1
+maxout_pieces = 3
+subword_features = true
+
+[corpora]
+
+[corpora.dev]
+@readers = "spacy.Corpus.v1"
+path = ${paths.dev}
+gold_preproc = false
+max_length = 0
+limit = 0
+augmenter = null
+
+[corpora.train]
+@readers = "spacy.Corpus.v1"
+path = ${paths.train}
+gold_preproc = false
+max_length = 0
+limit = 0
+augmenter = null
+
+[training]
+seed = ${system.seed}
+gpu_allocator = ${system.gpu_allocator}
+dropout = 0.1
+accumulate_gradient = 1
+patience = 1600
+max_epochs = 0
+max_steps = 20000
+eval_frequency = 200
+frozen_components = []
+annotating_components = []
+dev_corpus = "corpora.dev"
+train_corpus = "corpora.train"
+before_to_disk = null
+before_update = null
+
+[training.batcher]
+@batchers = "spacy.batch_by_words.v1"
+discard_oversize = false
+tolerance = 0.2
+get_length = null
+
+[training.batcher.size]
+@schedules = "compounding.v1"
+start = 100
+stop = 1000
+compound = 1.001
+t = 0.0
+
+[training.logger]
+@loggers = "spacy.ConsoleLogger.v1"
+progress_bar = false
+
+[training.optimizer]
+@optimizers = "Adam.v1"
+beta1 = 0.9
+beta2 = 0.999
+L2_is_weight_decay = true
+L2 = 0.01
+grad_clip = 1.0
+use_averages = false
+eps = 0.00000001
+learn_rate = 0.001
+
+[training.score_weights]
+ents_f = 1.0
+ents_p = 0.0
+ents_r = 0.0
+ents_per_type = null
+
+[pretraining]
+
+[initialize]
+vectors = ${paths.vectors}
+init_tok2vec = ${paths.init_tok2vec}
+vocab_data = null
+lookups = null
+before_init = null
+after_init = null
+
+[initialize.components]
+
+[initialize.tokenizer]
@@ -0,0 +1,122 @@
+{
+  "0": {
+    "ner": 4802.388039036398
+  },
+  "1": {
+    "ner": 3438.4395032675866
+  },
+  "2": {
+    "ner": 2827.94393245209
+  },
+  "3": {
+    "ner": 2412.4572408230288
+  },
+  "4": {
+    "ner": 2188.735894150063
+  },
+  "5": {
+    "ner": 1908.96445147932
+  },
+  "6": {
+    "ner": 1894.3397682169134
+  },
+  "7": {
+    "ner": 1702.2257415071354
+  },
+  "8": {
+    "ner": 1615.2015468392465
+  },
+  "9": {
+    "ner": 1567.4141720728862
+  },
+  "10": {
+    "ner": 1428.0969692173633
+  },
+  "11": {
+    "ner": 1412.258335482977
+  },
+  "12": {
+    "ner": 1290.9376119847664
+  },
+  "13": {
+    "ner": 1287.4875631474988
+  },
+  "14": {
+    "ner": 1296.9892050374908
+  },
+  "15": {
+    "ner": 1203.507959512251
+  },
+  "16": {
+    "ner": 1140.983979298868
+  },
+  "17": {
+    "ner": 1194.259869129556
+  },
+  "18": {
+    "ner": 1103.1253703101077
+  },
+  "19": {
+    "ner": 1065.4706941012037
+  },
+  "20": {
+    "ner": 986.9654182265089
+  },
+  "21": {
+    "ner": 980.7948596421411
+  },
+  "22": {
+    "ner": 959.8385475552886
+  },
+  "23": {
+    "ner": 1011.502807016833
+  },
+  "24": {
+    "ner": 952.4556438620727
+  },
+  "25": {
+    "ner": 916.1662904750109
+  },
+  "26": {
+    "ner": 887.7737379491912
+  },
+  "27": {
+    "ner": 890.191895858633
+  },
+  "28": {
+    "ner": 919.5846847199219
+  },
+  "29": {
+    "ner": 817.6113931712281
+  },
+  "30": {
+    "ner": 800.1440236747252
+  },
+  "31": {
+    "ner": 767.2179148542099
+  },
+  "32": {
+    "ner": 807.7469139540956
+  },
+  "33": {
+    "ner": 743.6463610931854
+  },
+  "34": {
+    "ner": 726.275117122479
+  },
+  "35": {
+    "ner": 789.9216052093495
+  },
+  "36": {
+    "ner": 770.8247413277267
+  },
+  "37": {
+    "ner": 753.9640471296772
+  },
+  "38": {
+    "ner": 734.032792442225
+  },
+  "39": {
+    "ner": 775.5143593831364
+  }
+}
@@ -0,0 +1,40 @@
+{
+  "lang":"he",
+  "name":"singer_ner_he",
+  "version":"0.0.0",
+  "spacy_version":">=3.7.5,<3.8.0",
+  "description":"Model for recognizing singer names in Hebrew song titles",
+  "author":"nhlocal",
+  "email":"[email protected]",
+  "url":"",
+  "license":"MIT",
+  "spacy_git_version":"a6d0fc360",
+  "vectors":{
+    "width":0,
+    "vectors":0,
+    "keys":0,
+    "name":null,
+    "mode":"default"
+  },
+  "labels":{
+    "ner":[
+      "SINGER"
+    ]
+  },
+  "pipeline":[
+    "ner"
+  ],
+  "components":[
+    "ner"
+  ],
+  "disabled":[
+
+  ],
+  "tags":[
+    "NER",
+    "Hebrew",
+    "Singer",
+    "Named Entity Recognition",
+    "Text Classification"
+  ]
+}
@@ -0,0 +1,13 @@
+{
+  "moves":null,
+  "update_with_oracle_cut_size":100,
+  "multitasks":[
+
+  ],
+  "min_action_freq":1,
+  "learn_tokens":false,
+  "beam_width":1,
+  "beam_density":0.0,
+  "beam_update_prob":0.0,
+  "incorrect_spans_key":null
+}
@@ -0,0 +1 @@
+��moves�`{"0":{},"1":{"SINGER":-1},"2":{"SINGER":-1},"3":{"SINGER":-1},"4":{"":1,"SINGER":-1},"5":{"":1}}�cfg��neg_key�
@@ -0,0 +1 @@
+�
@@ -0,0 +1 @@
+�
Original file line number	Diff line number	Diff line change
`@@ -0,0 +1 @@`
	`1`	+��moves�`{"0":{},"1":{"SINGER":-1},"2":{"SINGER":-1},"3":{"SINGER":-1},"4":{"":1,"SINGER":-1},"5":{"":1}}�cfg��neg_key�