explosion spaCy Language Support · Discussions · GitHub

Sort by: Latest activity

Language Support Discussions

Discuss the language data and training models for new languages

Pinned to Language Support

Adding models for new languages master thread
enhancement Feature requests and improvements lang / all Global language data new language Adding support for new languages to spaCy.
ines started Dec 16, 2018 in Language Support

141

Discussions

You must be logged in to vote

Problem with French parsing when using apostrophe
lang / fr French language data and models perf / accuracy Performance: accuracy
pastrop started Oct 9, 2021 in Language Support

5
You must be logged in to vote

Adding Vietnamese language support for Spacy
lang / vi Vietnamese language data and models new language Adding support for new languages to spaCy.
Avi197 started Oct 8, 2021 in Language Support

1
You must be logged in to vote

Using non-UD Arabic data
feat / cli Feature: Command-line interface
muhammed-abuodeh started Sep 30, 2021 in Language Support

3
You must be logged in to vote

Japanese transformers-based model
enhancement Feature requests and improvements lang / ja Japanese language data and models feat / transformer Feature: Transformer
hiroshi-matsuda-rit started Sep 29, 2021 in Language Support

2
You must be logged in to vote

German lemmatizer based on outdated spelling rules
enhancement Feature requests and improvements lang / de German language data and models help wanted (easy) Contributions welcome! (also suited for spaCy beginners) feat / lemmatizer Feature: Rule-based and lookup lemmatization
eigenvektorin started Jul 9, 2021 in Language Support

4
You must be logged in to vote

NER differences in spaCy v2 and v3.
lang / en English language data and models feat / ner Feature: Named Entity Recognizer
narayanacharya6 started Jul 25, 2021 in Language Support

6
You must be logged in to vote

Wrong location detection in Spanish
lang / es Spanish language data and models feat / tokenizer Feature: Tokenizer
rjgarciar started Jul 21, 2021 in Language Support

2
Why is the "trf" model more accurate in tems of prediction than the "lg" model while it is smaller in size than the latter?
usage General spaCy usage
qingyun1988 started Jul 11, 2021 in Language Support

1
You must be logged in to vote

Appending morphologizer to Japanese pipeline
lang / ja Japanese language data and models
hiroshi-matsuda-rit started Jul 10, 2021 in Language Support

5
You must be logged in to vote

Errors in Chinese PKUSEG handling ascii characters
lang / zh Chinese language data and models feat / tokenizer Feature: Tokenizer
lingvisa started Jul 9, 2021 in Language Support

2
You must be logged in to vote

Japanese model ja_core_news_lg training config
feat / config Feature: Training config
xwd started Jul 9, 2021 in Language Support

1
You must be logged in to vote

Difference in performance of postags between small and large models of portuguese
lang / pt Portuguese language data and models perf / accuracy Performance: accuracy
ricardojosehlima started Jul 7, 2021 in Language Support

2
You must be logged in to vote

English Sentenciser - Acronyms
feat / tokenizer Feature: Tokenizer
SpyriP started Jul 7, 2021 in Language Support

1
You must be logged in to vote

Spacy Architecture
usage General spaCy usage models Issues related to the statistical models
raffa-dev started Jul 1, 2021 in Language Support

1
You must be logged in to vote

Abbreviations Expansion
lang / es Spanish language data and models feat / tokenizer Feature: Tokenizer
SpyriP started Jun 29, 2021 in Language Support

2
You must be logged in to vote

Some sentences that consist of '&' are being cut off when performing over the model 'en_core_web_trf'
usage General spaCy usage resolved The issue was addressed / answered
qingyun1988 started Jun 23, 2021 in Language Support

2
You must be logged in to vote

There is nothing or a little change after training on an existing model for dependency parser using 71 examples.
training Training and updating models feat / parser Feature: Dependency Parser
qingyun1988 started Jun 6, 2021 in Language Support

8
You must be logged in to vote

Why can't I get the attribute 'pos' data from a new model trained from scratch?
training Training and updating models feat / tagger Feature: Part-of-speech tagger feat / morphologizer Feature: Morphologizer
qingyun1988 started Jun 18, 2021 in Language Support

4
You must be logged in to vote

LEMMA_ACC missing in English models
lang / en English language data and models
Riccorl started Jun 11, 2021 in Language Support

1
You must be logged in to vote

What is [initialize] vector='model' and what are the differences between stock models?
feat / vectors Feature: Word vectors and similarity
source19069 started Jun 9, 2021 in Language Support

1
You must be logged in to vote

Japanese Training data (as used in the model ja_core_news_lg for example)
lang / ja Japanese language data and models
xwd started Jun 1, 2021 in Language Support

1
You must be logged in to vote

create new pipeline for Persian
lang / fa Persian language data and models
aliebrahiiimi started May 29, 2021 in Language Support

5
You must be logged in to vote

Characterization of PoS accuracy
feat / tagger Feature: Part-of-speech tagger perf / accuracy Performance: accuracy
dandiep started May 27, 2021 in Language Support

2
You must be logged in to vote

Using Spacy V2 en_core_web_lg-2.3.1 model in Spacy V3
feat / tagger Feature: Part-of-speech tagger perf / accuracy Performance: accuracy
udaypk started May 21, 2021 in Language Support

4
You must be logged in to vote

zh_core_web_lg static embedding come from where?
lang / zh Chinese language data and models feat / vectors Feature: Word vectors and similarity
rgib37190 started May 24, 2021 in Language Support

4