Releases: ccoreilly/spacy-catala
Releases · ccoreilly/spacy-catala
ca_fasttext_wiki_md-1.0.0
Model Spacy per la llengua Catalana (mida mitjana)
Resum
Dada | Descripció |
---|---|
Nom | ca_fasttext_wiki_md |
Versió | 1.0.0 |
spaCy | >=2.3.2 ,<2.4.0 |
Mida | 62 MB |
Pipeline | tagger , parser , ner |
Vectors | 20.000 |
Llicència | GPL3.0 |
Autor | Ciaran O'Reilly |
Fonts
- Vectors de paraules de fastText
- Gramàtica, morfologia i sintaxi fent servir dades del corpus d'AnCora
- Annotacions per a l'extracció d'entitats derivades de la wikipedia (Cross-lingual Name Tagging and Linking for 282 Languages)
Resultats
"accuracy": {
"ents_f": 95.7400625365,
"ents_p": 95.7776119689,
"ents_r": 95.7025425349,
"tags_acc": 98.3906377253,
"token_acc": 100.0,
"las": 88.5916971653,
"uas": 91.7727170148,
}
ca_fasttext_wiki_lg-1.0.0
Model Spacy per la llengua Catalana (mida gran)
Resum
Dada | Descripció |
---|---|
Nom | ca_fasttext_wiki_lg |
Versió | 1.0.0 |
spaCy | >=2.3.2 ,<2.4.0 |
Mida | 1,16 GB |
Pipeline | tagger , parser , ner |
Vectors | 2.000.000 |
Llicència | GPL3.0 |
Autor | Ciaran O'Reilly |
Fonts
- Vectors de paraules de fastText
- Gramàtica, morfologia i sintaxi fent servir dades del corpus d'AnCora
- Annotacions per a l'extracció d'entitats derivades de la wikipedia (Cross-lingual Name Tagging and Linking for 282 Languages)
Resultats
"accuracy": {
"ents_f": 95.200673053,
"ents_p": 95.2207007344,
"ents_r": 95.1806537947,
"tags_acc": 98.4809319783,
"token_acc": 100.0,
"las": 88.0505489546,
"uas": 91.4571089373,
}
Versió 0.1.0
Model optimitzat amb només 20.000 vectors de paraules per a reduïr-ne la mida final.
Dades
- Vectors de paraules de fastText
- Gramàtica, morfologia i sintaxi fent servir dades del corpus d'AnCora
- Annotacions per a l'extracció d'entitats derivades de la wikipedia (Cross-lingual Name Tagging and Linking for 282 Languages)
Resultats
"accuracy": {
"tags_acc": 98.4136539074,
"token_acc": 100.0,
"las": 88.6776162163,
"uas": 91.8074606071,
"ents_f": 95.872050782,
"ents_p": 95.8757170172,
"ents_r": 95.8683848272
}
Versió 0.0.3
Millorada la precisió mitjançant entrenament en dues etapes.
Versió 0.0.2
Segona versió del model.
Canvis:
- Entrenat amb annotacions de la wikipedia per a l'extracció d'entitats