diff --git a/hyphenopoly.module.js b/hyphenopoly.module.js index 7f29e0cf..e1ea3833 100644 --- a/hyphenopoly.module.js +++ b/hyphenopoly.module.js @@ -80,7 +80,7 @@ H.supportedLanguages = [ "ml", "mn-cyrl", "mr", - "nb-no", + "nb", "nl", "nn", "no", diff --git a/testsuite/test5.html b/testsuite/test5.html index 733064ca..695419b0 100644 --- a/testsuite/test5.html +++ b/testsuite/test5.html @@ -33,10 +33,9 @@ "la": "FORCEHYPHENOPOLY", "lt": "FORCEHYPHENOPOLY", "lv": "FORCEHYPHENOPOLY", - "nb-no": "FORCEHYPHENOPOLY", + "nb": "FORCEHYPHENOPOLY", "nl": "FORCEHYPHENOPOLY", "oc": "FORCEHYPHENOPOLY", - "pi": "FORCEHYPHENOPOLY", "pl": "FORCEHYPHENOPOLY", "pms": "FORCEHYPHENOPOLY", "pt": "FORCEHYPHENOPOLY", @@ -196,9 +195,9 @@

18: la

Typographia disciplina transcribendarum litterarum est, quae propositum formam scripturae usu formae litterarum ac gentis litterarum assequi temptat, ut litterae eius simul elegantes et accomodatae sint.

Ty|po|gra|phia dis|ci|pli|na tran|scri|ben|da|rum lit|te|ra|rum est, quae pro|pos|i|tum for|mam scrip|tu|rae usu for|mae lit|te|ra|rum ac gen|tis lit|te|ra|rum as|se|qui temp|tat, ut lit|te|rae eius simul ele|gan|tes et ac|co|m|o|da|tae sint.

-

19: no

-

Typografi er utforming og behandling av skrift, bokstaver og andre grafiske elementer i trykkerfaget og i grafisk design.

-

Ty|po|gra|fi er ut|for|ming og be|hand|ling av skrift, bok|sta|ver og andre gra|fis|ke ele|men|ter i tryk|ker|fa|get og i gra|fisk de|sign.

+

19: nb

+

Typografi er utforming og behandling av skrift, bokstaver og andre grafiske elementer i trykkerfaget og i grafisk design.

+

Ty|po|gra|fi er ut|for|ming og be|hand|ling av skrift, bok|sta|ver og andre gra|fis|ke ele|men|ter i tryk|ker|fa|get og i gra|fisk de|sign.

20: lv

Šīs lapas valodu nevarēja noteikt automātiski. Lūdzu norādiet pamata valodu:

diff --git a/testsuite/test6.html b/testsuite/test6.html index 845c7e97..843e58e2 100644 --- a/testsuite/test6.html +++ b/testsuite/test6.html @@ -12,7 +12,6 @@ "bn": "FORCEHYPHENOPOLY", "el-monoton": "FORCEHYPHENOPOLY", "el-polyton": "FORCEHYPHENOPOLY", - "grc": "FORCEHYPHENOPOLY", "gu": "FORCEHYPHENOPOLY", "hi": "FORCEHYPHENOPOLY", "hy": "FORCEHYPHENOPOLY", @@ -22,7 +21,6 @@ "ml": "FORCEHYPHENOPOLY", "mn-cyrl": "FORCEHYPHENOPOLY", "mr": "FORCEHYPHENOPOLY", - "mul-ethi": "FORCEHYPHENOPOLY", "or": "FORCEHYPHENOPOLY", "pa": "FORCEHYPHENOPOLY", "ru": "FORCEHYPHENOPOLY", @@ -47,7 +45,7 @@ } }; function assert() { - var tests = 24; + var tests = 23; var i = 1; var test = ""; var ref = ""; @@ -135,42 +133,39 @@

11: el-monoton

12: el-polyton

Πάτερ ἡμῶν ὁ ἐν τοῖς οὐρανοῖς ἁγιασθήτω τὸ ὄνομά σου·

Πά|τερ ἡμῶν ὁ ἐν τοῖς οὐ|ρα|νοῖς ἁ|για|σθή|τω τὸ ὄ|νο|μά σου·

-

13: grc

-

ancient greek

-

ancient greek

-

14: gu

-

ગુજરાતી ભારત દેશના ગુજરાત રાજ્યની ઇન્ડો-આર્યન ભાષા છે, અને મુખ્યત્વે ગુજરાતી લોકો દ્વારા બોલાય છે.

-

ગુ|જ|રા|તી ભા|ર|ત દે|શ|ના ગુ|જ|રા|ત રા|જ્ય|ની ઇન્ડો-​આર્યન ભા|ષા છે, અને મુ|ખ્ય|ત્વે ગુ|જ|રા|તી લો|કો દ્વા|રા બો|લા|ય છે.

-

15: hi

-

हिन्दी विश्व की एक प्रमुख भाषा है एवं भारत की राजभाषा है।

-

हि|न्दी वि|श्व की एक प्र|मु|ख भा|षा है एवं भा|र|त की रा|ज|भा|षा है।

-

16: kn

-

ದ್ರಾವಿಡ ಭಾಷೆಗಳಲ್ಲಿ ಪ್ರಾಮುಖ್ಯವುಳ್ಳ ಭಾಷೆಯೂ ಭಾರತದ ಪುರಾತನವಾದ ಭಾಷೆಗಳಲ್ಲಿ ಒಂದೂ ಆಗಿರುವ ಕನ್ನಡ ಭಾಷೆಯನ್ನು ಅದರ ವಿವಿಧ ರೂಪಗಳಲ್ಲಿ ಸುಮಾರು ೪೫ ದಶಲಕ್ಷ (೪.೫ ಕೋಟಿ) ಜನರು ಆಡು ನುಡಿಯಾಗಿ ಬಳಸುತ್ತಲಿದ್ದಾರೆ.

-

ದ್ರಾ|ವಿ|ಡ ಭಾ|ಷೆ|ಗ|ಳ|ಲ್ಲಿ ಪ್ರಾ|ಮು|ಖ್ಯ|ವು|ಳ್ಳ ಭಾ|ಷೆ|ಯೂ ಭಾ|ರ|ತ|ದ ಪು|ರಾ|ತ|ನ|ವಾ|ದ ಭಾ|ಷೆ|ಗ|ಳ|ಲ್ಲಿ ಒಂ|ದೂ ಆ|ಗಿ|ರು|ವ ಕ|ನ್ನ|ಡ ಭಾ|ಷೆ|ಯ|ನ್ನು ಅದರ ವಿ|ವಿ|ಧ ರೂ|ಪ|ಗ|ಳ|ಲ್ಲಿ ಸು|ಮಾ|ರು ೪೫ ದ|ಶ|ಲ|ಕ್ಷ (೪.೫ ಕೋ|ಟಿ) ಜ|ನ|ರು ಆಡು ನು|ಡಿ|ಯಾ|ಗಿ ಬ|ಳ|ಸು|ತ್ತ|ಲಿ|ದ್ದಾ|ರೆ.

-

17: ml

-

ഇന്ത്യയിൽ പ്രധാനമായും കേരള സംസ്ഥാനത്തിലും ലക്ഷദ്വീപിലും പുതുച്ചേരിയുടെ ഭാഗമായ മയ്യഴിയിലും സംസാരിക്കപ്പെടുന്ന ഭാഷയാണ് മലയാളം. ഇതു ദ്രാവിഡ ഭാഷാ കുടുംബത്തിൽപ്പെടുന്നു.

-

ഇ|ന്ത്യ|യിൽ പ്ര|ധാ|ന|മാ|യും കേ|ര|ള സം|സ്ഥാ|ന|ത്തി|ലും ല|ക്ഷ|ദ്വീ|പി|ലും പു|തു|ച്ചേ|രി|യു|ടെ ഭാ|ഗ|മാ|യ മ|യ്യ|ഴി|യി|ലും സം|സാ|രി|ക്ക|പ്പെ|ടു|ന്ന ഭാ|ഷ|യാ|ണ് മ|ല|യാ|ളം. ഇതു ദ്രാ|വി|ഡ ഭാ|ഷാ കു|ടും|ബ|ത്തിൽ|പ്പെ|ടു|ന്നു.

-

18: mn-cyrl

-

Монгол үндэстний эрт эдүгээ цагийн хэл аялгуу, үсэг бичгийг хамтад нь Монгол хэл бичиг гэнэ.

-

Мон|гол үн|дэст|ний эрт эдү|гээ ца|гийн хэл аял|гуу, үсэг бич|гийг хам|тад нь Мон|гол хэл би|чиг гэ|нэ.

-

19: mr

-

मराठीभाषा ही इंडो-युरोपीय भाषाकुळातील एक भाषा आहे.

-

म|रा|ठी|भा|षा ही इंडो-​युरोपीय भा|षा|कु|ळा|ती|ल एक भा|षा आहे.

-

20: or

-

ଓଡ଼ିଆ ଏକ ଭାରତୀୟ ଭାଷା ଯାହା ଏକ ଇଣ୍ଡୋ-ଇଉରୋପୀୟ ଭାଷାଗୋଷ୍ଠୀ ଅନ୍ତର୍ଗତ ଇଣ୍ଡୋ-ଆର୍ଯ୍ୟ ଭାଷା ।

-

ଓଡ଼ିଆ ଏକ ଭା|ର|ତୀୟ ଭା|ଷା ଯା|ହା ଏକ ଇଣ୍ଡୋ-​ଇଉରୋପୀୟ ଭା|ଷା|ଗୋ|ଷ୍ଠୀ ଅ|ନ୍ତ|ର୍ଗ|ତ ଇଣ୍ଡୋ-​ଆର୍ଯ୍ୟ ଭା|ଷା ।

-

21: pa

-

ਪੰਜਾਬ ਦੀ ਭਾਸ਼ਾ, ਜਿਸ ਨੂੰ ਪੰਜਾਬ ਖੇਤਰ ਦੇ ਵਸਨੀਕ ਜਾਂ ਸੰਬੰਧਿਤ ਲੋਕ ਬੋਲਦੇ ਹਨ।

-

ਪੰਜਾ|ਬ ਦੀ ਭਾਸ਼ਾ, ਜਿਸ ਨੂੰ ਪੰਜਾ|ਬ ਖੇ|ਤ|ਰ ਦੇ ਵ|ਸ|ਨੀ|ਕ ਜਾਂ ਸੰਬੰਧਿ|ਤ ਲੋਕ ਬੋ|ਲ|ਦੇ ਹਨ।

-

22: ta

-

தமிழ் மொழி தமிழர்களினதும், தமிழ் பேசும் பலரதும் தாய்மொழி ஆகும்.

-

த|மிழ் மொ|ழி த|மி|ழர்|க|ளி|ன|தும், த|மிழ் பே|சும் ப|ல|ர|தும் தாய்|மொ|ழி ஆ|கும்.

-

23: te

-

ఆంధ్ర, తెలంగాణ రాష్ట్రాల అధికార భాష తెలుగు.

-

ఆం|ధ్ర, తె|లం|గా|ణ రా|ష్ట్రా|ల అ|ధి|కా|ర భాష తె|లు|గు.

-

24: th

-

ภาษาไทย หรือ ภาษาไทยกลาง เป็นภาษาราชการและภาษาประจำชาติของประเทศไทย ภาษาไทยเป็นภาษาในกลุ่มภาษาไทซึ่งเป็นกลุ่มย่อยของตระกูลภาษาขร้า-ไท สันนิษฐานว่า ภาษาในตระกูลนี้มีถิ่นกำเนิดจากทางตอนใต้ของประเทศจีน และนักภาษาศาสตร์บางส่วนเสนอว่า ภาษาไทยน่าจะมีความเชื่อมโยงกับตระกูลภาษาออสโตร-เอเชียติก ตระกูลภาษาออสโตรนีเซียน และตระกูลภาษาจีน-ทิเบต

-

ภา|ษา|ไทย หรือ ภา|ษา|ไทยกลาง เป็น|ภา|ษา|ราช|การและ|ภา|ษา|ประ|จำ|ชาติ|ของ|ประ|เทศ|ไทย ภาษาไทยเป็นภาษาในกลุ่มภาษาไทซึ่งเป็นกลุ่มย่อยของตระกูลภาษาขร้า-​ไท สัน|นิษ|ฐานว่า ภา|ษา|ใน|ตระ|กูลนี้มีถิ่น|กำ|เนิด|จาก|ทาง|ตอน|ใต้ของ|ประ|เทศ|จีน และ|นัก|ภา|ษา|ศาสตร์|บาง|ส่วน|เสนอว่า ภาษาไทยน่าจะมีความเชื่อมโยงกับตระกูลภาษาออสโตร-​เอเชียติก ตระ|กูล|ภา|ษา|ออส|โตรนี|เซียน และตระกูลภาษาจีน-​ทิเบต

+

13: gu

+

ગુજરાતી ભારત દેશના ગુજરાત રાજ્યની ઇન્ડો-આર્યન ભાષા છે, અને મુખ્યત્વે ગુજરાતી લોકો દ્વારા બોલાય છે.

+

ગુ|જ|રા|તી ભા|ર|ત દે|શ|ના ગુ|જ|રા|ત રા|જ્ય|ની ઇન્ડો-​આર્યન ભા|ષા છે, અને મુ|ખ્ય|ત્વે ગુ|જ|રા|તી લો|કો દ્વા|રા બો|લા|ય છે.

+

14: hi

+

हिन्दी विश्व की एक प्रमुख भाषा है एवं भारत की राजभाषा है।

+

हि|न्दी वि|श्व की एक प्र|मु|ख भा|षा है एवं भा|र|त की रा|ज|भा|षा है।

+

15: kn

+

ದ್ರಾವಿಡ ಭಾಷೆಗಳಲ್ಲಿ ಪ್ರಾಮುಖ್ಯವುಳ್ಳ ಭಾಷೆಯೂ ಭಾರತದ ಪುರಾತನವಾದ ಭಾಷೆಗಳಲ್ಲಿ ಒಂದೂ ಆಗಿರುವ ಕನ್ನಡ ಭಾಷೆಯನ್ನು ಅದರ ವಿವಿಧ ರೂಪಗಳಲ್ಲಿ ಸುಮಾರು ೪೫ ದಶಲಕ್ಷ (೪.೫ ಕೋಟಿ) ಜನರು ಆಡು ನುಡಿಯಾಗಿ ಬಳಸುತ್ತಲಿದ್ದಾರೆ.

+

ದ್ರಾ|ವಿ|ಡ ಭಾ|ಷೆ|ಗ|ಳ|ಲ್ಲಿ ಪ್ರಾ|ಮು|ಖ್ಯ|ವು|ಳ್ಳ ಭಾ|ಷೆ|ಯೂ ಭಾ|ರ|ತ|ದ ಪು|ರಾ|ತ|ನ|ವಾ|ದ ಭಾ|ಷೆ|ಗ|ಳ|ಲ್ಲಿ ಒಂ|ದೂ ಆ|ಗಿ|ರು|ವ ಕ|ನ್ನ|ಡ ಭಾ|ಷೆ|ಯ|ನ್ನು ಅದರ ವಿ|ವಿ|ಧ ರೂ|ಪ|ಗ|ಳ|ಲ್ಲಿ ಸು|ಮಾ|ರು ೪೫ ದ|ಶ|ಲ|ಕ್ಷ (೪.೫ ಕೋ|ಟಿ) ಜ|ನ|ರು ಆಡು ನು|ಡಿ|ಯಾ|ಗಿ ಬ|ಳ|ಸು|ತ್ತ|ಲಿ|ದ್ದಾ|ರೆ.

+

166: ml

+

ഇന്ത്യയിൽ പ്രധാനമായും കേരള സംസ്ഥാനത്തിലും ലക്ഷദ്വീപിലും പുതുച്ചേരിയുടെ ഭാഗമായ മയ്യഴിയിലും സംസാരിക്കപ്പെടുന്ന ഭാഷയാണ് മലയാളം. ഇതു ദ്രാവിഡ ഭാഷാ കുടുംബത്തിൽപ്പെടുന്നു.

+

ഇ|ന്ത്യ|യിൽ പ്ര|ധാ|ന|മാ|യും കേ|ര|ള സം|സ്ഥാ|ന|ത്തി|ലും ല|ക്ഷ|ദ്വീ|പി|ലും പു|തു|ച്ചേ|രി|യു|ടെ ഭാ|ഗ|മാ|യ മ|യ്യ|ഴി|യി|ലും സം|സാ|രി|ക്ക|പ്പെ|ടു|ന്ന ഭാ|ഷ|യാ|ണ് മ|ല|യാ|ളം. ഇതു ദ്രാ|വി|ഡ ഭാ|ഷാ കു|ടും|ബ|ത്തിൽ|പ്പെ|ടു|ന്നു.

+

17: mn-cyrl

+

Монгол үндэстний эрт эдүгээ цагийн хэл аялгуу, үсэг бичгийг хамтад нь Монгол хэл бичиг гэнэ.

+

Мон|гол үн|дэст|ний эрт эдү|гээ ца|гийн хэл аял|гуу, үсэг бич|гийг хам|тад нь Мон|гол хэл би|чиг гэ|нэ.

+

18: mr

+

मराठीभाषा ही इंडो-युरोपीय भाषाकुळातील एक भाषा आहे.

+

म|रा|ठी|भा|षा ही इंडो-​युरोपीय भा|षा|कु|ळा|ती|ल एक भा|षा आहे.

+

19: or

+

ଓଡ଼ିଆ ଏକ ଭାରତୀୟ ଭାଷା ଯାହା ଏକ ଇଣ୍ଡୋ-ଇଉରୋପୀୟ ଭାଷାଗୋଷ୍ଠୀ ଅନ୍ତର୍ଗତ ଇଣ୍ଡୋ-ଆର୍ଯ୍ୟ ଭାଷା ।

+

ଓଡ଼ିଆ ଏକ ଭା|ର|ତୀୟ ଭା|ଷା ଯା|ହା ଏକ ଇଣ୍ଡୋ-​ଇଉରୋପୀୟ ଭା|ଷା|ଗୋ|ଷ୍ଠୀ ଅ|ନ୍ତ|ର୍ଗ|ତ ଇଣ୍ଡୋ-​ଆର୍ଯ୍ୟ ଭା|ଷା ।

+

20: pa

+

ਪੰਜਾਬ ਦੀ ਭਾਸ਼ਾ, ਜਿਸ ਨੂੰ ਪੰਜਾਬ ਖੇਤਰ ਦੇ ਵਸਨੀਕ ਜਾਂ ਸੰਬੰਧਿਤ ਲੋਕ ਬੋਲਦੇ ਹਨ।

+

ਪੰਜਾ|ਬ ਦੀ ਭਾਸ਼ਾ, ਜਿਸ ਨੂੰ ਪੰਜਾ|ਬ ਖੇ|ਤ|ਰ ਦੇ ਵ|ਸ|ਨੀ|ਕ ਜਾਂ ਸੰਬੰਧਿ|ਤ ਲੋਕ ਬੋ|ਲ|ਦੇ ਹਨ।

+

21: ta

+

தமிழ் மொழி தமிழர்களினதும், தமிழ் பேசும் பலரதும் தாய்மொழி ஆகும்.

+

த|மிழ் மொ|ழி த|மி|ழர்|க|ளி|ன|தும், த|மிழ் பே|சும் ப|ல|ர|தும் தாய்|மொ|ழி ஆ|கும்.

+

22: te

+

ఆంధ్ర, తెలంగాణ రాష్ట్రాల అధికార భాష తెలుగు.

+

ఆం|ధ్ర, తె|లం|గా|ణ రా|ష్ట్రా|ల అ|ధి|కా|ర భాష తె|లు|గు.

+

23: th

+

ภาษาไทย หรือ ภาษาไทยกลาง เป็นภาษาราชการและภาษาประจำชาติของประเทศไทย ภาษาไทยเป็นภาษาในกลุ่มภาษาไทซึ่งเป็นกลุ่มย่อยของตระกูลภาษาขร้า-ไท สันนิษฐานว่า ภาษาในตระกูลนี้มีถิ่นกำเนิดจากทางตอนใต้ของประเทศจีน และนักภาษาศาสตร์บางส่วนเสนอว่า ภาษาไทยน่าจะมีความเชื่อมโยงกับตระกูลภาษาออสโตร-เอเชียติก ตระกูลภาษาออสโตรนีเซียน และตระกูลภาษาจีน-ทิเบต

+

ภา|ษา|ไทย หรือ ภา|ษา|ไทยกลาง เป็น|ภา|ษา|ราช|การและ|ภา|ษา|ประ|จำ|ชาติ|ของ|ประ|เทศ|ไทย ภาษาไทยเป็นภาษาในกลุ่มภาษาไทซึ่งเป็นกลุ่มย่อยของตระกูลภาษาขร้า-​ไท สัน|นิษ|ฐานว่า ภา|ษา|ใน|ตระ|กูลนี้มีถิ่น|กำ|เนิด|จาก|ทาง|ตอน|ใต้ของ|ประ|เทศ|จีน และ|นัก|ภา|ษา|ศาสตร์|บาง|ส่วน|เสนอว่า ภาษาไทยน่าจะมีความเชื่อมโยงกับตระกูลภาษาออสโตร-​เอเชียติก ตระ|กูล|ภา|ษา|ออส|โตรนี|เซียน และตระกูลภาษาจีน-​ทิเบต


Test Ref