Releases: techiaith/trawsgrifiwr-windows
v1.0.6
Trawsgrifiwr (v1.0.6)
Mae’r Trawsgrifiwr yn rhaglen Windows yn unig sydd yn trawsgrifio lleferydd Cymraeg i destun. Dydi’r Trawsgrifiwr ddim eto yn adnabod eich geiriau yn iawn bob amser. Mewn arbrofion syml mae’r fersiwn cychwynnol hwn yn camddeall tua 11% o eiriau mewn brawddeg.
I'w defnyddio cliciwch ar y botwm 'Record', siaradwch frawddeg yn glir am rhwng 5 i 10 eiliad ac yna gliciwch ar y botwm 'Stop'. Bydd y Trawsgrifiwr yn gweithio ar y sain gyda chylch glas yn troi cyn i'r testun o'r hyn a ddywedwyd ymddangos o fewn y blwch testun. Os oes angen, cywirwch y testun a/neu cliciwch ar y botwm 'Copïo' er mwyn gludo'r testun mewn i unrhyw feddalwedd arall ar eich peiriant Windows (e.e. Microsoft Word, LibreOffice neu flwch testun o fewn tudalen we)
Ar y funud mae'n broses araf, yn cymryd tua 3 neu 4 gwaith hirach na'r amser i lefaru'r frawddeg wreiddiol - byddwch yn amyneddgar!
Cefndir
Gwnaed y Trawsgrifiwr Cymraeg yn bosibl diolch i brojectau a chydweithrediad rhwng Mozilla, gwirfoddolwyr, ac Uned Technolegau Iaith, Canolfan Bedwyr, Prifysgol Bangor. Ariannwyd rhan Prifysgol Bangor yn y fenter, gan gynnwys datblygu'r Trawsgrifiwr a'r Ap Macsen gan Lywodraeth Cymru.
Prif sail y Trawsgrifiwr yw DeepSpeech gan Mozilla. Mae DeepSpeech yn beiriant adnabod lleferydd y gellir ei hyfforddi a'i gynnwys yn hwylus o fewn unrhyw becyn meddalwedd. Ewch i https://github.com/mozilla/deepspeech i ddysgu mwy am DeepSpeech.
I hyfforddi DeepSpeech ac i greu systemau adnabod lleferydd, mae angen nifer sylweddol iawn o recordiadau o leisiau gwahanol bobl. Rydym wedi gwneud hynny yn bennaf drwy gyfrwng Common Voice, sef llwyfan Mozilla i gasglu lleisiau pobl yn darllen yn uchel frawddegau penodol. Rydym yn ddiolchgar iawn i Rhoslyn Prys (meddal.com) a ymgymerodd â nifer o ymgyrchoedd torfoli ar sail wirfoddol, i'r Mentrau Iaith, Cyngor Gwynedd, Llyfrgell Genedlaethol Cymru a weithiodd gyda Rhoslyn ar rai o'r ymgyrchoedd hyn, hefyd i Lywodraeth Cymru am eu hymgyrch gyhoeddusrwydd hwy, ac i liaws o gyfranogwyr ar draws Cymru a thu hwnt - dros 1,180 ohonoch erbyn hyn! - sydd wedi cyfrannu eich lleisiau i'r Common Voice Cymraeg. Gallwch gyfrannu eich llais i gynorthwyo i adeiladu cronfa ddata o leisiau fydd pawb yn gallu'i defnyddio i greu rhagor o apiau arloesol ar gyfer dyfeisiau, y we a'r Gymraeg. Os hoffech chi gyfrannu eich llais, ewch i wefan Common Voice i ddechrau arni. https://voice.mozilla.org/cy
Cywirdeb
Yn ôl ein harbrofion syml, mae'r trawsgrifiwr yn llwyddo gyda WER (word error rate) o 11%. O gymharu, mae systemau tebyg ar gyfer Saesneg â WER llai na 10%. Mae’n fwy na thebyg y bydd canlyniadau’n waeth ac yn amrywio rhwng gwahanol ddefnyddwyr. Felly mae’r ap yn cynnwys awgrymiadau ar sut i'w ddefnyddio’n fwy llwyddiannus. Ond mae’r profiad o ddefnyddio’r rhaglen gyda brawddegau ar hap, a chael rhan helaeth o’r geiriau yn gywir yn arwyddocaol iawn. Yn ein barn ni mae’r ansawdd yn garreg filltir yn natblygiad adnabod lleferydd Cymraeg.
Cynnydd ar fersiynau blaenorol
- mae'r Trawsgrifiwr yn defnyddio peiriant ar-lein os nad oes modd i'ch cyfrifiadur rhedeg y gydran adnabod lleferydd DeepSpeech yn lleol. Mae rhybudd wrth gychwyn y rhaglen i hysbysu'r defnyddiwr.
- yn defnyddio DeepSpeech 0.9.3
- modelau wedi eu hyfforddi gyda data Common Voice Rhagfyr 2020 (https://github.com/techiaith/docker-deepspeech-cy/releases/tag/21.03)
v1.0.5
Trawsgrifiwr (v1.0.5)
Mae’r Trawsgrifiwr yn rhaglen Windows yn unig sydd yn trawsgrifio lleferydd Cymraeg i destun. Dydi’r Trawsgrifiwr ddim eto yn adnabod eich geiriau yn iawn bob amser. Mewn arbrofion syml mae’r fersiwn cychwynnol hwn yn camddeall tua 11% o eiriau mewn brawddeg.
I'w defnyddio cliciwch ar y botwm 'Record', siaradwch frawddeg yn glir am rhwng 5 i 10 eiliad ac yna gliciwch ar y botwm 'Stop'. Bydd y Trawsgrifiwr yn gweithio ar y sain gyda chylch glas yn troi cyn i'r testun o'r hyn a ddywedwyd ymddangos o fewn y blwch testun. Os oes angen, cywirwch y testun a/neu cliciwch ar y botwm 'Copïo' er mwyn gludo'r testun mewn i unrhyw feddalwedd arall ar eich peiriant Windows (e.e. Microsoft Word, LibreOffice neu flwch testun o fewn tudalen we)
Ar y funud mae'n broses araf, yn cymryd tua 3 neu 4 gwaith hirach na'r amser i lefaru'r frawddeg wreiddiol - byddwch yn amyneddgar!
Cefndir
Gwnaed y Trawsgrifiwr Cymraeg yn bosibl diolch i brojectau a chydweithrediad rhwng Mozilla, gwirfoddolwyr, ac Uned Technolegau Iaith, Canolfan Bedwyr, Prifysgol Bangor. Ariannwyd rhan Prifysgol Bangor yn y fenter, gan gynnwys datblygu'r Trawsgrifiwr a'r Ap Macsen gan Lywodraeth Cymru.
Prif sail y Trawsgrifiwr yw DeepSpeech gan Mozilla. Mae DeepSpeech yn beiriant adnabod lleferydd y gellir ei hyfforddi a'i gynnwys yn hwylus o fewn unrhyw becyn meddalwedd. Ewch i https://github.com/mozilla/deepspeech i ddysgu mwy am DeepSpeech.
I hyfforddi DeepSpeech ac i greu systemau adnabod lleferydd, mae angen nifer sylweddol iawn o recordiadau o leisiau gwahanol bobl. Rydym wedi gwneud hynny yn bennaf drwy gyfrwng Common Voice, sef llwyfan Mozilla i gasglu lleisiau pobl yn darllen yn uchel frawddegau penodol. Rydym yn ddiolchgar iawn i Rhoslyn Prys (meddal.com) a ymgymerodd â nifer o ymgyrchoedd torfoli ar sail wirfoddol, i'r Mentrau Iaith, Cyngor Gwynedd, Llyfrgell Genedlaethol Cymru a weithiodd gyda Rhoslyn ar rai o'r ymgyrchoedd hyn, hefyd i Lywodraeth Cymru am eu hymgyrch gyhoeddusrwydd hwy, ac i liaws o gyfranogwyr ar draws Cymru a thu hwnt - dros 1,180 ohonoch erbyn hyn! - sydd wedi cyfrannu eich lleisiau i'r Common Voice Cymraeg. Gallwch gyfrannu eich llais i gynorthwyo i adeiladu cronfa ddata o leisiau fydd pawb yn gallu'i defnyddio i greu rhagor o apiau arloesol ar gyfer dyfeisiau, y we a'r Gymraeg. Os hoffech chi gyfrannu eich llais, ewch i wefan Common Voice i ddechrau arni. https://voice.mozilla.org/cy
Cywirdeb
Yn ôl ein harbrofion syml, mae'r trawsgrifiwr yn llwyddo gyda WER (word error rate) o 11%. O gymharu, mae systemau tebyg ar gyfer Saesneg â WER llai na 10%. Mae’n fwy na thebyg y bydd canlyniadau’n waeth ac yn amrywio rhwng gwahanol ddefnyddwyr. Felly mae’r ap yn cynnwys awgrymiadau ar sut i'w ddefnyddio’n fwy llwyddiannus. Ond mae’r profiad o ddefnyddio’r rhaglen gyda brawddegau ar hap, a chael rhan helaeth o’r geiriau yn gywir yn arwyddocaol iawn. Yn ein barn ni mae’r ansawdd yn garreg filltir yn natblygiad adnabod lleferydd Cymraeg.
Cynnydd ar fersiynau blaenorol
- yn defnyddio DeepSpeech 0.9.1
- modelau wedi eu hyfforddi gyda data Common Voice Rhagfyr 2020 (https://github.com/techiaith/docker-deepspeech-cy/releases/tag/21.01)
v1.0.4
Trawsgrifiwr (v1.0.4)
Mae’r Trawsgrifiwr yn rhaglen Windows yn unig sydd yn trawsgrifio lleferydd Cymraeg i destun. Dydi’r Trawsgrifiwr ddim eto yn adnabod eich geiriau yn iawn bob amser. Mewn arbrofion syml mae’r fersiwn cychwynnol hwn yn camddeall tua 24% o eiriau mewn brawddeg.
I'w defnyddio cliciwch ar y botwm 'Record', siaradwch frawddeg yn glir am rhwng 5 i 10 eiliad ac yna gliciwch ar y botwm 'Stop'. Bydd y Trawsgrifiwr yn gweithio ar y sain gyda chylch glas yn troi cyn i'r testun o'r hyn a ddywedwyd ymddangos o fewn y blwch testun. Os oes angen, cywirwch y testun a/neu cliciwch ar y botwm 'Copïo' er mwyn gludo'r testun mewn i unrhyw feddalwedd arall ar eich peiriant Windows (e.e. Microsoft Word, LibreOffice neu flwch testun o fewn tudalen we)
Ar y funud mae'n broses araf, yn cymryd tua 3 neu 4 gwaith hirach na'r amser i lefaru'r frawddeg wreiddiol - byddwch yn amyneddgar!
Cefndir
Gwnaed y Trawsgrifiwr Cymraeg yn bosibl diolch i brojectau a chydweithrediad rhwng Mozilla, gwirfoddolwyr, ac Uned Technolegau Iaith, Canolfan Bedwyr, Prifysgol Bangor. Ariannwyd rhan Prifysgol Bangor yn y fenter, gan gynnwys datblygu'r Trawsgrifiwr a'r Ap Macsen gan Lywodraeth Cymru.
Prif sail y Trawsgrifiwr yw DeepSpeech gan Mozilla. Mae DeepSpeech yn beiriant adnabod lleferydd y gellir ei hyfforddi a'i gynnwys yn hwylus o fewn unrhyw becyn meddalwedd. Ewch i https://github.com/mozilla/deepspeech i ddysgu mwy am DeepSpeech.
I hyfforddi DeepSpeech ac i greu systemau adnabod lleferydd, mae angen nifer sylweddol iawn o recordiadau o leisiau gwahanol bobl. Rydym wedi gwneud hynny yn bennaf drwy gyfrwng Common Voice, sef llwyfan Mozilla i gasglu lleisiau pobl yn darllen yn uchel frawddegau penodol. Rydym yn ddiolchgar iawn i Rhoslyn Prys (meddal.com) a ymgymerodd â nifer o ymgyrchoedd torfoli ar sail wirfoddol, i'r Mentrau Iaith, Cyngor Gwynedd, Llyfrgell Genedlaethol Cymru a weithiodd gyda Rhoslyn ar rai o'r ymgyrchoedd hyn, hefyd i Lywodraeth Cymru am eu hymgyrch gyhoeddusrwydd hwy, ac i liaws o gyfranogwyr ar draws Cymru a thu hwnt - dros 1,180 ohonoch erbyn hyn! - sydd wedi cyfrannu eich lleisiau i'r Common Voice Cymraeg. Gallwch gyfrannu eich llais i gynorthwyo i adeiladu cronfa ddata o leisiau fydd pawb yn gallu'i defnyddio i greu rhagor o apiau arloesol ar gyfer dyfeisiau, y we a'r Gymraeg. Os hoffech chi gyfrannu eich llais, ewch i wefan Common Voice i ddechrau arni. https://voice.mozilla.org/cy
Cywirdeb
Yn ôl ein harbrofion, mae'r trawsgrifiwr yn llwyddo gyda WER (word error rate) o 24%. O gymharu, mae systemau tebyg ar gyfer Saesneg â WER llai na 10%. Mae’n fwy na thebyg y bydd canlyniadau’n amrywio rhwng gwahanol ddefnyddwyr. Felly mae’r ap yn cynnwys awgrymiadau ar sut i'w ddefnyddio’n fwy llwyddiannus. Ond mae’r profiad o ddefnyddio’r rhaglen gyda brawddegau ar hap, a chael rhan helaeth o’r geiriau yn gywir yn arwyddocaol iawn. Yn ein barn ni mae’r ansawdd yn garreg filltir yn natblygiad adnabod lleferydd Cymraeg.
Cynnydd ar fersiynau blaenorol
- yn defnyddio DeepSpeech 0.7.4
- modelau wedi eu hyfforddi gyda data Common Voice Mehefin 2020 (https://github.com/techiaith/docker-deepspeech-cy/releases/tag/20.07)
- gwelliannau paramedrau model iaith sydd wedi gwella'r WER i 24% (o 27%)
- dangos y CER (character error rate) wrth i'r defnyddiwr cywiro'r testun
v1.0.3
Trawsgrifiwr (v1.0.3)
Mae’r Trawsgrifiwr yn rhaglen Windows yn unig sydd yn trawsgrifio lleferydd Cymraeg i destun. Dydi’r Trawsgrifiwr ddim eto yn adnabod eich geiriau yn iawn bob amser. Mewn arbrofion syml mae’r fersiwn cychwynnol hwn yn camddeall tua 27% o eiriau mewn brawddeg.
I'w defnyddio cliciwch ar y botwm 'Record', siaradwch frawddeg yn glir am rhwng 5 i 10 eiliad ac yna gliciwch ar y botwm 'Stop'. Bydd y Trawsgrifiwr yn gweithio ar y sain gyda chylch glas yn troi cyn i'r testun o'r hyn a ddywedwyd ymddangos o fewn y blwch testun. Os oes angen, cywirwch y testun a/neu cliciwch ar y botwm 'Copïo' er mwyn gludo'r testun mewn i unrhyw feddalwedd arall ar eich peiriant Windows (e.e. Microsoft Word, LibreOffice neu flwch testun o fewn tudalen we)
Ar y funud mae'n broses araf, yn cymryd tua 3 neu 4 gwaith hirach na'r amser i lefaru'r frawddeg wreiddiol - byddwch yn amyneddgar!
Cefndir
Gwnaed y Trawsgrifiwr Cymraeg yn bosibl diolch i brojectau a chydweithrediad rhwng Mozilla, gwirfoddolwyr, ac Uned Technolegau Iaith, Canolfan Bedwyr, Prifysgol Bangor. Ariannwyd rhan Prifysgol Bangor yn y fenter, gan gynnwys datblygu'r Trawsgrifiwr a'r Ap Macsen gan Lywodraeth Cymru.
Prif sail y Trawsgrifiwr yw DeepSpeech gan Mozilla. Mae DeepSpeech yn beiriant adnabod lleferydd y gellir ei hyfforddi a'i gynnwys yn hwylus o fewn unrhyw becyn meddalwedd. Ewch i https://github.com/mozilla/deepspeech i ddysgu mwy am DeepSpeech. Mae modelau iaith Gymraeg DeepSpeech rydym wedi hyfforddi a'u cynnwys oddi fewn y fersiwn hwn o'r trawsgrifiwr ar gael i ddatblygwyr eraill o:
http://techiaith.cymru/deepspeech/arddweud/models/0.7.3/
I greu systemau adnabod lleferydd, mae angen nifer sylweddol iawn o recordiadau o leisiau gwahanol bobl. Rydym wedi gwneud hynny yn bennaf drwy gyfrwng Common Voice, sef llwyfan Mozilla i gasglu lleisiau pobl yn darllen yn uchel frawddegau penodol. Rydym yn ddiolchgar iawn i Rhoslyn Prys (meddal.com) a ymgymerodd â nifer o ymgyrchoedd torfoli ar sail wirfoddol, i'r Mentrau Iaith, Cyngor Gwynedd, Llyfrgell Genedlaethol Cymru a weithiodd gyda Rhoslyn ar rai o'r ymgyrchoedd hyn, hefyd i Lywodraeth Cymru am eu hymgyrch gyhoeddusrwydd hwy, ac i liaws o gyfranogwyr ar draws Cymru a thu hwnt - dros 1,180 ohonoch erbyn hyn! - sydd wedi cyfrannu eich lleisiau i'r Common Voice Cymraeg. Gallwch gyfrannu eich llais i gynorthwyo i adeiladu cronfa ddata o leisiau fydd pawb yn gallu'i defnyddio i greu rhagor o apiau arloesol ar gyfer dyfeisiau, y we a'r Gymraeg. Os hoffech chi gyfrannu eich llais, ewch i wefan Common Voice i ddechrau arni. https://voice.mozilla.org/cy
Cywirdeb
Yn ôl ein harbrofion, mae'r trawsgrifiwr yn llwyddo gyda WER (word error rate) o 27%. O gymharu, mae systemau tebyg ar gyfer Saesneg â WER llai na 10%. Mae’n fwy na thebyg y bydd canlyniadau’n amrywio rhwng gwahanol ddefnyddwyr. Felly mae’r ap yn cynnwys awgrymiadau ar sut i'w ddefnyddio’n fwy llwyddiannus. Ond mae’r profiad o ddefnyddio’r rhaglen gyda brawddegau ar hap, a chael rhan helaeth o’r geiriau yn gywir yn arwyddocaol iawn. Yn ein barn ni mae’r ansawdd yn garreg filltir yn natblygiad adnabod lleferydd Cymraeg.
Cynnydd ar fersiynau blaenorol
- yn defnyddio DeepSpeech 0.7.3
- gwelliannau paramedrau model iaith sydd wedi gwella'r WER i 27% (o 33%)
v1.0.2
Trawsgrifiwr (v1.0.2)
Dyma'r fersiwn gyntaf o drawsgrifiwr ar gyfer y Gymraeg. I'w defnyddio cliciwch ar y botwm 'Record', siaradwch brawddeg yn glir am rhwng 5 i 10 eiliad ac yna gliciwch ar y botwm 'Stop'. Bydd y Trawsgrifiwr yn gweithio ar y sain gyda cylch glas yn troi cyn i'r testun o'r un a ddywedwyd ymddangos o fewn y blwch testun. Os oes angen, cywirwch y testun a/neu cliciwch ar y botwm 'Copïo' er mwyn gludo'r testun mewn i unrhyw feddalwedd arall ar eich peiriant Windows (e.e. Microsoft Word, LibreOffice neu flwch testun o fewn tudalen we)
Ar y funud mae'n broses araf, yn cymryd tua 3 neu 4 gwaith hirach na'r amser i lefaru'r frawddeg wreiddiol - byddwch yn amyneddgar!
Cefndir
Gwnaed y Trawsgrifiwr Cymraeg yn bosibl diolch i brojectau a chydweithrediad rhwng Mozilla, gwirfoddolwyr, ac Uned Technolegau Iaith, Canolfan Bedwyr, Prifysgol Bangor. Ariannwyd rhan Prifysgol Bangor yn y fenter, gan gynnwys datblygu'r Trawsgrifiwr a'r Ap Macsen gan Lywodraeth Cymru.
Prif sail y Trawsgrifiwr yw DeepSpeech gan Mozilla. Mae DeepSpeech yn beiriant adnabod lleferydd y gellir ei hyfforddi a'i gynnwys yn hwylus o fewn unrhyw becyn meddalwedd. Ewch i https://github.com/mozilla/deepspeech i ddysgu mwy am DeepSpeech. Mae modelau iaith Gymraeg DeepSpeech rydym wedi hyfforddi a'i chynnwys oddi fewn y fersiwn hwn o'r trawsgrifiwr ar gael i ddatblygwyr eraill o:
http://techiaith.cymru/deepspeech/arddweud/models/0.5.1/arddweud_200303.tar.gz
I greu systemau adnabod lleferydd, mae angen nifer sylweddol iawn o recordiadau o leisiau gwahanol bobl. Rydym wedi gwneud hynny yn bennaf drwy gyfrwng Common Voice, sef llwyfan Mozilla i gasglu lleisiau pobl yn darllen yn uchel frawddegau penodol. Rydym yn ddiolchgar iawn i Rhoslyn Prys (meddal.com) a ymgymerodd â nifer o ymgyrchoedd torfoli ar sail wirfoddol, i'r Mentrau Iaith, Cyngor Gwynedd, Llyfrgell Genedlaethol Cymru a weithiodd gyda Rhoslyn ar rai o'r ymgyrchoedd hyn, hefyd i Lywodraeth Cymru am eu hymgyrch gyhoeddusrwydd hwy, ac i liaws o gyfranogwyr ar draws Cymru a thu hwnt - dros 1,180 ohonoch erbyn hyn! - sydd wedi cyfrannu eich lleisiau i'r Common Voice Cymraeg. Gallwch gyfrannu eich llais i gynorthwyo i adeiladu cronfa ddata o leisiau fydd pawb yn gallu'i defnyddio i greu rhagor o apiau arloesol ar gyfer dyfeisiau, y we a'r Gymraeg. Os hoffech chi gyfrannu eich llais, ewch i wefan Common Voice i ddechrau arni. https://voice.mozilla.org/cy
Cywirdeb
Yn ôl ein harbrofion, mae'r trawsgrifiwr yn llwyddo gyda WER (word error rate) o 33%. O gymharu, mae systemau tebyg ar gyfer Saesneg â WER llai na 10%. Mae’n fwy na thebyg y bydd canlyniadau’n amrywio rhwng gwahanol ddefnyddwyr. Felly mae’r ap yn cynnwys awgrymiadau ar sut i'w ddefnyddio’n fwy llwyddiannus. Ond mae’r profiad o ddefnyddio’r rhaglen gyda brawddegau ar hap, a chael rhan helaeth o’r geiriau yn gywir yn arwyddocaol iawn. Yn ein barn ni mae’r ansawdd yn garreg filltir yn natblygiad adnabod lleferydd Cymraeg.