Skip to content

v1.0.6

Latest
Compare
Choose a tag to compare
@DewiBrynJones DewiBrynJones released this 21 Apr 10:08

Trawsgrifiwr (v1.0.6)

Mae’r Trawsgrifiwr yn rhaglen Windows yn unig sydd yn trawsgrifio lleferydd Cymraeg i destun. Dydi’r Trawsgrifiwr ddim eto yn adnabod eich geiriau yn iawn bob amser. Mewn arbrofion syml mae’r fersiwn cychwynnol hwn yn camddeall tua 11% o eiriau mewn brawddeg.

Llwytho i lawr y gosodwr

I'w defnyddio cliciwch ar y botwm 'Record', siaradwch frawddeg yn glir am rhwng 5 i 10 eiliad ac yna gliciwch ar y botwm 'Stop'. Bydd y Trawsgrifiwr yn gweithio ar y sain gyda chylch glas yn troi cyn i'r testun o'r hyn a ddywedwyd ymddangos o fewn y blwch testun. Os oes angen, cywirwch y testun a/neu cliciwch ar y botwm 'Copïo' er mwyn gludo'r testun mewn i unrhyw feddalwedd arall ar eich peiriant Windows (e.e. Microsoft Word, LibreOffice neu flwch testun o fewn tudalen we)

Ar y funud mae'n broses araf, yn cymryd tua 3 neu 4 gwaith hirach na'r amser i lefaru'r frawddeg wreiddiol - byddwch yn amyneddgar!
Cefndir

Gwnaed y Trawsgrifiwr Cymraeg yn bosibl diolch i brojectau a chydweithrediad rhwng Mozilla, gwirfoddolwyr, ac Uned Technolegau Iaith, Canolfan Bedwyr, Prifysgol Bangor. Ariannwyd rhan Prifysgol Bangor yn y fenter, gan gynnwys datblygu'r Trawsgrifiwr a'r Ap Macsen gan Lywodraeth Cymru.

Prif sail y Trawsgrifiwr yw DeepSpeech gan Mozilla. Mae DeepSpeech yn beiriant adnabod lleferydd y gellir ei hyfforddi a'i gynnwys yn hwylus o fewn unrhyw becyn meddalwedd. Ewch i https://github.com/mozilla/deepspeech i ddysgu mwy am DeepSpeech.

I hyfforddi DeepSpeech ac i greu systemau adnabod lleferydd, mae angen nifer sylweddol iawn o recordiadau o leisiau gwahanol bobl. Rydym wedi gwneud hynny yn bennaf drwy gyfrwng Common Voice, sef llwyfan Mozilla i gasglu lleisiau pobl yn darllen yn uchel frawddegau penodol. Rydym yn ddiolchgar iawn i Rhoslyn Prys (meddal.com) a ymgymerodd â nifer o ymgyrchoedd torfoli ar sail wirfoddol, i'r Mentrau Iaith, Cyngor Gwynedd, Llyfrgell Genedlaethol Cymru a weithiodd gyda Rhoslyn ar rai o'r ymgyrchoedd hyn, hefyd i Lywodraeth Cymru am eu hymgyrch gyhoeddusrwydd hwy, ac i liaws o gyfranogwyr ar draws Cymru a thu hwnt - dros 1,180 ohonoch erbyn hyn! - sydd wedi cyfrannu eich lleisiau i'r Common Voice Cymraeg. Gallwch gyfrannu eich llais i gynorthwyo i adeiladu cronfa ddata o leisiau fydd pawb yn gallu'i defnyddio i greu rhagor o apiau arloesol ar gyfer dyfeisiau, y we a'r Gymraeg. Os hoffech chi gyfrannu eich llais, ewch i wefan Common Voice i ddechrau arni. https://voice.mozilla.org/cy

Cywirdeb

Yn ôl ein harbrofion syml, mae'r trawsgrifiwr yn llwyddo gyda WER (word error rate) o 11%. O gymharu, mae systemau tebyg ar gyfer Saesneg â WER llai na 10%. Mae’n fwy na thebyg y bydd canlyniadau’n waeth ac yn amrywio rhwng gwahanol ddefnyddwyr. Felly mae’r ap yn cynnwys awgrymiadau ar sut i'w ddefnyddio’n fwy llwyddiannus. Ond mae’r profiad o ddefnyddio’r rhaglen gyda brawddegau ar hap, a chael rhan helaeth o’r geiriau yn gywir yn arwyddocaol iawn. Yn ein barn ni mae’r ansawdd yn garreg filltir yn natblygiad adnabod lleferydd Cymraeg.

Cynnydd ar fersiynau blaenorol

  • mae'r Trawsgrifiwr yn defnyddio peiriant ar-lein os nad oes modd i'ch cyfrifiadur rhedeg y gydran adnabod lleferydd DeepSpeech yn lleol. Mae rhybudd wrth gychwyn y rhaglen i hysbysu'r defnyddiwr.
  • yn defnyddio DeepSpeech 0.9.3
  • modelau wedi eu hyfforddi gyda data Common Voice Rhagfyr 2020 (https://github.com/techiaith/docker-deepspeech-cy/releases/tag/21.03)