Skip to content

Commit

Permalink
Fersiwn 0.2.0 gyda spacy fel parsiwr
Browse files Browse the repository at this point in the history
  • Loading branch information
str20tbl committed Jul 30, 2023
1 parent b3d4c96 commit b420f34
Show file tree
Hide file tree
Showing 2 changed files with 47 additions and 47 deletions.
2 changes: 1 addition & 1 deletion .idea/workspace.xml

Some generated files are not rendered by default. Learn more about how customized files appear on GitHub.

92 changes: 46 additions & 46 deletions src/tests/test_parser.py
Original file line number Diff line number Diff line change
Expand Up @@ -53,21 +53,21 @@
["""Y dyddiad yw'r 1af o Fawrth.""", """Y dyddiad yw'r cyntaf o Fawrth."""],
[
"""Bydd Cymru’n herio Bosnia-Herzegovina yn Stadiwm Dinas Caerdydd ddydd Iau (Hydref 6) – gyda’r gic \
gyntaf am 7:15 y nos.""",
gyntaf am 7:15 y nos.""",
"""Bydd Cymru’n herio Bosnia-Herzegovina yn Stadiwm Dinas Caerdydd ddydd Iau (Hydref chwech) – gyda’r \
gic gyntaf am chwarter awr wedi saith y nos.""",
gic gyntaf am chwarter awr wedi saith y nos.""",
],
[
"""“A fedrwn ni fod yn fwy gobeithiol na Saunders Lewis yn 1962? Yn sicr ni allwn fforddio anobeithio,” \
medd Dafydd Morgan Lewis, y golygydd.""",
medd Dafydd Morgan Lewis, y golygydd.""",
"""“A fedrwn ni fod yn fwy gobeithiol na Saunders Lewis yn fil naw chwech dau? Yn sicr ni allwn fforddio \
anobeithio,” medd Dafydd Morgan Lewis, y golygydd.""",
anobeithio,” medd Dafydd Morgan Lewis, y golygydd.""",
],
[
"""Neithiwr, roedd y tymheredd yn 20.5 gradd selsiws yn Aberporth yng Ngheredigion, gan dorri’r record \
flaenorol o 18.9 gradd selsiws yn y Rhyl yn 1949.""",
flaenorol o 18.9 gradd selsiws yn y Rhyl yn 1949.""",
"""Neithiwr, roedd y tymheredd yn ugain pwynt pump gradd selsiws yn Aberporth yng Ngheredigion, gan \
dorri’r record flaenorol o un deg wyth pwynt naw gradd selsiws yn y Rhyl yn fil naw pedwar naw.""",
dorri’r record flaenorol o un deg wyth pwynt naw gradd selsiws yn y Rhyl yn fil naw pedwar naw.""",
],
[
"""Bydd y trên nesaf sy'n cyrraedd platfform 2 yn gadael am Sanclêr am 4:35yp.""",
Expand All @@ -79,91 +79,91 @@
],
[
"""Daw rhybudd undeb BMA Cymru wedi i weithiwr gwyno am brinder staff a \
morâl isel mewn un bwrdd iechyd.""",
morâl isel mewn un bwrdd iechyd.""",
"""Daw rhybudd undeb BMA Cymru wedi i weithiwr gwyno am brinder staff a \
morâl isel mewn un bwrdd iechyd.""",
morâl isel mewn un bwrdd iechyd.""",
],
[
"""Gwynedd i ymgynghori ar dreth 300% ar ail gartrefi.""",
"""Gwynedd i ymgynghori ar dreth tri chant y cant ar ail gartrefi.""",
],
[
"""'Sa ti 'di deutha fi pan o'n i'n wyth mlwydd oed fyswn i yn y Pafiliwn, yn 34, yn gwisgo ffrog a \
sodla' o flaen cynulleidfa o 2,000 bobl, fyswn i ddim 'di dy goelio di.""",
sodla' o flaen cynulleidfa o 2,000 bobl, fyswn i ddim 'di dy goelio di.""",
"""'Sa ti 'di deutha fi pan o'n i'n wyth mlwydd oed fyswn i yn y Pafiliwn, yn dri deg pedwar, yn gwisgo \
ffrog a sodla' o flaen cynulleidfa o ddwy fil bobl, fyswn i ddim 'di dy goelio di.""",
ffrog a sodla' o flaen cynulleidfa o ddwy fil bobl, fyswn i ddim 'di dy goelio di.""",
],
[
"""Dywedodd Rebecca Evans, y Gweinidog Cyllid a Llywodraeth Leol: "Mae hwn yn newid sydd wedi ei deilwra \
i anghenion unigryw'r farchnad dai yng Nghymru ac mae'n cyfrannu at ein gweledigaeth ehangach o greu \
system drethi decach. "Ni fydd 61% o brynwyr tai yn gorfod talu treth. Bydd y newidiadau hyn yn rhoi \
cymorth i'r bobl sydd ei angen, ac yn helpu ag effaith y cynnydd mewn cyfraddau llog.""",
i anghenion unigryw'r farchnad dai yng Nghymru ac mae'n cyfrannu at ein gweledigaeth ehangach o greu \
system drethi decach. "Ni fydd 61% o brynwyr tai yn gorfod talu treth. Bydd y newidiadau hyn yn rhoi \
cymorth i'r bobl sydd ei angen, ac yn helpu ag effaith y cynnydd mewn cyfraddau llog.""",
"""Dywedodd Rebecca Evans, y Gweinidog Cyllid a Llywodraeth Leol: "Mae hwn yn newid sydd wedi ei deilwra \
i anghenion unigryw'r farchnad dai yng Nghymru ac mae'n cyfrannu at ein gweledigaeth ehangach o greu \
system drethi decach. "Ni fydd chwe deg un y cant o brynwyr tai yn gorfod talu treth. Bydd y newidiadau \
hyn yn rhoi cymorth i'r bobl sydd ei angen, ac yn helpu ag effaith y cynnydd mewn cyfraddau llog.""",
i anghenion unigryw'r farchnad dai yng Nghymru ac mae'n cyfrannu at ein gweledigaeth ehangach o greu \
system drethi decach. "Ni fydd chwe deg un y cant o brynwyr tai yn gorfod talu treth. Bydd y newidiadau \
hyn yn rhoi cymorth i'r bobl sydd ei angen, ac yn helpu ag effaith y cynnydd mewn cyfraddau llog.""",
],
[
"""Yn ogystal, nid ydym yn argymell cymariaethau rhwng yr amcangyfrifon cysgu allan o'r casgliad misol \
hwn a'r cyfrif blynyddol o gysgu allan (hyd at fis Tachwedd 2019). Yn y casgliad misol hwn, gofynnir i \
awdurdodau lleol seilio eu hamcangyfrifon ar ddeallusrwydd lleol. Mae gan y cyfrif blynyddol o gysgu \
allan fethodoleg wahanol: ymarfer casglu gwybodaeth dwy wythnos, ac yna cyfrif ciplun un noson.""",
hwn a'r cyfrif blynyddol o gysgu allan (hyd at fis Tachwedd 2019). Yn y casgliad misol hwn, gofynnir i \
awdurdodau lleol seilio eu hamcangyfrifon ar ddeallusrwydd lleol. Mae gan y cyfrif blynyddol o gysgu \
allan fethodoleg wahanol: ymarfer casglu gwybodaeth dwy wythnos, ac yna cyfrif ciplun un noson.""",
"""Yn ogystal, nid ydym yn argymell cymariaethau rhwng yr amcangyfrifon cysgu allan o'r casgliad misol \
hwn a'r cyfrif blynyddol o gysgu allan (hyd at fis Tachwedd dwy fil un deg naw). Yn y casgliad misol \
hwn, gofynnir i awdurdodau lleol seilio eu hamcangyfrifon ar ddeallusrwydd lleol. Mae gan y cyfrif \
blynyddol o gysgu allan fethodoleg wahanol: ymarfer casglu gwybodaeth dwy wythnos, ac yna cyfrif \
ciplun un noson.""",
hwn a'r cyfrif blynyddol o gysgu allan (hyd at fis Tachwedd dwy fil un deg naw). Yn y casgliad misol \
hwn, gofynnir i awdurdodau lleol seilio eu hamcangyfrifon ar ddeallusrwydd lleol. Mae gan y cyfrif \
blynyddol o gysgu allan fethodoleg wahanol: ymarfer casglu gwybodaeth dwy wythnos, ac yna cyfrif \
ciplun un noson.""",
],
[
"""Nid i ni, O Arglwydd, nid i ni, Ond i’th enw dy hun, rho ogoniant, Er mwyn dy gariad a’th ffyddlondeb.\
Pam y mae’r cenhedloedd yn dweud, “Ble mae eu Duw?” Y mae ein Duw ni yn y nefoedd; Fe wna beth bynnag a\
ddymuna.""",
Pam y mae’r cenhedloedd yn dweud, “Ble mae eu Duw?” Y mae ein Duw ni yn y nefoedd; Fe wna beth bynnag a\
ddymuna.""",
"""Nid i ni, O Arglwydd, nid i ni, Ond i’th enw dy hun, rho ogoniant, Er mwyn dy gariad a’th ffyddlondeb.\
Pam y mae’r cenhedloedd yn dweud, “Ble mae eu Duw?” Y mae ein Duw ni yn y nefoedd; Fe wna beth bynnag a\
ddymuna.""",
Pam y mae’r cenhedloedd yn dweud, “Ble mae eu Duw?” Y mae ein Duw ni yn y nefoedd; Fe wna beth bynnag a\
ddymuna.""",
],
[
"""Mae'r Mesur hwn, a basiwyd gan Gynulliad Cenedlaethol Cymru ar 7 Rhagfyr 2010 ac a gymeradwywyd gan Ei\
Mawrhydi yn Ei Chyngor ar 9 Chwefror 2011, yn deddfu'r darpariaethau a ganlyn:""",
Mawrhydi yn Ei Chyngor ar 9 Chwefror 2011, yn deddfu'r darpariaethau a ganlyn:""",
"""Mae'r Mesur hwn, a basiwyd gan Gynulliad Cenedlaethol Cymru ar seithfed Rhagfyr dwy fil a deg ac a\
gymeradwywyd gan Ei Mawrhydi yn Ei Chyngor ar nawfed Chwefror dwy fil un deg un, yn deddfu'r\
darpariaethau a ganlyn:""",
gymeradwywyd gan Ei Mawrhydi yn Ei Chyngor ar nawfed Chwefror dwy fil un deg un, yn deddfu'r\
darpariaethau a ganlyn:""",
],
["""Helo a chroeso i'r podlediad Am Blant.""", """Helo a chroeso i'r podlediad Am Blant."""],
["""Oce, pnawn da pawb.""", """Oce, pnawn da pawb."""],
[
"""So ma'r concept 'ma o lunia' a rhannu llunia' a bo’ 'na lun yn gallu mynd yn fyd-eang mewn eiliada' \
o'i dynnu de a bod ch'mod ffôns 'fo ansawdd da a ballu mae o, mae o'n frawychus mewn ffor'.""",
o'i dynnu de a bod ch'mod ffôns 'fo ansawdd da a ballu mae o, mae o'n frawychus mewn ffor'.""",
"""So ma'r concept 'ma o lunia' a rhannu llunia' a bo’ 'na lun yn gallu mynd yn fyd-eang mewn eiliada' \
o'i dynnu de a bod ch'mod ffôns 'fo ansawdd da a ballu mae o, mae o'n frawychus mewn ffor'.""",
o'i dynnu de a bod ch'mod ffôns 'fo ansawdd da a ballu mae o, mae o'n frawychus mewn ffor'.""",
],
[
"""A dwi'n meddwl hefyd fel rhieni bo' gyno ni rei arferion ansaff bob mis Medi ma' pawb efo ma' 'na \
lot does ar hyd y cyfrynga’ cymdeithasol llunia' a'r Facebook o blentyn yn mynd i'r ysgol yn ei wisg \
ysgol, mae'r bathodyn ysgol yna.""",
lot does ar hyd y cyfrynga’ cymdeithasol llunia' a'r Facebook o blentyn yn mynd i'r ysgol yn ei wisg \
ysgol, mae'r bathodyn ysgol yna.""",
"""A dwi'n meddwl hefyd fel rhieni bo' gyno ni rei arferion ansaff bob mis Medi ma' pawb efo ma' 'na \
lot does ar hyd y cyfrynga’ cymdeithasol llunia' a'r Facebook o blentyn yn mynd i'r ysgol yn ei wisg \
ysgol, mae'r bathodyn ysgol yna.""",
lot does ar hyd y cyfrynga’ cymdeithasol llunia' a'r Facebook o blentyn yn mynd i'r ysgol yn ei wisg \
ysgol, mae'r bathodyn ysgol yna.""",
],
[
"""Wel un o'r petha' efo ecsbloetiaeth un o'r prif nodweddion ecsbloetiaeth ydi bo' bobol ddim yn \
dalld bo' n'w'n ca'l i ecsbloetio a ddim yn 'im yn gw'bod bo' 'na rywun yn cymud mantais ohonyn n'w \
ac yn dadla' bron iawn i'r gwrthwyneb ma'i cariad a parch a ballu sy'n mynd ymlaen mewn ffor'.""",
dalld bo' n'w'n ca'l i ecsbloetio a ddim yn 'im yn gw'bod bo' 'na rywun yn cymud mantais ohonyn n'w \
ac yn dadla' bron iawn i'r gwrthwyneb ma'i cariad a parch a ballu sy'n mynd ymlaen mewn ffor'.""",
"""Wel un o'r petha' efo ecsbloetiaeth un o'r prif nodweddion ecsbloetiaeth ydi bo' bobol ddim yn \
dalld bo' n'w'n ca'l i ecsbloetio a ddim yn 'im yn gw'bod bo' 'na rywun yn cymud mantais ohonyn n'w \
ac yn dadla' bron iawn i'r gwrthwyneb ma'i cariad a parch a ballu sy'n mynd ymlaen mewn ffor'.""",
dalld bo' n'w'n ca'l i ecsbloetio a ddim yn 'im yn gw'bod bo' 'na rywun yn cymud mantais ohonyn n'w \
ac yn dadla' bron iawn i'r gwrthwyneb ma'i cariad a parch a ballu sy'n mynd ymlaen mewn ffor'.""",
],
[
"""Be o'dd dy ymateb di i'r ffaith bod angen 'falla' i ni ail ystyried hawlia' plant yng ngoleuni'r \
COVID un deg naw?""",
COVID un deg naw?""",
"""Be o'dd dy ymateb di i'r ffaith bod angen 'falla' i ni ail ystyried hawlia' plant yng ngoleuni'r \
COVID un deg naw?""",
COVID un deg naw?""",
],
[
"""Boneddigion a Boneddigesau, Bechgyn a Genethod, dowch yn llu! Mae atyniad newydd wedi cyrraedd \
Pen Y Pier... Y Syrcas! Ond nid syrcas arferol mo hon, o na!""",
Pen Y Pier... Y Syrcas! Ond nid syrcas arferol mo hon, o na!""",
"""Boneddigion a Boneddigesau, Bechgyn a Genethod, dowch yn llu! Mae atyniad newydd wedi cyrraedd \
Pen Y Pier... Y Syrcas! Ond nid syrcas arferol mo hon, o na!""",
Pen Y Pier... Y Syrcas! Ond nid syrcas arferol mo hon, o na!""",
],
[
"""1: 1 tbsp Olew olewydd oil
Expand All @@ -181,7 +181,7 @@
pump: dau Clof garlleg, heb groen ac wedi eu torri’n fânpped
chwech: dau gant kg Cnau castan (defnyddiwch y rhai mewn paced os ydy’n haws), wedi eu hanerughly
saith: dau gant saith deg pump g (Hanner jar) o domatos heulsych, gyda’r olew wedi eu \
draenio ac wedi eu torritorn
draenio ac wedi eu torritorn
wyth: dau Afal, wedi eu creiddio a’u torru yn ddeisiauunks""",
],
[
Expand All @@ -200,7 +200,7 @@
pumed: dau Clof garlleg, heb groen ac wedi eu torri’n fânpped
chweched: dau gant kg Cnau castan (defnyddiwch y rhai mewn paced os ydy’n haws), wedi eu hanerughly
seithfed: dau gant saith deg pump g (Hanner jar) o domatos heulsych, gyda’r olew wedi eu \
draenio ac wedi eu torritorn
draenio ac wedi eu torritorn
wythfed: dau Afal, wedi eu creiddio a’u torru yn ddeisiauunks""",
],
["mae gen i £200", "mae gen i ddau gan punt"],
Expand Down

0 comments on commit b420f34

Please sign in to comment.