Skip to content

Commit

Permalink
Update word break dictionary.
Browse files Browse the repository at this point in the history
* data/tdict-city.txt:
* data/tdict-collection.txt:
* data/tdict-common.txt:
* data/tdict-ict.txt:
* data/tdict-proper.txt:
* data/tdict-science.txt:
* data/tdict-slang.txt:
  - Add words.
  • Loading branch information
thep committed Dec 20, 2021
1 parent 3adb251 commit 9dc16e5
Show file tree
Hide file tree
Showing 8 changed files with 65 additions and 0 deletions.
13 changes: 13 additions & 0 deletions ChangeLog
Original file line number Diff line number Diff line change
@@ -1,3 +1,16 @@
2021-12-21 Theppitak Karoonboonyanan <theppitak@gmail.com>

Update word break dictionary.

* data/tdict-city.txt:
* data/tdict-collection.txt:
* data/tdict-common.txt:
* data/tdict-ict.txt:
* data/tdict-proper.txt:
* data/tdict-science.txt:
* data/tdict-slang.txt:
- Add words.

2021-09-18 Theppitak Karoonboonyanan <theppitak@gmail.com>

Handle possible malloc failures.
Expand Down
1 change: 1 addition & 0 deletions data/tdict-city.txt
Original file line number Diff line number Diff line change
Expand Up @@ -90,6 +90,7 @@
ไดฟูกุ
ตรังกานู
ตริโปลี
ตูริน
ตูวาลู
เตหะราน
โตเกียว
Expand Down
9 changes: 9 additions & 0 deletions data/tdict-collection.txt
Original file line number Diff line number Diff line change
Expand Up @@ -38,6 +38,7 @@
เอ๊กซ์
วาย
แซด
อัลฟา
แอลฟา
แอลฟ่า
เบตา
Expand All @@ -46,6 +47,14 @@
แกมม่า
เดลตา
เดลต้า
เอปซิลอน
ไอโอตา
แคปปา
แคปป้า
แลมบ์ดา
มิว
โอมิครอน
โอไมครอน
โอเมกา
โอเมก้า
เมกะ
Expand Down
17 changes: 17 additions & 0 deletions data/tdict-common.txt
Original file line number Diff line number Diff line change
Expand Up @@ -338,6 +338,7 @@
ซะ
ซังเต
ซันตาคลอส
ซับไพรม์
ซัพพลาย
ซัพพลายเออร์
ซัมเมอร์
Expand Down Expand Up @@ -375,6 +376,7 @@
ซีน
ซีนีเพล็กซ์
ซีเนียร์
ซีฟู้ด
ซีร็อกซ์
ซีรั่ม
ซีรีส์
Expand Down Expand Up @@ -421,6 +423,7 @@
เซาท์
เซาท์เทิร์น
เซาเทิร์น
เซี้ยม
เซี้ยว
เซียะ
แซ็ก
Expand Down Expand Up @@ -591,6 +594,7 @@
เท่งทึง
เทป
เทรด
เทรดเดอร์
เทรน
เทรนด์
เทรนนิ่ง
Expand Down Expand Up @@ -629,6 +633,7 @@
โทรลล์
ไทแทน
ไทม์
ไทม์ไลน์
ไทยแลนด์
ไทเฮา
ธนารักษ์
Expand Down Expand Up @@ -707,6 +712,7 @@
บัลลาสต์
บัส
บาซาร์
บาติก
บาบูน
บาร์เทนเดอร์
บาร์บีคิว
Expand Down Expand Up @@ -759,6 +765,7 @@
เบอร์รี
เบิร์ด
เบิร์น
เบิ้ล
เบื๊อก
แบ็กโฮ
แบคโฮ
Expand Down Expand Up @@ -868,6 +875,7 @@
แผดเผา
เฝอ
พงษ์
พร้อมเพย์
พริตตี้
พรีเซนต์
พรีเซ็นต์
Expand Down Expand Up @@ -970,6 +978,7 @@
ฟาสต์ฟู้ด
ฟิตเนส
ฟิน
ฟินเทค
ฟินิกซ์
ฟิลเตอร์
ฟิลเลอร์
Expand All @@ -980,6 +989,7 @@
ฟึดฟัด
ฟุตซอล
ฟุตบาท
ฟู้ด
เฟซติวัล
เฟซทิวัล
เฟรช
Expand Down Expand Up @@ -1042,8 +1052,10 @@
มอลต์
มอลล์
มะกัน
มะแขว่น
มะเมื่อม
มั้ง
มังงะ
มังสา
มังสาหาร
มัฟฟิน
Expand Down Expand Up @@ -1127,6 +1139,7 @@
แมนชั่น
แมมบ้า
แมมโบ้
แมมมอธ
แมสก์
แมสเซนเจอร์
แมสเซ็นเจอร์
Expand Down Expand Up @@ -1265,6 +1278,7 @@
ลอจิสติกส์
ล็อต
ล็อบบี้
ล็อบสเตอร์
ลอร์ด
ล้มเหลว
ละติน
Expand Down Expand Up @@ -1300,6 +1314,7 @@
เลย์เอาต์
เลสเบี้ยน
เลิฟ
แลกการ์ด
แลนด์
แล็บ
โลกทัศน์
Expand Down Expand Up @@ -1431,6 +1446,7 @@
สต็อค
สต๊อค
สตอรี
สตั๊ด
สตาฟฟ์
สตาร์
สตาร์ตอัป
Expand Down Expand Up @@ -1489,6 +1505,7 @@
สแล็ก
สโลแกน
สโลว์
สไลซ์
สไลด์
สวิงกิ้ง
สวีท
Expand Down
9 changes: 9 additions & 0 deletions data/tdict-ict.txt
Original file line number Diff line number Diff line change
Expand Up @@ -9,6 +9,7 @@
แกดเจ็ต
แกร็บ
โกลบอล
คริปโต
คลัสเตอร์
คลาวด์
คลาส
Expand Down Expand Up @@ -79,6 +80,7 @@
แท็บ
แทบเล็ต
แท็บเล็ต
โทเคน
โทรจัน
เน็ต
เน็ตบุ๊ก
Expand Down Expand Up @@ -115,6 +117,7 @@
บล็อกเกอร์
บรอดแบนด์
บราวเซอร์
บล็อกเชน
บลูทูท
บลูทูธ
บลูเรย์
Expand Down Expand Up @@ -189,6 +192,9 @@
มิลลิวินาที
มีเดีย
มีม
เมตะเวิร์ส
เมตาเวิร์ส
เมทาเวิร์ส
เมนู
เมมโมรี
เมล
Expand Down Expand Up @@ -293,6 +299,8 @@
อินพุท
อินสตาแกรม
อิมเมจ
อีเทอเรียม
อีเธอเรียม
อีเมล
อีเมล์
อีโมจิ
Expand Down Expand Up @@ -337,6 +345,7 @@
แฮ็คเกอร์
แฮงเอาท์
แฮงเอาต์
แฮช
แฮชแท็ก
แฮนด์เฮลด์
โฮสต์
Expand Down
8 changes: 8 additions & 0 deletions data/tdict-proper.txt
Original file line number Diff line number Diff line change
Expand Up @@ -221,6 +221,7 @@
ธนาธร
ธนินท์
ธอร์
ธานอส
ธีออส
นครินทรา
นโปเลียน
Expand Down Expand Up @@ -434,6 +435,7 @@
ยามาฮ่า
ยาเวห์
ยาฮู
ยิลเลตต์
ยูคลิด
ยูคลิเดียน
ยูนิเซฟ
Expand All @@ -443,6 +445,7 @@
เยโฮวาห์
รอยเตอร์
รอยัล
รังสิมันต์
รัชดา
รัสเซลล์
รัสปูติน
Expand All @@ -462,6 +465,8 @@
โรนัลโด้
โรบิน
โรบินสัน
โรบินฮูด
โรบินฮู้ด
โรเบิร์ต
โรมานอฟ
โรเล็กซ์
Expand Down Expand Up @@ -558,6 +563,7 @@
สุทิดา
สุเทพ
สุนทราภรณ์
สุนันทา
สุนีย์
สุรชัย
สุรนารี
Expand Down Expand Up @@ -658,6 +664,8 @@
เอแบค
เอเปค
เอฟเวอร์ตัน
เอมมา
เอมม่า
เอลิซาเบธ
เอสพลานาด
เอสพลานาร์ด
Expand Down
7 changes: 7 additions & 0 deletions data/tdict-science.txt
Original file line number Diff line number Diff line change
Expand Up @@ -58,6 +58,7 @@
จุลชีววิทยา
จูราสสิก
ชิคุนกุนยา
ชีววัตถุ
ซัลฟิวริก
ซัลเฟต
ซัลเฟอร์
Expand Down Expand Up @@ -160,6 +161,7 @@
เพนนิซิลลิน
เพนนิซิลิน
เพอร์ออกไซด์
แพกซ์โลวิด
โพแทช
โพรเจสเทอโรน
โพรทิสตา
Expand All @@ -176,6 +178,8 @@
ฟลูออเรสเซนซ์
ฟลูออไรด์
ฟอสซิล
ฟาวิพิราเวียร์
ฟาเวียร์
ฟิชชัน
ฟิโบนักซี
ฟิวชัน
Expand All @@ -196,6 +200,7 @@
เมตาโบลิซึม
เมทริกซ์
เมมเบรน
เมลลาร์ด
เมลาโทนิน
เมลานิน
เมลามีน
Expand All @@ -206,13 +211,15 @@
ไมโทคอนเดรีย
โมโนเมอร์
โมโนเมียล
โมลนูพิราเวียร์
ยีสต์
ยูริก
ยูเรีย
ยูโรปา
รีเวิร์ส
รูมาตอยด์
เรตินา
เรมเดซิเวียร์
ไรโบโซม
ลูทีน
เลปตอน
Expand Down
1 change: 1 addition & 0 deletions data/tdict-slang.txt
Original file line number Diff line number Diff line change
Expand Up @@ -6,6 +6,7 @@
จูนิเบียว
ชิล
ตรึม
เปย์
ไลฟ์บอย
แว้น
สตรอง
Expand Down

0 comments on commit 9dc16e5

Please sign in to comment.