Sudachi辞書からmozc用システム辞書を生成するスクリプトです。
連接IDをSudachiからmozcにマップすることにより生成をおこなっています。
マップが難しいエントリはスキップしています。
変換エンジンで使用するために以下の調整をおこなっています。
- 変換対象は分割タイプAとC
- 表記がASCII文字のみならばスキップ
- 表記が単語でなければスキップ
- Sudachiの読みに片仮名以外を含むならばスキップ
- Sudachi辞書内の重複エントリはスキップ
- mozc辞書内にすでにあるエントリはスキップ