Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

멋진 프로젝트네요! #6

Open
noowad93 opened this issue Dec 15, 2020 · 0 comments
Open

멋진 프로젝트네요! #6

noowad93 opened this issue Dec 15, 2020 · 0 comments

Comments

@noowad93
Copy link

noowad93 commented Dec 15, 2020

안녕하세요!
구글링하다가 대학원 시절에 연구했던 것과 비슷한 프로젝트를 하고 계셔서, 추가적인 데이터로 사용할 만한 오픈 데이터 공유드립니다.
https://github.com/steveash/NETransliteration-COLING2018/blob/master/data/wd_korean
위 데이터셋은 wikidata에서 수집한 인명에 대한 transliteration 데이터셋인데요.
다양한 국가의 이름이 섞여 있어서 각 국가 및 언어별 transliterator를 만들기에는 적절하지 않을 수도 있지만,
꽤 대량이기 때문에 사전학습용으로는 유용하게 사용했던 기억이 있습니다.
도움이 되셨으면 좋겠네요!

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant