Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

如何训练? #1

Open
fighting41love opened this issue Sep 1, 2016 · 7 comments
Open

如何训练? #1

fighting41love opened this issue Sep 1, 2016 · 7 comments

Comments

@fighting41love
Copy link

您好,我下载了您的语料。
请问如何训练这个中文语料?
英文的代码中,th train.lua 即可训练。
查看代码后,发现英文训练语料是个csv格式的数据。
而您的数据中,没有csv,只有conv。
是只需要训练conv即可吗?

@CEfanmin
Copy link

CEfanmin commented Sep 11, 2016

你好,我也不知道怎么训练的conv数据,麻烦能答疑解惑一下不?

@fighting41love
Copy link
Author

并不知道。。。我读了代码,改了代码,不知道为何还是不行。我联系过作者,她可能比较忙。。。
我是在做一个公益项目,想加入这个功能。。。始终未能如愿,如有解决办法,烦请告知。
多谢啦!
我自己也会再研究研究,看看有什么办法。。。(⊙o⊙)…

@CEfanmin
Copy link

好,谢谢,我也研究研究看,知道了我就回复你。

@Edward-liang
Copy link

@fighting41love @CEfanmin 请问这里的语料使用有进展吗?我正在找一些可用于中文聊天机器人的可用语料。

@guob1l
Copy link

guob1l commented Mar 28, 2017

下载这个文件就好了。dgk_shooter_min.conv.zip

@Edward-liang
Copy link

@zzngb 使用了之后发现对话很奇怪。
然后仔细看了下 语料编排的规则:
//M 表示话语,E 表示分割。
E
M 话语 a
M 话语 b
M 话语 c
M 话语 d
E
M 话语 a
M 话语 b
M 话语 c
M 话语 d


然而,电影对白,这种才是可用的吧:
场景 1:
A to B
B to A
A to B
...

场景 2:
A to B
B to A
A to B
...


请问本语料是否有好的应用思路呢?
M 话语 a
M 话语 b
M 话语 c
M 话语 d
这个话语不一定是不是一个人说的呢。

@Charles3000
Copy link

直接把后缀改成.txt就可以用了

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

5 participants