-
Notifications
You must be signed in to change notification settings - Fork 1.8k
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
[asr]ASR建议输出timeline结构信息 #1257
Comments
做解码器的时候会考虑这个需求 |
是的,视频转字幕的场景也同样需要 时间轴 信息 |
希望可以细化下详细的使用过程或需求,想了解下具体使用的方式。 |
你好,我的使用场景是:配音稿的时间轴矫正 |
想问下,这个输出timeline结构信息functionality大概什么时候能有呀 |
您好,信件已经收到,我将尽快给您回复。
|
This issue has been automatically marked as stale because it has not had recent activity. It will be closed if no further activity occurs. Thank you for your contributions. |
强烈建议搞时间线输出,可惜刚更新的这个还是没有该功能。语音识别不可能只识别一个句子,实际应用的时候是大段大段的语音直接输入,结果出来的是没任何标点符号,没任何时间点信息的文字,还得想别的法子实现获取时间点信息 |
请问这个根据既有文稿逐字稿 匹配音频 并得出时间轴文件的功能现在有了吗 |
就是我有txt一行行的逐字稿 并且有播音文件了。如何将两者匹配 并得出srt带时间轴的文件 |
今天是2023年3月2日,这个功能不会还没有加把 |
已经添加了哦,可以参考这里的返回结果,包含字级别的时间戳:https://github.com/PaddlePaddle/PaddleSpeech/tree/develop/demos/streaming_asr_server |
长音频返回时间戳的时候 socket断开了,看起来是一个bug? |
@zh794390558 你好,针对这个需求我增加了由wav或mp3格式文件生成srt格式字幕文件的功能,提交了merge request #3123
|
我在使用 paddlespeech_server 起 websocket 服务识别长音频的时候也遇到了 |
长音频(长度超过1分钟)生成的srt文件只有结尾的最后一部分音频对应的文本,前面的所有文本都没有 |
想问一下 他这个超过一分钟的音频 使用ffmpeg进行剪切 分段进行处理音频时 还是会有问题 怎么做可以把全部的词汇和时间戳都输出出来呢 谢谢!!! |
已解决 |
语音识别,很多时候需要时间轴,可以用户做提词器之类的工能。 强烈建议考虑一下
The text was updated successfully, but these errors were encountered: