Skip to content

Paymemoney/make-dataest

Repository files navigation

语音识别数据集生成

本项目以新闻联播视频为例。

下载视频

下载新闻联播视频方式:Windowns或Mac平台的央视影音软件

下载新闻联播文字稿方式:新闻联播文字稿

从视频中提取音频

Mac 安装FFmpeg:brew install ffmpeg;其它平台请编译官网下载的压缩包。

运行Video2Audio.py

以语音为依据分割音频

运行segment.py,使用方法请见文件头注释。

语音识别

百度

pip3 install baidu-aip

运行os_test.py

讯飞

直接上传至在线识别

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Packages

No packages published

Contributors 3

  •  
  •  
  •  

Languages