声纹识别引擎 govpr

码农软件 · 软件分类 · TTS/语音合成和处理 · 2019-10-04 06:58:22

软件介绍

简介

govpr是golang 实现的基于 GMM-UBM 说话人识别引擎(声纹识别),可用于语音验证,身份识别的场景. 目前暂时仅支持汉语数字的语音,语音格式为wav格式(比特率16000,16bits,单声道)

安装

go get github.com/liuxp0827/govpr

示例

如下是一个简单的示例. 可跳转至 example 查看详细的例子,示例中的语音为纯数字8位数字.语音验证后得到一个得分,可设置阈值来判断验证语音是否为注册训练者本人.

package main
import (
    "github.com/liuxp0827/govpr"
    "github.com/liuxp0827/govpr/log"
    "github.com/liuxp0827/govpr/waveIO"
    "io/ioutil"
)
type engine struct {
    vprEngine *govpr.VPREngine
}
func NewEngine(sampleRate, delSilRange int, ubmFile, userModelFile string) *engine {
    return &engine{
        vprEngine: govpr.NewVPREngine(sampleRate, delSilRange, ubmFile, userModelFile),
    }
}
func (this *engine) DestroyEngine() {
    this.vprEngine = nil
}
func (this *engine) TrainSpeech(buffers [][]byte) error {
    var err error
    count := len(buffers)
    for i := 0; i < count; i++ {
        err = this.vprEngine.AddTrainBuffer(buffers[i])
        if err != nil {
            log.Error(err)
            return err
        }
    }
    defer this.vprEngine.ClearTrainBuffer()
    defer this.vprEngine.ClearAllBuffer()
    err = this.vprEngine.TrainModel()
    if err != nil {
        log.Error(err)
        return err
    }
    return nil
}
func (this *engine) RecSpeech(buffer []byte) error {
    err := this.vprEngine.AddVerifyBuffer(buffer)
    defer this.vprEngine.ClearVerifyBuffer()
    if err != nil {
        log.Error(err)
        return err
    }
    err = this.vprEngine.VerifyModel()
    if err != nil {
        log.Error(err)
        return err
    }
    Score := this.vprEngine.GetScore()
    log.Infof("vpr score: %f", Score)
    return nil
}
func main() {
    log.SetLevel(log.LevelDebug)
    vprEngine := NewEngine(16000, 50, "../ubm/ubm", "model/test.dat")
    trainlist := []string{
        "wav/train/01_32468975.wav",
        "wav/train/02_58769423.wav",
        "wav/train/03_59682734.wav",
        "wav/train/04_64958273.wav",
        "wav/train/05_65432978.wav",
    }
    trainBuffer := make([][]byte, 0)
    for _, file := range trainlist {
        buf, err := loadWaveData(file)
        if err != nil {
            log.Error(err)
            return
        }
        trainBuffer = append(trainBuffer, buf)
    }
    verifyBuffer, err := waveIO.WaveLoad("wav/verify/34986527.wav")
    if err != nil {
        log.Error(err)
        return
    }
    vprEngine.TrainSpeech(trainBuffer)
    vprEngine.RecSpeech(verifyBuffer)
}
func loadWaveData(file string) ([]byte, error) {
    data, err := ioutil.ReadFile(file)
    if err != nil {
        return nil, err
    }
    // remove .wav header info 44 bits
    data = data[44:]
    return data, nil
}

本文地址:https://codercto.com/soft/d/15992.html

.net之美

.net之美

张子阳 / 机械工业出版社 / 2014-1-1 / 79

本书是.NET 程序员进阶修炼的必读之作,由拥有多年开发经验的资深.NET 技术专家对C# 和.NET 中实用的、关键的和难以理解的知识点进行了深入解析,旨在帮助读者在尽可能短的时间内以 尽可能低的学习成本去掌握那些最应该被掌握的知识。书中的每个知识点都辅之以精心设计的案例,易 于理解,实践性强。 全书共17 章,分为两个部分:第一部分(1~5 章)主要讲解了C# 语言中的一些关键知识点,如......一起来看看 《.net之美》 这本书的介绍吧!

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具

HEX CMYK 转换工具
HEX CMYK 转换工具

HEX CMYK 互转工具

HEX HSV 转换工具
HEX HSV 转换工具

HEX HSV 互换工具