一步一步迭代实践用 gRPC 和 Kubernetes 构建一个 TTS Server

栏目: 服务器 · 发布时间: 6年前

内容简介:在 Mac 上CMU Flite:一个小型的快速运行时间合成引擎。执行命令

背景

在 Mac 上 say hello ,你应该能听到 hello 的朗读音。那如果我们要在 Linux 服务器上提供类似的服务,我们可以怎么做呢?

CMU Flite:一个小型的快速运行时间合成引擎。

实战一

FROM alpine

RUN apk update && apk add flite

执行命令 $ docker build -t say . 控制台日志:

Sending build context to Docker daemon  2.048kB
Step 1/2 : FROM alpine
 ---> 11cd0b38bc3c
Step 2/2 : RUN apk update && apk add flite
 ---> Running in c576fa1f9d01
fetch http://dl-cdn.alpinelinux.org/alpine/v3.8/main/x86_64/APKINDEX.tar.gz
fetch http://dl-cdn.alpinelinux.org/alpine/v3.8/community/x86_64/APKINDEX.tar.gz
v3.8.1-1-g91d49cb572 [http://dl-cdn.alpinelinux.org/alpine/v3.8/main]
v3.8.1-1-g91d49cb572 [http://dl-cdn.alpinelinux.org/alpine/v3.8/community]
OK: 9543 distinct packages available
(1/1) Installing flite (2.1-r0)
Executing busybox-1.28.4-r0.trigger
OK: 30 MiB in 14 packages
Removing intermediate container c576fa1f9d01
 ---> 8c697cbdb1a6
Successfully built 8c697cbdb1a6
Successfully tagged say:latest

使用 Docker 运行一下构建的 say 服务的 flite 是否可用。

docker run --rm say flite -h

如果正常显示 flite 的一些帮助说明,即表示正常。

然后我们再来试一下 flite 朗读词汇。

docker run --rm -v $(pwd)/data:/data -w /data say flite -o output.wav -t hello

这里要注意以下几个参数:

-w="": Working directory inside the container

通过 Docker 调用 flite 产生的音频文件 output.wav ,我们可以使用 afplay 来播放。

afplay data/output.wav

afplay 是 Mac 上自带的一款命令行播放音频文件的工具。

实战二

我们已经可以使用 flite 来将文本转换为音频了。

那接下来,我来讲 flite 跟 Go 整合试试看。

package main

import (
	"log"
	"os"
	"os/exec"
)

func main() {
	cmd := exec.Command("flite", "-t", os.Args[1], "-o", "output.wav")
	cmd.Stdout = os.Stdout
	cmd.Stderr = os.Stderr
	if err := cmd.Run(); err != nil {
		log.Fatal(err)
	}
}

虽然说这样很简单,但是也算是跟 Go 整合了,不是吗。

但是我运行 go run main.go ,会报错:

2018/09/18 09:53:42 exec: "flite": executable file not found in $PATH
exit status 1

怎么办呢?

有几种办法来解决,第一个当然就是你可以在你本地安装一个 flite,它也是支持 Mac OSX 的。

这个就非常简单了,我这里就不跟大家演示了。

前面实战一,我们已经可以在 Linux 服务器上安装了 flite 了,那我们可以将这个 go 程序构建到这个服务器上,不就可以运行了吗。

要将 go 程序构建到服务器上有几种办法:

  • 直接将源码拉入有 Go 编译环境的服务器,然后编译源码为可执行文件即可。
  • 直接将程序构建为一个 Linux 上可执行的程序,然后将程序传到 Linux 服务器上。

在这里,很显然是第二种方法更简单一些。

修改 Dockerfile,只需要将 say 拷贝到 linux 可执行路径下(默认是 / 根目录),然后将 /say 提供服务。

FROM alpine

RUN apk update && apk add flite
ADD say /say

ENTRYPOINT ["/say"]

创建一个 Makefile 文件来构建 go 程序:

build:
	GOOS=linux go build -o say
	docker build -t say .

然后我们直接执行 docker run --rm -v $(pwd)/data:/data -w /data say "hello there you are a good man."

然后通过 afplay output.wav 就能播放声音了。

实战三

gRPC 服务,首先得有一个 Server 端,然后再写一个 Client 端,就可以正常调用了,因为这里涉及到对于 flite 的调用,所以我们还是将 Server 端的程序部署到有 flite 的 Docker 服务器上。

首先先重写 server.go

package main

import (
	"context"
	"flag"
	"fmt"
	"io/ioutil"
	"log"
	"net"
	"os/exec"

	pb "github.com/yangwenmai/examples/tts-grpc-k8s/api"
	grpc "google.golang.org/grpc"
)

func main() {
	port := flag.Int("p", 8080, "port to listen to")
	flag.Parse()

	log.Printf("listening to port: %v\n", *port)
	// 监听 TCP:8080
	lis, err := net.Listen("tcp", fmt.Sprintf(":%d", *port))
	if err != nil {
		log.Fatalf("listen failed :%v", err)
	}

	// 创建一个 gRPC Server
	s := grpc.NewServer()
	// 给 gRPC Server 注册一个服务
	pb.RegisterTextToSpeechServer(s, &server{})

	// 根据 listen 为 gRPC Server 启动一个 Serve 来服务。
	err = s.Serve(lis)
	if err != nil {
		log.Fatalf("could not to serve:%v", err)
	}
}

type server struct{}

func (s *server) Say(ctx context.Context, in *pb.Text) (*pb.Speech, error) {
	file, err := ioutil.TempFile("", "")
	if err != nil {
		return nil, fmt.Errorf("could not create tmp file: %v", err)
	}
	if err := file.Close(); err != nil {
		return nil, fmt.Errorf("could not close :%v", err)
	}

	cmd := exec.Command("flite", "-t", in.Text, "-o", file.Name())
	// 得到 cmd 执行后的标准输出和标准错误
	if data, err := cmd.CombinedOutput(); err != nil {
		return nil, fmt.Errorf("flite failed %s", data)
	}
	// 将文件内容读出来
	data, err := ioutil.ReadFile(file.Name())
	if err != nil {
		return nil, fmt.Errorf("could not read temp file:%v", err)
	}
	return &pb.Speech{Audio: data}, nil
}

执行以下代码,将 Server 端打包到 Docker 中。

build:
	GOOS=linux go build -o say
	docker build -t say .

然后写 client.go

package main

import (
	"context"
	"flag"
	"fmt"
	"io/ioutil"
	"log"
	"os"

	pb "github.com/yangwenmai/examples/tts-grpc-k8s/pb"
	grpc "google.golang.org/grpc"
)

func main() {
	server := flag.String("b", "localhost:8080", "address of say backend")
	output := flag.String("o", "output.wav", "wav file where the output will be written")
	flag.Parse()

	if flag.NArg() < 1 {
		fmt.Printf("usage:\n\t%s \"text to speech\"\n", os.Args[0])
		os.Exit(1)
	}

	con, err := grpc.Dial(*server, grpc.WithInsecure())
	if err != nil {
		log.Fatalf("dial err:%v", err)
	}
	defer con.Close()

	client := pb.NewTextToSpeechClient(con)
	text := &pb.Text{Text: flag.Arg(0)}
	res, err := client.Say(context.Background(), text)
	if err != nil {
		log.Fatalf("could to say %s: %v", text.Text, err)
	}
	if err := ioutil.WriteFile(*output, res.Audio, 0666); err != nil {
		log.Fatalf("write file err:%v", err)
	}
}

启动 Docker 服务, docker run --rm -v $(pwd)/data:/data -w /data -p 8080:8080 --name say say ,然后进入到 client 目录下执行: go run client.go -o data/output.wav "hello man!"

通过 afplay data/output.wav 播放你所录入的文本音频,是不是非常的简单,并且又很强大呢!!!

实战四

将 gRPC 服务部署到 kubernetes 集群中,并且做多借点,客户端调用的时候,可以校验其负载均衡。

因为 kubernetes 这里的镜像跟你使用 Docker 去 run 镜像是不一样的,所以你最好将镜像push到远端,比方说 Docker hub。

docker build x.x.x.x:5000/say .
docker push x.x.x.x:5000/say

kubernetes 的 Deployment 和 Service 配置:

apiVersion: extensions/v1beta1
kind: Deployment
metadata:
  name: say-deployment
spec:
  replicas: 3
  template:
    metadata:
      labels:
        app: say
    spec:
      containers:
      - name: say
        image: xxxxxx/say
        ports:
        - containerPort: 8080
---
apiVersion: v1
kind: Service
metadata:
  name: say-service
spec:
  selector:
    app: say
  ports:
    - protocol: TCP
      port: 8080
  type: LoadBalancer

涉及源码包

  • context
    • context.Background()
  • flag
    • flag.String()
    • flag.Int()
    • flag.Parse()
    • flag.NArg()
    • flag.Arg(0)
  • fmt
    • fmt.Println()
    • fmt.Printf()
  • io/ioutil
    • ioutil.ReadFile()
    • ioutil.WriteFile()
    • ioutil.TempFile()
  • log
    • log.Fatalf()
    • log.Println()
  • net
    • net.Listen()
  • os/exec
    • exec.Command()

参考资料

  1. CMU Flite
  2. Docker run parameters

茶歇驿站

一个可以让你停下来看一看,在茶歇之余给你帮助的小站,这里的内容主要是后端技术,个人管理,团队管理,以及其他个人杂想。

一步一步迭代实践用 gRPC 和 Kubernetes 构建一个 TTS Server


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

认知与设计

认知与设计

Jeff Johnson / 张一宁 / 人民邮电出版社 / 2011-9-1 / 59.00元

本书语言清晰明了,将设计准则与其核心的认知学和感知科学高度统一起来,使得设计准则更容易地在具体环境中得到应用。涵盖了交互计算机系统设计的方方面面,为交互系统设计提供了支持工程方法。不仅如此,这也是一本人类行为原理的入门书。一起来看看 《认知与设计》 这本书的介绍吧!

HTML 编码/解码
HTML 编码/解码

HTML 编码/解码

XML 在线格式化
XML 在线格式化

在线 XML 格式化压缩工具

RGB HSV 转换
RGB HSV 转换

RGB HSV 互转工具