内容简介:kbd-audio项目是一系列用于捕获和分析音频数据的命令行和GUI工具的集合。其中我认为最有意思的一款工具是keytap,它可以通过麦克风来捕获和分析键盘的输入,从而猜测出按键内容。有关keytap的更多信息,可以参阅以下博文及演示视频:
前言
kbd-audio项目是一系列用于捕获和分析音频数据的命令行和GUI工具的集合。其中我认为最有意思的一款 工具 是keytap,它可以通过麦克风来捕获和分析键盘的输入,从而猜测出按键内容。
有关keytap的更多信息,可以参阅以下博文及演示视频:
Keytap: description and some random thoughts
构建说明
相关依赖
SDL2 – 用于捕获音频和打开GUI windows libsdl
FFTW3 – 一些辅助工具执行傅里叶变换(Fourier Transformation)fftw
Linux & Mac OS
git clone https://github.com/ggerganov/kbd-audio cd kbd-audio git submodule update --init mkdir build && cd build cmake .. make
Windows
(todo, PRs welcome)
工具集
record-full
将音频录制到磁盘上的原始二进制文件
./record-full output.kbd
play-full
播放通过record-full捕获的录制内容
./play-full input.kbd
record
仅在键入时录制音频。用于收集keytap的训练数据
./record output.kbd
play
播放通过record创建的录制内容
./play input.kbd
keytap
通过麦克风音频实时检测并捕获按下的键。使用record捕获的训练数据。
./keytap-gui input0.kbd [input1.kbd] [input2.kbd] ...
Live demo (需要启用WebAssembly pthreads和SharedArrayBuffer)
keytap2(正在开发中)
通过麦克风音频实时检测并捕获按下的键。使用关于语言的统计信息(n-gram频率)。无需训练数据。recording.kbd输入文件必须通过record-full生成,并包含将要分析的音频数据。n-gram.txt文件必须包含相应语言的n-gram概率。
./keytap2-gui recording.kbd n-gram.txt
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:- HotKeys.js 2.0.4 发布,设置快捷键,捕获键盘输入
- HotKeys.js 2.0.5 发布,设置快捷键,捕获键盘输入
- Android获取软键盘的高度、键盘的打开与关闭、监听键盘处于打开还是关闭状态
- js捕获错误信息
- Python捕获所有异常
- Android NativeCrash 捕获与解析
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Making Things See
Greg Borenstein / Make / 2012-2-3 / USD 39.99
Welcome to the Vision Revolution. With Microsoft's Kinect leading the way, you can now use 3D computer vision technology to build digital 3D models of people and objects that you can manipulate with g......一起来看看 《Making Things See》 这本书的介绍吧!