内容简介:在视频编辑中,向视频中加入B-roll是一种比较常见的做法。B-roll可以使得原视频变得更加丰富、更加吸引人。但是,对于新手来说,很难选择插入哪个B-roll,以及插入A-roll的哪个位置。因此,本文[1]提出了B-Script来辅助用户解决上述问题。特别的,B-Script主要针对vlog的B-roll插入问题。为了更好地设计B-Script,文章做了如下的分析:文章分析了Youtube上4个频道上1,100条vlog,并提取出其中的B-roll。通过分析这些vlog中的B-roll,文章得出了如下的
在视频编辑中,向视频中加入B-roll是一种比较常见的做法。B-roll可以使得原视频变得更加丰富、更加吸引人。但是,对于新手来说,很难选择插入哪个B-roll,以及插入A-roll的哪个位置。因此,本文[1]提出了B-Script来辅助用户解决上述问题。特别的,B-Script主要针对vlog的B-roll插入问题。
形式分析
为了更好地设计B-Script,文章做了如下的分析:
一些流行vlog的分析
文章分析了Youtube上4个频道上1,100条vlog,并提取出其中的B-roll。通过分析这些vlog中的B-roll,文章得出了如下的结论:首先,所有的B-roll可以被大致分为两个风格:低质量的社交媒体风格(social media style),以及高质量的专业风格(professional style)。同时,文章还发现了B-roll和文本之间存在着较为紧密的联系。例如,在文本中提到过的物体很有可能在接下来的B-roll中出现。此外,通过分析每一条B-roll,还可以发现大多数B-roll的长度在0.5-8秒,以及两条连续的B-roll之间的间隔的平均值为9秒。
经过专家注释的数据集的分析
文章中同时邀请了一些经验丰富的视频制作者,让他们在给定的一些视频中加入B-roll,来看他们插入B-roll的策略有没有相似之处。首先,对于每个视频,文章使用了Jaccard相似度来计算不同制作者插入的B-roll位置之间的相似度。结果是随机插入相似度的两倍。这表示着对于一个视频,的确存在着好的插入B-roll的位置。此外,文章还分析了视频的文本,并发现视频制作者选择查找B-roll的查询词(query word)通常在B-roll开始位置前后1秒之间。
B-Script用户界面
基于以上的分析,文章提出了B-Script的用户界面。如下图所示,B-Script有三个主要视图:视频面板(video panel),B-roll搜索面板(B-roll search panel),以及交互式视频文本(interactive video transcript)。
B-Script的用户界面
B-Script允许用户探索视频、搜索两种风格的B-Roll,以及插入B-Roll和视频的渲染。此外,文章中还提出了一种B-Roll的推荐算法,给用户推荐可能的B-Roll插入位置。
此前的分析已经得到了,B-Roll与视频文本之间存在着紧密的联系。因此,文章把每个B-Roll的第一个单词作为关键词(keyword),通过判断一个单词是否为关键词来决定是否在此处插入B-Roll。文章使用了每个单词的TF-IDF向量、单词情感态度、词性,以及在当前文本中的出现次数,将每个单词转化成了5,033维向量,再利用这些向量,以及由专家标注过的数据集,训练了一个SVM,来判断一个单词是否为关键词。
用户研究
文章为用户研究提出了一下三个问题:
- 基于文本的用户界面是否比基于时间轴的用户界面更有效
- 推荐系统是否对视频的编辑有帮助
- 推荐系统是否对生成更好的视频有帮助
文章中为用户提供了三个用户界面进行比较:
- 基于时间轴的用户界面(如下图)
- 没有推荐系统的基于文本的用户界面
- 带有推荐系统的基于文本的用户界面
基于时间轴的用户界面
同时,文章还为用户提供了三种推荐的方法:
- 算法给出的推荐
- 专家给出的推荐
- 固定时间间隔给出的推荐
而问卷则对任务的难易度、帮助性,以及满意度等方面对用户进行询问。
结论
文章基于用户研究的结果,给出了如下的结论:
- 基于文本的用户界面比基于时间轴的用户界面更有效
- 基于文本的用户界面与基于时间轴的用户界面操作难度相当
- 高质量的推荐很有用
- 高质量的推荐对好的视频的生成有帮助
小结
本文提出了B-Script,一个帮助用户在视频中插入B-Roll的系统,以及B-Roll的推荐算法,能够帮助用户更好地进行B-Roll的编辑。
在未来的工作中,可能会设计其他类型的视频,如MOOCS等。此外,B-Roll与视频中其他的信号的关系,例如演讲者的停顿、手势行为等,有待更深的挖掘。
参考文献
[1]. B-Script: Transcript-based B-roll Video Editing with Recommendations. Proceedings of the 2019 CHI Conference on Human Factors in Computing Systems . ACM, 2019.
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:- 10个最佳富文本编辑器
- Notepad++ 7.7 发布,文本编辑器
- 文本编辑器 Notepad++ 7.8.1 发布
- Emacs 25.3 发布,Linux 文本编辑器
- GNU nano 5.0 发布,文本编辑器
- SubEthaEdit 5.2 发布,macOS 文本编辑器
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Usability for the Web
Tom Brinck、Darren Gergle、Scott D. Wood / Morgan Kaufmann / 2001-10-15 / USD 65.95
Every stage in the design of a new web site is an opportunity to meet or miss deadlines and budgetary goals. Every stage is an opportunity to boost or undercut the site's usability. Thi......一起来看看 《Usability for the Web》 这本书的介绍吧!
随机密码生成器
多种字符组合密码
HEX HSV 转换工具
HEX HSV 互换工具