365bet现金开户_365bet真人体育_365bet手机娱乐城网

 找回密码
 立即注册

手机号码,快捷登录

查看: 1074|回复: 2
打印 上一主题 下一主题

揭秘2018苹果发布会的中文字幕直播魔术

[复制链接]
跳转到指定楼层
楼主
发表于 2018-11-14 17:03:16 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
时隔一年,我们再次走进库比蒂诺的史蒂夫乔布斯剧院,见证了新一代Apple Watch和iPhone的发布。

整场发布会在互联网上有多家视频平台进行了转播,并配上了多种中文同传和中文字幕。当今时代最顶尖的直播字幕规格,其中到底有什么秘密?
像做苹果发布会这样质量要求极高的活动,各家平台都离不开顶尖的人员阵容和最领先的字幕技术,其中都奥秘下面小编为大家一一揭开!


小编会业内人士的角度和经验,和大家综合介绍一下,神奇的中文字幕直播魔术是怎样实现的。

直播一场英文的演讲活动,并配上其它语言的字幕压到直播视频流上,有几种实现方式:

1)人工同传(SI)+人工365bet现金开户_365bet真人体育_365bet手机娱乐城(Stenography)
这种方式至少需要的人员为:同传(2-3名),双语365bet现金开户_365bet真人体育_365bet手机娱乐城和字幕导演。效果如下:

字幕导演是个啥?

字幕导演是一个新兴工种,在内容为王的时代,头部直播内容的全球化(多语种翻译)显得尤为重要。而且也是一片新开拓的蓝海。

在双语直播活动中,字幕导演的职责是组织同传、365bet现金开户_365bet真人体育_365bet手机娱乐城、演播厅技术人员、直播人员等多方沟通,确保活动开始前保证技术可行,并且在活动过程中担任监听、QA等角色。工作内容包括
·     直播流、导播台、同传设备、365bet现金开户_365bet真人体育_365bet手机娱乐城设备测试,逐项排错。
·     现场监听(所以必须要有双语能力)。
·     实时QA,提供反馈。
·     实时掌控时间轴进度。

字幕导演并不需要真正具备同传的能力,但是合格的字幕导演必须通晓原语言和翻译目标语言,具备极快的临场反应和处理能力,并且需要通晓同传、365bet现金开户_365bet真人体育_365bet手机娱乐城工作方式、演播设备技术、信号处理技术、多语种演讲差异等等。

监听是字幕导演的一大挑战。举例来说,在WWDC 2018大会上提到的VR文件格式USDZ,是会前未曾出现的词汇,第一次听到时候同传和365bet现金开户_365bet真人体育_365bet手机娱乐城人员都太不确定,当时网上搜结果也不多,在这句话出现之后马上查词的话,时间上根本不允许,所以字幕导演必须第一时间确认英文拼写,同步给365bet现金开户_365bet真人体育_365bet手机娱乐城和同传,这样在这个高频词第二次出现的时候才有可能以正确的拼写出现。

监听有多种方式,你可以同时听英文原文和中文同传,或者只听中文同传,监视中文字幕,又或者同时听英文原文,监视中文字幕。人耳和人脑的工作模式,是很难同时倾听并理解两种语言的,因为听力理解使用的是同一部位的大脑。受过多年训练的同传,也只是听一种语言,说另一种语言,同一时间使用不同大脑部位。

在笔者多次实战之后,认为最好的监听方法是边听原语(例如英语)的输入,边用视觉进行目标语(中文字幕)的质量监控,同时利用听觉和视觉的信息输入,这样能有效避免大脑中形成干扰。同时,监视字幕并实时和英文比对,能有效判断是同传口误或365bet现金开户_365bet真人体育_365bet手机娱乐城笔误,能及时给予提醒,实时提高最终输出质量。

但这种方法还是有一点弊端,是等字幕上屏之后,已经直播给几百万观众而且不像微信能撤回,所以排除笔误的工作还是落到365bet现金开户_365bet真人体育_365bet手机娱乐城身上,需要具有丰富经验,能显着避免输入错误的365bet现金开户_365bet真人体育_365bet手机娱乐城专家,才能担任直播字幕的工作。导演能做的就是及时提醒365bet现金开户_365bet真人体育_365bet手机娱乐城,防止出现第二次笔误。并且在直播结束后,第一时间根据自己笔记记录排错,马上产出正确文本的字幕轴文件供录播同事压制视频。

字幕365bet现金开户_365bet真人体育_365bet手机娱乐城

速录已经是一个有较久历史的职业,也称为计算机365bet现金开户_365bet真人体育_365bet手机娱乐城,广泛应用于政府、企业会议;各类座谈会、听证会、新闻发布会;各类讲座、论坛、峰会;电视字幕;网站直播、庭审记录、录音(像)文字整理以及大量文字录入等。


但是,能结合字幕直播的365bet现金开户_365bet真人体育_365bet手机娱乐城人员需要在原有市场普通365bet现金开户_365bet真人体育_365bet手机娱乐城技能的基础,还要再上一个台阶,适应直播的要求。其关键在于精准度,避免来回修改,中英文理解力,当然还有对各行各业的身后积累所形成的理解,需要应用自己的知识储备帮助观众理解会议或者活动的内容。

市场上合格的中文365bet现金开户_365bet真人体育_365bet手机娱乐城大师也非常稀缺,而且英文能达到听说无障碍,举例而言,实时听认出苹果中英专业术语的365bet现金开户_365bet真人体育_365bet手机娱乐城老师全国加起来不超过五个,所以字幕365bet现金开户_365bet真人体育_365bet手机娱乐城当前仍是典型的高精尖行业。
   
同传
同传也是一个有一定历史的职业了,典型的金领行业,网上文章很多,这里就不展开了。

2)AI语音识别(ASR)+机器翻译(MT)
大家接触过人工智能的应用场景。只要部署了语音识别加机器翻译,基本上就能有字幕上屏,其中技术的难度可想而知,需要突破收音、降噪、稀缺术语翻译、断句等等难关,在此不详细展开。
该方案的效果(以搜狗为例):

这种方式优势是信息能不断生成,保证用户获得有持续的信息流。而且假设能提前有足够多的特定领域数据训练,是能在专业术语上实现一定的准确度。缺点是在但由于AI要兼顾前后文本分析,需要一行到两行的显示距离,来避免由于断句太碎导致语音识别或机器翻译当中的一些硬伤太突出,所以显示效果上字体较小,看久了会容易疲劳,影响对内容的理解。

注:图片来自http://live.pconline.com.cn/1813.html
然而,如果选择数据或技术基础较弱的AI团队,就会出现以下的惨烈撞车事故,
例如:


图片来自:苹果新品发布会直播| 人工智能同传离我们还有多远?

因此即使是想使用这一种方案,在活动开始之前也要先测试效果,因为不同AI团队在算法、专业领域预料、数据处理流程等都有差异,因此在具体垂直行业的字幕同传表现会有较大差异。

3)1)和2)的混合,例如AI语音识别+机器翻译+人类365bet现金开户_365bet真人体育_365bet手机娱乐城,或者人类同传+AI语音识别,等等。优势和劣势都会兼有,需要就具体的场合来判断是否可以使用,投入产出比是否合理。

但无论是选用以上哪种方案,垂直行业的专有名词和稀缺词是最难处理的难题,要实时处理更是困难。永远有未准备到的词汇,永远有机器训练时没有的语料,因为人类语言就是这么进化的,所以如何处理新词、专有名词、稀缺词,是摆在所有语言工作者和人工智能科研人员面前的难题。我们能做的,就是积极勤勉地去积累数据,学习理解,这一点适用于所有语言行业工作者以及AI行业工作者,与大家共勉。
如果喜欢本文,请转发让更多人了解字幕直播背后的奥秘!

本次苹果发布会的官方直播合作伙伴爱奇艺与Translavie共同联手,使用Translavie的LiveSteno?技术进行发布会中文字幕直播。同时聘请专业的同传及
365bet现金开户_365bet真人体育_365bet手机娱乐城人员来负责实时字幕制作,才能实现较为流畅和高质量的观影效果。LiveSteno?技术已经过两年研发时间,支持多语种现场或直播内容的字幕生成,与各大会议及专业演播室设备完美兼容。

最新LiveStenov3.0升级版,让观看体验再次提升,可定制字体显示效果定制化、逐句替换显示,实现贴近电影级别的观影体验。Translavie可根据广大客户的具体需求,定制各类字幕解决方案。
  
笔者原任为上海广播电视台(SMG)外语频道(ICS)新闻制片人助理,现就职于Translavie,曾多次担任苹果等高端品牌直播活动的字幕导演 。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表