对于像脸书这样的科技巨头来说,人工智能已经变得司空见惯。每次上传照片时,网站都会使用它来自动识别用户的脸孔。脸书的面部识别程序(称为DeepFace)令人不安,其准确性要比FBI的准确得多。为什么?由于脸书庞大的照片数据库每天都在增长,因此,AI算法得到了不断改善。
AI可以彻底改变实时流媒体表现在哪几个方面呢?
流媒体现在占所有计算数据的很大一部分,到2022年,视频预测将占所有互联网流量的82%。利用AI寻找更有效的方式来编码,分发和组织数据进行简化数字分析。从规范非法内容到防止版权侵权,人工智能有望在流媒体行业中发挥关键作用。
人工智能与机器学习与深度学习
虽然有时可以互换使用,但是机器学习和人工智能指的是细微差别的概念。广义上的“人工智能”是指机器以公认的智能方式执行任务。执行通常需要人类工作的任何能力-感知,推理,行动和适应-都属于人工智能领域。
机器学习将这一步骤进一步向前发展,指的是通过暴露于数据而自动获取知识的机器。依赖模式而不是显式指令的计算称为机器学习。机器学习允许计算机定义自己的规则,而不是依赖于预先编程的规则。
最后,我们进行深度学习。这就是人工神经网络发挥作用的地方。这些网络以人脑为模型,由数千个相互连接的节点(神经元)组成,这些节点旨在处理和传输整个网络中的信息。之所以将它们描述为很深,是因为它们是由多个堆叠的层组成的,允许进行计算密集型功能,例如图像识别,声音识别和自然语言处理。
为什么视频直播需要人工智能(AI)
由于AI包含许多复杂的学习过程,因此它的功能是巨大的。行业领导者开始利用它来解决实时视频流媒体传输中出现的一些问题。
借助当今的实时流技术,几乎任何人都可以发布或观看实时视频。如果他们有录音设备(例如智能手机或笔记本电脑)并且可以连接到互联网,则直播视频流需要几秒钟。
AI物体检测作为视频内容的审查方法
虽然常用于娱乐,但对象检测具有实际优势。人工智能将通过这种技术支持的审查形式,为内容监管铺平道路,这有望取代人工监控。
过去,由于检查该内容的基础设施不完善,违规视频流变得非常流行。具体来说,脸书依靠一组审核员来中断任何违反其社区标准的直播。通过机器学习和深度学习,脸书和Google等组织将能够更快,更智能,更有效地采取行动。我们可以期望AI解释流内容并自动提取元数据。从那里,他们将能够更有效地监视有害内容并保护受害者的隐私。
人工智能有望使我们的数字世界更加安全,但这还不是全部。
借助AI内容索引以改善用户体验
人们制作的视频比以往任何时候都多,因此需要实时编录流。诸如TikTok之类的流行社交媒体应用正在利用AI来实现这一目标,并通过内容个性化来增强这一点。该应用程序的母公司字节跳动的一位代表阐明了这一点:
“我们构建的智能机器能够使用自然语言处理和计算机视觉技术来理解和分析文本,图像和视频。这使我们能够为用户提供他们认为最有趣的内容,并使创作者能够与全球观众分享日常生活中重要的时刻。”字节跳动被评为全球最有价值的创业公司,表明他们必须做正确的事。
AI工具也被应用于音乐流,以改善个性化。现在,算法可以采用歌曲的音高,节奏,和弦进行和人声风格以及用户的历史来建议类似的内容。
人工智能防止版权侵权
处理实时内容时,版权保护变得棘手。不管是防止体育赛事或流行歌曲的版权受到侵犯,监管机构都在寻求AI技术。 与AI可以改善内容索引和标记非法内容的方法类似,基于学习的视频工具将越来越多地用于分析实况视频以获取受版权保护的材料。
也就是说,人工智能可以实现这一目标的程度仍然很模糊。 就音乐行业中的版权侵权而言,这种AI的应用引出了一个问题:如何界定抄袭呢?
内容感知编码
像Netflix这样的视频流巨人使用AI根据复杂性为每个视频确定适当的编码设置。这有助于优化资源和视频质量。这很简单。尽可能对低比特率的流进行编码有助于最大程度地降低成本并节省带宽,而体育赛事和动感十足的镜头需要较高的比特率才能适应运动的节奏。
Netflix依靠机器学习通过使用视频多方法评估融合或VMAF为每种类型的视频量身定制编码。同样,油管使用神经网络来改善编码过程。
结语
我们刚刚开始尝试如何将人工智能应用于实时流媒体。当前你从事的任何工作都将在某天落入AI的范畴。编剧,剪辑,字幕等等。因此,我们最好的方法就是利用它。
也有可能涉及的风险。一个例子就是Google的对象识别工具将黑人的照片错误地归类为大猩猩的时间。为了防止将来发生此类进攻性错误,IBM发布了“去偏见工具包”,该工具包使公司可以扫描自己的AI系统以识别歧视性行为并进行适当调整。由于AI是人类的发明,因此可以将人类的偏见内置到系统中。
这些问题都需要解决。但是,随着实时流媒体的普及,我们需要同样强大的计算能力来对其进行编码,索引和审查。总的来说,行业需要人工智能。