当前位置:首页 > 百科知识 > 正文

阿里云视频云行业,阿里云网络产品视频

阿里视频行业,阿里云网络产品视频9月18日,在“云起大会”上,阿里云视频发布了视频云“直播3.0”产品,帮助各行业实现了第二条增长曲线。

基于云计算的成熟发展,视频云的概念正在不断探索音视频技术的边界,整合更多典型的空间场景。目前成熟可见的产品主要有视频直播、视频点播、音视频通信RTC、智能媒体制作处理等等。

云技术的核心与极致——超低延迟、超高清、低成本

除了直播,视频内容正在全面爆发,视频制作也越来越普及。数据显示,2020年,中国人每天经常观看的网络视频长达250分钟。在过去的三年里,全球每月视频流量增加了两倍。这些视频分布在短视频、点播视频、直播等领域。视频云技术的关键任务就是将互联网上的这些海量视频升级为高质量的视频,并在这个过程中追求极致的成本。要实现这一目标,需要解决三个问题:一是如何处理低质量的视频源;第二,互联网视频是把视频的制作成本转移到云端,所以制作成本极高,需要普惠来降低成本;第三,电视广播一般带宽都很高,往往在百兆量级,但很多用户还是在网络弱、带宽低的情况下接入网络。对此,可以利用视频云技术,通过窄带高清编码来解决上述问题,从而实现高清、低成本、低带宽,最终普及影院级的视频服务。简单来说,“窄带高清”就是用户上传的视频经过视频云的处理和转码后会变得更加清晰,同时占用的带宽更少。对此,阿里云研发;d团队重新定义了所谓的“视频质量提升”,基于用户的主观质量并进行建模,通过成千上万的大数据分析,针对不同的视频达到最佳效果。据了解,其最新的窄带高清版,最大的亮点是成本比原来降低了一个数量级,从而实现了技术的大普及和大规模商用。

视频驱动的行业发展第二条增长曲线

新的数字基础设施帮助在线教育“战争流行病”

疫情期间,全民教育从线下变成了线上。得益于新型数字视频基础设施的不断建设,视频云的网络和媒体处理产品正在全面帮助学校“停课不停学”。针对在线教育领域,视频云拥有一站式教育解决方案,同时将服务能力拓展到更广阔的教育场景。

以薛鑫为例。com为例。疫情期间,恰逢我国研究生复试。数据显示,2020年,研究生招生人数达到341万人。远程视频面试作为其新的交互形式,通过多摄像头视频交互和技术验证认证,可以保证面试过程的科学、有效、公平、公正。据技术总监程介绍,今年承担了基于阿里云的远程面试重任。短期内,在Xuexin.com硬件条件有限的情况下,视频云团队将云服务整合到学信网的业务系统中,充分结合其业务特点和业务流程,帮助Xuexin.com大幅提升系统的承载能力和稳定性。面试时,高峰时有3199个考场,9758个视频,整个系统运行流畅。与往年相比,通过视频面试系统的使用,复试调剂效率明显提高,整个工作周期明显缩短。

目前,传统媒体已经进入深度融合阶段,如何利用视频AI的能力进行赋能是一个重要的问题。人民日报传媒科技有限公司的杨海霞介绍,传统媒体的核心链条包括视频拍摄、制作、媒体管理和发行。面对大量的视频内容制作、审核和分发,提高效率是核心问题,而视频AI恰恰起到了关键作用。

对于媒体内容的制作,体现在智能转码、智能作曲、智能配音三个场景。首先,针对大量外部视频素材的转码需求,人民日报利用视频云的窄带高清技术,直接与自身业务系统集成,完成转码智能动作。在此过程中,对图像质量差的图像进行技术处理,以提高整个视频的质量。其次,是对制作高质量视频的大量素材进行AI智能合成,包括内容的智能提取、转场效果、背景音乐等。按照一定的模板,并批量生产输出视频,比如很多时事热点和数据新闻。第三,AI智能配音,即AI可以通过声纹采集和文语转换,系统化、智能化地完成内容的自动配音和合成,从而大大提高媒体内容的制作效率。

同时,在媒体管理和分发方面,人民日报与阿里云视频云团队合作,通过人脸数据库和物理数据库实现字符识别、物体识别、语音识别和OCR识别,从而生成智能标签,可用于高效的媒体检索,在分发端更好地进行智能推荐和相关推荐。另外,目前的党媒更好的应用UGC模式,涉及到为UGC生产提供智能支持,同时通过智能审核保证内容的安全性。这些智能技术已经在一些大型省级媒体融合云平台上得到广泛应用。从综合业务场景和链条来看,视频AI能力大大提升了传统媒体制作和分发的效率和质量。

直播系统助推电商出海。

毫无疑问,电商直播是今年的热门话题,它融合了视频直播和网络名人直播的优势,正处于蓬勃发展的过程中。全球速卖通(AE)是阿里巴巴为全球市场打造的跨境电子商务平台,被称为“国际版淘宝”,主要针对海外买家。其平台商家也希望更好地利用直播传播,在海外销售商品。但是AE的商家87%都是中国人,因为外语能力的原因无法参与直播。同时,AE的用户来自上百个国家,即使主播有外语能力,也无法覆盖每一个用户的语言。基于此,阿里巴巴达摩院和阿里云共同打造了全球首个电商直播翻译系统。这套系统依托视频云强大的视频直播和媒体处理服务能力,结合了指南站的ET字幕产品方案和视频翻译技术方案。最后搭建AE直播翻译系统,整体链路延迟小于1秒,让电商直播交流体验有了新的升级。

今年5月系统上线后,大量“不会外语”的淘宝商家涌入AE直播,免费使用中文直播卖货,并翻译成英文、俄文、西班牙文等。通过现场翻译系统。全世界的观众都可以实时看到带有当地语言字幕的直播。

频,还可与主播沟通互动,最终,带来的销售转化高于普通AE商家的20倍。未来在此系统基础上,会继续深度研发多语向互译,让商业没有语言障碍,让技术普惠能量升级,让天下没有难做的生意。

虚拟交互技术打造娱乐新价值

视频云对视频时代的加速推动,体现在新内容和新交互两个层面,而交互方式的探索在娱乐行业具有更大空间。疫情期,在线娱乐行业迎来爆棚式发展,也让行业借此更加审视在交互体验上的突破价值。优酷作为视频内容的重要阵地,结合视频云技术,开展了对互动视频体验的全新升级,集中体现在三个关键词:一是直播化,即基于DIBR重建技术,让用户在自由的视角进行任意的观看,实现自由视点互动直播化。二是游戏化,通过人脸识别、动捕系统等体感互动技术,赋能视频的游戏化体验,其中的技术已应用在优酷即将播出的动漫IP上,可实现用户和IP的互动,进而增加用户粘性。三是特效化,在综艺、体育领域与AR特效的融合,创造全新的交互体验,尤其当AR特效应用于体育赛事场景中,可以让观众实时了解当前赛事情况,在优酷2020年CBA直播中,其利用阿里视频云技术,打造比赛中的“子弹时间”特效,通过自动化、准实时的CBA云特效合成,让观众以自如的视角观看当前谁在投篮,显示命中率是多少,当前阵型如何等等,达到现场实时直播输出的效果。

所有以上的特效互动技术,都得益于目前CV和CG技术,两者结合助力于互动特效视频的自动化、批量化生产,相较于传统方案可以提速百倍。基于此,我们对未来的期待一定是虚拟世界、增强世界和物理世界三元合一的状态。

2020年视频行业的爆发,加速了视频云的应用和对多场景互动形态的探索,视频云技术也致力于不断创新内容和交互方式的改变,“未来,随着人工智能、5G、AR、VR技术的加速创新、视频与云计算的高效融合、以及视频云技术本身的不断演进,一定会有越来越多的行业和场景,基于视频进入新内容、新交互的时代,创造新的业务价值,引领行业的第二增长曲线。”阿里云林昊的这句话,充分展现视频云技术在未来的发展。张铭阳