奥飞寺的明民鱼羊
量子比特 |公众号
就在今天,快手正式公布了自研芯片的进展:
云智能视频处理SoC芯片已成功流片,正在进行在线内测。
△快手高级副总裁兼业务经理于兵介绍快手自研芯片
关键是,这波造芯成果,不止一个大动作。
更准确地说,快手这是直接在商业上完全不同的尝试:
快手在ToC产品上耕耘11年,现在正式推出视频云服务,宣布进军云服务市场。
快手ToB 第一枪:
为了澄清这一点,我们先来看看快手这是怎么一回事。
可以说是一个覆盖底层基础设施到上层场景解决方案的“视频操作系统”。
它的能力主要体现在Video和AI上。
其中,Video专注于视频制作、传输、分发等全链路视频能力。
AI专注于智能视频创作、智能视频内容理解、数字人等技术领域。
和很多云服务商一样,快手视频云服务的雏形,首先是在自己的业务中诞生的。
对于快手来说,从2015年的千万日活跃用户到2022年第一季度的近3.5亿,是内部业务爆发式增长的时期。
因此快手的技术台湾化进程也很早就开始了。
所谓众泰化,简单来说就是在不同业务之间构建共享的基础设施、底层算法和应用服务。
当这些通用技术不断迭代升级,通用基础设施不断积累和扩展,逐渐打磨到更高的应用效率,其实已经形成了“云产品”的雏形。
有了这样的技术基础,接下来的两个合作案例,进一步催化了快手的ToB业务。
第一个合作案例来自学术界。疫情期间,高校对在线教学平台的需求爆发,与快手关系深厚的清华大学也被纳入其中。
量子比特获悉,疫情伊始,清华大学邀请快手与其在线教育平台“学堂行”合作,满足师生在线教学需求。
这可以说是快手直播技术能力的第一次完整输出,效果相当显着:
直播技术团队研发的实时音视频通讯系统和智能调度系统,让师生在同等网络条件下观看直播更流畅。这些技术的应用为清华大学打造了更好的在线课程。经验。
第二个合作案例是知乎。
2020年知乎开始加速媒体升级,加强社区图文视频的融合。
据合作项目负责人介绍,当时知乎处于媒体升级初期,担心平台用户对视频质量和体验有更高的要求。
在寻求外部合作伙伴的过程中,基于对快手音视频技术的了解和认可,知乎主动联系了快手的相关技术部门。经过几轮技术讨论,双方最终决定就视频架构升级和体验优化进行深入合作:
快手已经输出了一套完整的按需云解决方案。通过媒体处理服务,整合CDN、播放器等产品,结合热触发、多码率适配等策略,逐步帮助知乎解决问题。用户体验提升、云服务成本优化等需求。此外,快手还针对知乎在媒体升级不同阶段的痛点提供专业的技术咨询服务。
更笼统地说快手企业号,快手这套拳法可以在保证视频质量的基础上,让视频播放更流畅,视频文件更小,存储成本更低。
通过这两个案例的打磨,一方面,快手对外提供服务的产品能力、工具和体系更加完善。
一个更重要的方面是,一种全新的商业模式正在逐步被验证。
快手高级副总裁兼负责人于兵透露,虽然市场上视频云产品众多,但在传统模式下,行业始终存在根本性矛盾:
客户的视频码率越高,带宽使用量越大,云服务商的收入也越高。
如果视频压缩技术升级,客户将受益:一方面C端用户体验更流畅,另一方面带宽成本大幅降低。但是,公司的收入会受到很大影响。
因此,视频云供应商缺乏为客户提供更先进的视频压缩和传输技术的动力。
但是对于快手这个国内顶级视频平台之一来说,追求用户体验提升和带宽成本优化是一件很赚钱的事情,所以自然有很强烈的做波兰视频的动力压缩技术。
其实,为此快手引进了一大批业内顶尖人才,并在实践中掌握了业界领先的视频压缩技术。
例如,在新一代视频压缩国际标准H.266/VVC的制定中,已经采用了快手数十项技术方案。
△快手CTO陈丁佳表示,技术toB是快手长期坚定的方向
在与知乎探索双赢合作模式后,快手开始加快核心技术能力的开放,希望将新的商业模式推广到全行业。
于是,它就应运而生了。
我能做什么?
说了这么多,有什么区别呢?
如前所述,主要提供全链路视频能力和覆盖整个视频创作流程的AI能力。
这些技术能力的核心价值被快手总结为4个E,即创新()、经验()、灵活性()、经济成本()。
第一个E是(),意在帮助企业从0到1快速构建视频服务,或快速实现业务创新。
从以上架构可以看出-视频的点播云、直播云、媒体处理、音视频SDK、移动组件库等产品可以构建完整的“端云一体化”解决方案,一站式这使行业客户能够快速构建视频服务。
第二个 E 是 ()。
在这方面,快手叠加了超分辨率、视频插帧、SDR转HDR、3D环绕声、去噪、去模糊等一系列智能算法,可以结合视频的特点实现视觉和听觉的全方位恢复增强。
还可以实现毛孔级4/8K观感、60/120帧、全景声立体音效、高动态对比度、广色域等效果。
具体数字指标方面,硬解码覆盖率95%以上,首屏时间控制在200ms,带宽利用率90%以上。
值得一提的是,通常只有行业头部平台才能实现“零屏”体验,快手也将此类能力开放给行业用户。
第三个E是(),其实就是弹性刻度。
这已经为 快手 验证了多次。
比如快手曾经赞助春晚抢红包。数亿人同时观看同一个视频,还要完成抢红包的动作,同时在线人数高达2250万。
这是非常占用带宽的。
据于冰介绍,快手的带宽达到了100T级别,存储容量达到了EB级别。每天处理的视频数达到千万级,视频播放量达到百亿级。
因此,弹性尺度是快手的“先天”能力,将成为优势。
第四个E是经济成本,成本最优()。
上云是大势所趋,但成本也要考虑。
海量优质视频的传输和分发会消耗大量的带宽和存储,需要大量的资金投入。
为此,已开发出多项自主研发技术,进一步降低成本。
例如在同等画质下,与开源的X265方案相比,自研的H.265可以实现30%-40%的压缩率提升,KVC可以实现50%-60压缩率增加 %。
通过CDN+PCDN方案,在多云融合架构上,在各项体验指标持平的情况下,带宽成本可降低30%以上。
另外,正如开头所说,快手为了进一步提高视频压缩率,甚至还开发了自己的芯片。
于冰透露,为此,快手还邀请了视频硬件领域的顶级算法专家组成研发团队。
以上4个E的价值也体现在AI技术能力模块中。
开启
快手,每天都有大量的视频内容被创作出来,每个视频都需要在平台上经历内容创作、理解、分发三个阶段,帮助创作者更便捷、更便捷地创作视频内容聪明地。 ,而在海量视频内容的结构化管理中,AI发挥着不可替代的作用。
快手在提高视频创作效率、构建视频内容结构体系、赋能业务和收益等方面提供丰富的产品和服务。
快手的AI美颜功能、海量魔法手表特效、一键智能视频创作功能是最知名的能力,也可以帮助行业在视频制作过程中提升视频质量转型升级 生产效益和效益。
通过新发布的“将文本复制到视频”功能,用户只需提供一段文本内容,即可实现从纯文本内容到视频内容的自动智能创作。该功能的背后是亿级优质版权素材和一整套AI智能创作技术,包括跨模态图文匹配、全局一致性建模、智能配音、配音等技术。
快手技术副总裁,快手AI技术与主站技术负责人王中元希望通过技术迭代,弥合视频创作与文字创作的鸿沟,减少对普通用户的需求到视频创作的门槛,帮助更多的用户更好更快地制作视频。
△快手技术副总裁兼AI技术负责人兼主站王中元介绍快手的视频AI能力
快手也是基于亿级视频作为训练样本,百亿级多模态内容理解大模型Pluto(Large-scale for video),简称快手K7大模型。这个大模型可以智能地将数百亿视频压缩成一个数百维的向量表示()隐空间,并且可以进行高效的视频相似度计算,从而赋能上百种业务场景。
在显式类别标注系统上,快手构建了百万级标注系统。同时,通过跨模态兴趣标签和智能检索,可以实现更多子类内容覆盖。实现标签系统、媒体资产管理、推荐系统的协同。
除了底层技术的积累,在应用和服务层面,还推出了一项特殊业务——数字虚拟人。
根据应用场景可分为3类:
在这方面,快手之前也尝试过很多东西。
比如几年前,A站的虚拟人体动作捕捉技术就是由快手提供的。
最高人民检察院今年推出的虚拟检察官也是由快手联合出品。视频中,虚拟人完成了最高人民检察院2022年工作报告的解读,历时约5分钟。
王中元介绍,此次针对行业合作伙伴,快手正式发布了三类视频AI解决方案:智能视频创作、智能视频理解、数字人、XR。 ,加速行业视频数字化转型。
快手ToB,为什么是现在?
用 Bing 的话来说,“快手准备好了,这是做 To B 业务的前提。”
更重要的是,视频行业正处于增长窗口期,正在迎来新一轮的技术创新。
所以快手此时进入ToB,从外到内快手企业号,大致可以归结为三个原因。
首先,视频数字化已成为行业大趋势。
在王忠元看来,视频和直播已经逐渐成为行业基础设施的普遍存在。
就像对电力的需求一样,各行业越来越依赖基于视频的表达方式。
于冰还提到,随着5G技术的发展,用户的手机屏幕和电视屏幕越来越大。在这种趋势下,对于用户来说,4K甚至8K视频将逐渐走向常态化。
但对于视频行业的玩家来说,这样的技术升级背后,意味着视频码率(单位时间的视频数据量)将提升5-10倍,相应的成本也会很高。不难想象。
在这种情况下,借助视频云服务控制成本的需求也会增加。
根据IDC发布的《中国视频云市场追踪(H2 2021)》报告,2021年下半年中国视频云市场规模将达到50.4亿美元,一年同比增长32.7%,预计2026年市场规模将达到364亿美元。
但对于企业本身来说,从0开始搭建视频系统的难度不容小觑。
别说技术建设的难度,单从需要投入的人力、时间和金钱上来说,就足以让人望而却步了。
而这些能力正是快手已经具备的,并且已经转化到台湾,可以扩展到更多的行业。
这也体现了快手进入ToB的第二个原因——自身技术有信心对外开放。
截至今年,快手技术已经积累了11年,经过了长时间的海量数据检验。
据了解,目前快手平台每天承载3.46亿日活跃用户,每天上传视频数千万。
在视频聚合和分发的背后,有超过 3000 种 AI 服务,每天有超过 4500 亿次调用。
这背后当然离不开技术研发上的投入和布局。
2021年,快手研发投入将达到150亿元。
技术团队还多次在国际顶级会议和比赛中获奖。例如,在2021年的视频语音增强比赛中,快手获得了两个一等奖。
这个平台自下而上也实现了99%的自研自建。
如前所述,快手 也开始意识到技术的“普遍性”。
所以这几年,他们开始尝试和一些公司合作,验证ToB的可能性。
经过知乎、多多视频等多家标杆客户的验证,快手最终确定自己的技术可以帮助不同的行业,因此推出。
其实这个动作与其“专注、专业、极致、可靠”的技术理念不谋而合。
这就引出了快手进入ToB的第三层动力。
包容性平等是快手在ToC方面一直坚持的东西。
王中元表示,快手的技术现在可以适配10万种手机型号。高端旗舰和普通机型的用户都能感受到AI的力量。
现在的推出就是将这个想法延伸到ToB端的体现。
快手提出互联网视频“重工业”要向“轻工业”转型。
即进一步降低行业的技术门槛和成本门槛。
让互联网和传统行业快速接入视频和AI技术,缩短视频数字化转型周期,降低成本。
同时,快手还提供一组专家顾问。
即使行业客户没有自己的视频团队,他们也可以帮助他们构建视频任务。
对于已经自建音视频团队的客户,快手表示将遵循开放共享的原则,进行更深入的探讨与合作,包括代码级和文档级的技术共享.
总而言之,让快手的技术从内部流向各个行业,是品牌理念,也是它名字的来源——
核心能力如涓涓细流,下游场景如大河。集技术汇聚与分布于一体,故称“流湖”。
“慢棋”并不慢
此时宣布进军视频云赛道,快手面临诸多质疑。
最大的质疑声是快手这招是不是慢了。
但如前所述,这个“慢动作”其实是在一个很好的时间窗口上:
一方面,视频云领域竞争激烈,但客户需求仍未得到很好的满足。
另一方面,4K/8K技术变革给视频行业带来了新的挑战和增长机遇。
而快手宣布进入ToB赛道,既有芯片也有数字人,但更深刻的价值可能只是冰山一角。
为什么这么说?
对内,正如快手的技术负责人所说,迈出To B的步伐,意味着快手的技术未来可以在外部得到进一步验证,这将给技术人员带来很大的好处更直接的市场反馈有利于促进创新。
对于外界来说,对于这样一个不断扩大的市场,降低技术门槛已经成为一种普遍的期待。
进入
快手不仅为市场带来了一整套成熟且经过市场验证的技术解决方案,也带来了全新的商业可能性。
这样,市场的选择更加多元化,行业降本增效将更加“滚动”,更加有趣。
当视频时代的互联网正在成为一个“重工业”时,客户迫切需要降低视频的投资成本,或者以更低的投资支持更好的体验,而这正是可以利用的机会。
——结束——
量子比特·今日头条签约
站内部分内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任如发现本站有涉嫌抄袭侵权/违法违规的内容。请联系我们,一经核实立即删除。并对发布账号进行永久封禁处理.
本文网址:/show-14-1398.html
复制