多客科技 发表于 2026-1-27 16:48

Netflix人工智能应用与规范(上)

作者:微信文章


生成式AI从实验室走向影视制作链,全球内容产业的“创作逻辑”正在被改写。Netflix正通过一系列试点项目,将AI嵌入剧集、动画、纪录片乃至广告变现的全链条,从降本增效到内容革新,加速重塑行业逻辑。

精准推荐:有效减少用户流失,向内容生产环节拓展

内容精准推荐是Netflix人工智能最重要的应用场景之一。截至2025年第二季度,Netflix的全球用户超过3亿,提供与用户相关或用户感兴趣的内容对于留住用户或最大限度减少用户流失来说至关重要。Netflix已建立了高度智能化的内容推荐系统,并实现对平台80%以上的视频内容的推荐。Netflix人工智能推进系统通过对用户行为的精准分析,实现对平台内容的精准推荐乃至精准定制。



图1 Netflix全球订阅者数量增长(百万)

Netflix平台数据显示,用户在选择内容时,往往只浏览一两个页面,扫过10到20部节目选项,仔细查看2-3部节目内容介绍,整个过程60-90秒,若未能在此期间发现感兴趣的内容,就可能面临用户流失风险。Netflix推荐系统核心任务就是确保在极短的时间内让用户发现他们想看的节目内容。Netflix的推荐系统不是简单使用用户评分,而是构建了一套能够动态平衡多方面因素的排序模型(见图2),准确性更高、性能更好(见图3)。凭借先进的推荐系统,Netflix将用户流失率降至约2.3%,每年节省超10亿美元。



图2 Netflix AI的推荐机制 图片来源: AI Profit Pulse



图3 综合热度以及评分之后算法推荐系统的表现

随着生成式AI的发展,Netflix探索研发更强大的推荐系统并决定创建一个可用于全平台的“超级大脑”:可以预测用户喜好、可以生成代表用户和节目特征的“数字指纹”供平台其他环节使用、可以分享给节目创作团队用于特定场景的内容创作,推动更多环节“智能化”。

译制配音:采取AI生成+人工复审方式,并向无障碍视听服务拓展

作为一家全球性流媒体平台,Netflix人工智能重要应用场景之一就是字幕译制和配音。Netflix研发推出了DeepSpeak项目,利用AI合成与原始演员表演高度匹配的语音,通过分析唇部动作、音调和节奏来生成同步的配音音频,实现不同语言间的无缝配音。在Netflix平台,用户选择AI配音服务时,完播率提高了15%。在DeepSpeak应用推出6个月后,Netflix已提供超过40种语言的译制配音服务。

在字幕领域,AI早已实现自动转录和翻译,Netflix研发的VideoLingo工具可生成高质量字幕和配音,提高了全球用户对Netflix节目内容的传播力和传播效果。目前,Netflix平台AI字幕支持33种语言,AI配音支持36种语言。在大规模应用人工智能翻译和配音的同时,Netflix保留了人工审核,专业语言学家和编辑对AI生成的字幕及配音进行复核,确保保留原作神韵以及文化适应性。

Netflix还将人工智能译制应用延伸到无障碍服务,为盲人提供通过AI生成的音频解读服务。2023年上线的限定剧《所有我们看不见的光》,为盲人用户提供了最为详细的音频解读服务,这些解读音频均由Netflix平台自有AI工具生成。该AI工具可自动分析角色、动作场景等画面元素,并生成介绍性音频,再由人工编辑润色完善。AI生成的介绍性音频还可根据情境调整,提供比人工制作更丰富的细节。这一AI工具使Netflix高效制作出多语言解读音频,有效提升了内容服务的包容性,还与行业利用AI拓展手语无障碍服务相契合。截至2023年底,Netflix所有原创节目和电影均提供音频解读服务,支持语言超过50种。Netflix正在持续扩展无障碍服务的语言种类,新增语言包括西班牙语、葡萄牙语、印地语和法语。美国盲人理事会2023年数据显示,互联网上提供音频描述的视频内容中,11%面向幼儿,19%面向13岁以下的大龄儿童,20%面向青少年,50%面向成人,大多数节目内容(当时为540部)为纪录片,其次是儿童与家庭内容、剧情片和喜剧片。报告称,Netflix平均每月新增24部带有音频描述的节目。

内容制作:是最具挑战的应用场景,正向场景性内容生成环节拓展

在宣发素材设计与优化环节,Netflix人工智能应用的重要目标是向创意策略师和设计师提供数据驱动的工具与洞察,协助他们制作更具吸引力、更贴合用户兴趣且能真实反映节目内容的宣发素材,帮助用户发现他们心仪的内容。如,使用人工智能工具分析不同偏好群体对海报中有关元素的反应,捕捉吸引用户的关键元素,通过智能静态帧提取技术从视频中提取高质量静态画面,帮助设计师快速获取节目关键视频瞬间,从而生成更具传播效果的海报或宣发视频。

在视频搜索与剪辑环节,Netflix通过人工智能自动快速地从海量镜头中筛选出构图或动作相似的镜头画面,以实现场景流畅转换。目前,Netflix人工智能工具可实现数百万镜头的秒级检索,未来可实现基于更复杂的动作匹配以及结合颜色、光线和声音的匹配的快速检索。

在内容创作核心环节,Netflix旗下虚拟制作和视觉特效部门Eyeline探索使用市场上商业化人工智能工具,人工智能工具已参与《Wednesday2》《Stranger Things》《Avatar: The Last Airbender》等多部原创作品的创作。随着生成式AI的发展,Eyeline通过对现有AI模型进行针对性改造和优化,将AI工具直接应用于节目制作。其中CineScale技术可突破现有AI模型极限,直接生成远超其训练时所见分辨率的高清图像和视频,可直接生成8K图片,或通过极少量调整就可输出4K视频;Netflix巧妙地改造现成AI画画模型Stable Diffusion,推出DifFRelight视频人脸重打光技术,让人脸打光变得灵活高效:该AI工具不仅可调灯光方向,还能调节灯光明暗强弱,从聚光灯到柔光甚至可合并多盏灯光的效果,模拟真实光效,可逼真完美呈现眼睛里的反光、皮肤的透光感、皮肤纹理、发丝等细节;Go-with-the-flow技术甚至可以精确控制AI生成视频里物体的运动。

Netflix生成式AI在内容生产中的标志性突破是2025年4月30日上线的西语剧集《El Eternauta》。该剧是Netflix首次在电视节目制作中公开使用生成式人工智能生成视频片段的头部剧集。该剧讲述了一场毁灭性雪灾中幸存者的故事,制作人原计划使用视觉特效来呈现一栋建筑倒塌的场景,但该项目预算已被用于其他地方,而完成该剧制作的时间只剩下10天,如果使用传统视觉特效技术,成本可能会高出10倍而且时间不够。为此,他们使用了市场上成熟生产式AI工具,通过输入文本提示词,由AI直接生成视频特效并插入实拍镜头。Netflix联合首席执行官Ted Sarandos介绍,剧中AI特效制作速度不仅比传统VFX方法快十倍,而且让大规模特效在有限预算下变得可行。

《El Eternauta》的推出标志着Netflix平台在内容创作逻辑上使用AI技术发生了结构性变革——从成本控制迈入技术驱动新阶段,并进一步挑战影视行业的传统商业模式、人才结构乃至版权秩序。

(作者系《传媒1号》研究员苏辰、顾欣宇)

—END—

监      制:史   杰

轮值主编:彭   锦

责任编辑:沈雅婷

后期编辑:郭   钰

页: [1]
查看完整版本: Netflix人工智能应用与规范(上)