视频后台专题算法与后台的完美结合——视频内容理解数据流码流

编辑导语:视频行业的发展从曾经的专业剧组制作内容,到如今人人都可以进行内容创作,大家想要表达的内容也通过视频的形式呈现了出来。正是因为如此,视频的供给量出现了指数级的增长曲线。因此,算法与后台的完美结合是当下可以改进的一大方向,内容理解也相应成了辅助视频质量评判的重要引擎。本文对该引擎进行了总结,并与你分享。

视频行业从曾经基本以专业剧组制作内容为主到现在个人博主+小型工作室+专业剧组的多元内容制作,现在越来越多人开始尝试通过以视频的形式承载自己想要表达的内容。

这样的环境下,视频生产者逐月递增,伴随着视频生产者人数的增多,视频的供给量便出现了指数级的增长曲线。在庞大有复杂的视频内容的海洋中,筛选出来优质视频,淘汰劣质视频在当下仅通过人工的方式已经无法覆盖行业的素材,因此内容理解便成为了辅助业务对视频进行优劣鉴定的重要引擎。

一、什么是视频内容理解

视频内容理解,主要是针对视频进行从码流质量到内容表现及含义的分析。视频行业中,会针对于视频内容生产源对视频内容进行区分,主要是分为PPC(专业版权采购或自制内容)、PGC(专业分账内容)、UGC(用户原创内容)这三类视频内容。

内容理解的目的是通过AI的方式将视频内容(包括视频、音频、字幕)和视频互动互动内容(评论、收藏、点赞、评分、弹幕、屏蔽、不推荐等)等多维度内容进行表征和语意的详细分析,并将分析的结果推动给前端如推荐、搜索等业务。

1. 行业发展

内容行业发展至今主要存在三个时代:

门户时代搜索/社交时代智能时代

(1)门户时代

1995~2002年主要是门户网站主导下的互联网内容服务,国内代表公司是四大门户网站,新浪、网易、搜狐、腾讯。在互联网的初期,由于用户的消费信息数量基本只能从纸媒和电视中获得,又由于纸媒版面限制和电视广告的按时间线型排布的特点,导致报纸+电视+广播这三种传统方式内容数据较少且不具备长时间储存的特性。

因此在那个时代用户亟需一个内容聚合平台,因此门户网站变成为了人们够快速的寻找信息的基础设施。门户网站主要运营的方式是通过人工对内容进行整理,然后以频道页形式满足用户需求。

前期主要是以人工对信息的判断进行运营,伴随着数据量级的的增多,仅依靠人工运营的方式会出现成本急剧攀升,人员没有更多精力处理海量内容,因此各大企业纷纷引入自动化内容分类等技术,此后,内容分类技术伴随着数据增多而发展迅速。

(2)搜索/社交时代

2003年~至今,国内及海外互联网都在搜索社交的时代中。主要代表公司:腾讯、Google、Facebook、百度、爱奇艺(爱奇艺做了能力最强的全站视频搜索引擎)。

随着家用电脑及智能手机的不断普及,内容数量和类型不断丰富,门户网站已经很难承担多类型海量内容的分发任务,用户面对爆炸内容时,传统门户网站对于用户选择呈现了低效的现象。

于是,一种新的信息分发技术诞生——搜索。搜索主要解决的问题是根据用户搜索的内容找到相关内容,并根据将内容有序的呈现在用户面前。搜索初期关键词技术很好的解决了这个需求,于是也成为那个时期的研究热点。

但是关键词技术同样存在实体歧义的局限性,比如搜索亚瑟王,关键词很难区分出来是亚瑟玩传奇的亚瑟王,还是Type-moon的Saber。在2012年 Google 提出知识图谱概念,主要就是用于解决上述的实体歧义问题,实体链指的问题也有了比较大的进展。

(3)智能时代

自2012年~至今,伴随着内容爆炸式的增长,用户消费模式更进一步融合了门户网站的海量内容呈现+搜索时代的精准化内容检索,推荐及个性化推荐应运而生。2012年则是作为智能时代的开端,虽然个性化推荐技术早有研究,但是对于信息分发这个任务有不可或缺的推动作用。

① 图文时代

个性化推荐其实经历了两个时代,其一是图文时代,其二是视频时代。图文时代在国内则是以今日头条和一点资讯为代表的个性化图文分发引擎,初期内容基本上是通过爬去各个传统门户网站的内容经过自己的内容理解做好基础分类的标签归属,然后在通过个性化分发引擎做到你关心的就是头条。

② 视频时代

自2015年开始,伴随4G普及及终端设备的急剧降低,用户消费场景正式步入移动时代。在内容消费中也逐步变成从传统图文消费转变为了视频、音频消费的模式。这个时候,由于音视频本身的识别难度远大于图文内容,在优劣内容判别时,传统的知识图谱、关键词、人工运营已经无法覆盖生动的视频内容,这个时候内容理解便得到了重要发展。

2. 内容理解的重要性

内部因素来看:伴随内容爆炸式增长,UGC创作者创作水平、创作目的各不相同;PPC&PGC内容则面临着视频二次创作,选择优质经典内容成本极高的问题;消费者存在内容理解偏差,平台需要保证基础内容质量将优质内容呈现在消费者面前。

外部需求有,内容供给足,运营成本高,三者结合,视频内容理解则成为了平台重要扶持对象。

二、视频内容理解产品架构

产品能力上来讲,内容理解主要分为三个部分:视频信息归类、视频特征整理、优劣内容识别。

视频信息归类:通常情况下内容理解算法经过深度学习以后,可以对视频内容进行内容分类及标签定义,用于给视频内容自动化定义基础的分类和相近的标签。

视频特征整理:视频特征主要针对于视频内容本身和视频评论进行特征标识的。通常情况下会视频本身的特征主要是对画面和音频两个方面进行特征整理。画面方面主要是强调的是视频主题(视频带货、才艺表演、古装电视、综艺真人秀)、作者类型(穿搭博主、颜艺博主)、创作者能力及兴趣(资讯版本、历史板块、泛知识类板块)、OCR识别(主要识别视频画面中的文字关键信息)。

对于音频则主要是识别音频中的音乐(出现位置、BGM名称等)、ASR识别(语音转文字、音色、音调等)。针对于视频评论主要是整理评论估计推荐度、评论关键词等信息作为辅助本身本身特征及归类的描述。

优劣内容识别:一般情况下内容理解后台会对线上视频内容做组合式内容优劣识别,组合式包括了内容本身及内容评论两个部分。这之中主要是会对内容本身、内容评论做独立优劣识别,同时会根据内容评论的分析结果作为内容本身优劣的一个评判维度。

针对于内容本身一般会分为优质内容、次优质内容、一般内容、劣质内容四项,评论通常情况下会分为神评论、一般评论、争议评论、劣质评论、抑制创作评论这五种类型。整体对于内容优劣的判断通常如下图所示:

1. 内容理解流程

为了快速对视频内容形成信息归类、特征理解与优劣判定,当视频入库的时候,内容理解后台会监听视频内容入库的消息,视频入库完成后通常会到存储将视频内容下载到内容理解后台中,在内容理解后台对视频展开画面及音频的内容分析,确定视频的基本归类、特征、优劣判断。

在视频上线一段时候以后,展开周期性的根据视频互动数据对视频内容理解进行多次优化,不断深化内容画像。

目前线上视频业务中,用户视频通常情况下不会给用户对线上已发布时候进行视频调整的机会,因此内容理解中不太需要判断视频是否存在修改而进行相应的画像调整;版权视频由于成本问题,通常收到监管要求以后会对视频进行再加工处理,因此线上视频会进行剪辑渲染等调整,所以当内容理解后台监听到视频调整以后,需要对视频进行重新内容分析。

对于一些重点内容,需要内容理解后台将分析的结果呈现在运营面前,运营可以对分析结果进行调校。通过以上的行为,便可以对视频内容做相对详细的分析,结合上述内容,内容理解的流程如下图所示:

2. 内容理解业务覆盖

如前文内容理解的介绍,内容理解后台主要的作用是在于视频信息归类、视频特征整理与应用、优劣内容识别三个部分,包含了对视频、音频、字幕、评论为主的多维度内容分析。

由于在PPC、PGC、UGC内容中业务对于视频内容的运营策略与人力资源的不同,因此内容理解对于不同生产形势的视频内容会进行区别化分析。

我们通常情况下将版权采购和平台自制时长高于20分钟的视频称之为版权长视频,把用户上传的称作用户视频,目前新兴的如《生活对我下手了》系列版权采购单集5分钟以内的视频可以称之为微剧。由于微剧整体从内容供给和消费而言与PPC、PGC长视频相似,因此可以并入到版权或自制视频中进行分析。

(1)信息归类

分类:版权内容一般会对自己的视频做200-300个分类,包括一级分类(如电影、电视剧、综艺、动漫、纪录片等)、二级分类(华语、港台、日韩、欧美等)、三级分类(喜剧、爱情、动作、青春、奇幻等)。由于版权视频在内容购买时存在投资与购买片库的两种逻辑,因此新热大火的内容通常是人工运营选择分类,其它片库内容可以通过内容理解后台对分类进行建立。

用户内容通常情况下会做相对于版权视频相对多一些但是层级少一些的分类,一般情况下用户视频分类的个数约500-800个,包括一级分类(游戏、舞蹈、鬼畜、美食等)、二级分类(美食制作、美食侦探、美食测评等),这部分内容一般都是由内容理解后台或用户选择进行自动归类(由后台归类节约用户上传视频步骤容易提升产量,因此由后台归类逐步变得更广泛的应用),头部大号一般会有相应的大V运营同学对分类进行调整。

标签:一般情况下,内容理解后台会根据视频画面内容、音频、字幕内容进行初步的标签核对,后续会通过离线加载视频评论的方式,将视频评论的标签和视频内容的标签全部打入视频,后续经过搜索等、推荐等行为,不断确定标签的优先级,将标签打在视频内容、专辑、播单等主体上面。与分类相同,头部大V的内容会由公司运营对标签进行调整。

(2)特征整理

特征理解主要分为视频表征理解(如视频主题、创作者兴趣特长等)、优质音视频内容识别(精彩片段分析、BGM分析等)这两部分。

视频表征理解:表征理解顾名思义是对视频表达的内容主题、创作者长短板、消费匹配等进行分析,通过对画面、字幕、音频的分析,确定视频的表达主题、出镜人员识别(演员、网红之类的)等信息,将信息存放在内容理解库中,并广泛应用于视频的编目信息。

优质音视频识别:优质音视频识别的主要的应用场景是在于长视频消费和生产,同样也可以适用于直播领域的点播内容制作,特殊场景下的内容展现(如足球比赛的关键进球、红黄牌等信息)。

由于版权视频业务中,在消费和生产端存在优质音乐回放、优质视频拆条等素材,因此在整体的制作消费环节中,内容理解后台可以通过算法分析并识别出优质的音视频内容给到生产、消费端进行使用。

音视频特征识别除了本身作为音视频内容外,同时存在着从视频中提取并分析相应音视频内容,并根据内容识别专场、优质帧位等信息,从而找到并广告位精彩点位等关键位置;进一步生产个性化封面图、个性化标题等信息用于后续的推荐、搜索、播放等业务场景中。

(3)优劣分析

一般情况下内容理解后台会从三个方面对视频进行优劣判断,分别是音视频质量、视频内容质量、视频互动。会对以上三个方面各处每个方面的基础分数,同时会将三者的分数在消费端的综合表现及权重做多次加权给出总体分数。

① 音视频质量

通常情况下,音视频质量是视频优劣的一个重要指导指标。。一般情况下评价音视频质量主要有以下3大方面:

画面问题音频问题音画问题

画面问题:画面问题主要是涵盖了花屏、拉丝、灰屏;分辨率;帧率;横竖屏;画面细节展现;模糊、马赛克;黑屏等问题。

音频问题:爆音;噪音多;卡顿等问题。

音画问题:主要面临的问题的是音画不同步。

根据以上三类问题,通常情况下会将对音视频质量分析的步骤称之为质量检测。质量检测一般是会根据已经上线的视频,按照视频内容的重要程度进行自动检测及人工检测,一般情况下为了保证人工检测的置信性会进行两轮的人工检测,视频行业的说法是一检和二检。

自动检测:

视频进入到平台通过安全审核上线后,会优先利用算法对视频进行质量检测,质量审核是面对所有平台已上线视频做的。

一般情况下对视频质量进行画面、音频、字幕等单方面检测,同时会利用平台用户消费状况给予视频一个综合分数。在自动检测时,为了更加清晰地了解到是平台对视频二次编码的出现的质量问题还是视频原始介质的问题,一般都会对原视频介质和线上码流都进行自动检测。

现在常用的综合分数主要主要是分为两种,一种是平台自行开发的,另外一种是基于开源工具进行检测。

VMAF是一款Netflix开发的一款基于视频画面进行综合打分算法的工具,视频画面经过工具后会得到PSNR的分数,通常情况下PSNR分数相差3以上基本就是肉眼可见的质量差异。下图上面两张图片PSNR分数为31分,下面两张个图片是34分。

虽然目前市面上各家公司都习惯于对外宣传使用自研视频质量分数,如果希望做跨平台对比视频内容一般还是使用第三方数据可靠性比较高。

人工检测:

对于平台内部的重点视频在自动检测出现出现比较有争议的分数时,便需要人工检测进行校验。一般人工检测的视频包括平台版权采购内容、平台自制内容、头部创作者视频、近期播放指数陡增的视频这四类。

人工检测一般的检测项和自动检测保持一致,需要经过二次人工检验对视频进行最终定性,并给出视频调整的综合性建议(如对原视频介质进行优化、重新对运营流进行编码等操作)。

② 视频内容质量

视频内容质量主要指的是视频内容本身(不计算编码后音视频码流质量)对于用户价值平台价值的综合得分。由于这部分视频计算得分需要模仿用户心理状态,因此在视频内容质量的计算过程中需要主要考虑的是基于平台消费情况视频的客观事实和符合平台及用户消费导向的优质视频筛选这两个部分进行视频内容质量打分和推荐。

对于视频内容消费而言,人们对于优质的理解总是各不相同的,此时优质内容的识别就需要给予平台调性和主推以及用户消费进行综合性筛选;劣质内容的认定基本上用户会形成相应的共识,因此内容理解后台对于劣质内容识别可以通过规则及算法精准找到。

劣质视频识别:

劣质的视频内容一般可以通过标题与内容的联系、视频内容画面、音频等元素是可以通过系统识别出来的。具体的表现有标题党、视频时间过短、营销导流(贴二维码、硬广)、有明显的台标、作品重复、诱导互动、性暗示、非原创投自制等。通过这样通用性的劣质视频规则和算法的识别可以第一时间内识别出来平台内的劣质视频并加以标识。

热门多样经典符合平台价值观

实效性内容主要是基于热点事件,网络用户查阅量较高的话题做成的内容,笔者当年做了一个监控微博热搜+自动图文转视频的工具,对实效性内容制作和分发起到了还不错的收益;

广泛性指的是需要筛选出来的内容具备规模效应,至少平台中60%以上的用户会喜欢这样的内容,产生的长播放覆盖占比需要超过当日活跃用户数的30%以上,比如B站在热门内容的选择中对于二次元宅舞动漫混剪会有相应加权。

地方性热门内容需要给予LBS进行推荐,作为一手分析优质内容的视频理解后台,需要对地方性优质内容做好相应的地域标记,比如某些地区第二天强暴雨预警就是地方性很强的热门内容。

视频多样性选择:

平台在判断优质内容的时候,会根据内容分类在每个分类下都找到一些评分较高的视频,在整体的视频内容召回时,不在单纯进行整体的评分排序,而是按照平台视频消费的内容频道、视频归类等因素,按照频道或者归类(在统计频道或者归类时需要获取不同类目下内容和实际产生vv占比及BI预测占比)进行按比例召回,根据频道归类的消费指数*视频分数进行统一排序后再通过算法模型做一定的顺序打乱,通过这样的方式召回的视频用以构成了平台的优质内容多样性,让用户在消费中可以感受到平台内容多且种类多。

经典视频的筛选:

在视频平台中都存在着一些能够长期稳定获取vv及长播放的视频内容,长视频平台中可以发现如优酷的《甄嬛传》、爱奇艺的《请回答1988.》、B站的《半泽直树》这样的内容,短视频平台中如讲解古生物的《鬼谷说》系列、讲解人物历史的《东梦人物志》系列;美食作家王刚、厨师长农国栋、觅大叔这类实用型教授做菜、选东西的内容等。

那么这部门视频内容的获取便需要内容理解后台借助于消费数据不断刷新获取具有长效不断vv,且长播放相对较高的视频内容,将这些视频填充进入优质内容池中作为平台经典内容呈现。

平台价值观的嵌套:

平台需要有自己的价值观,内容理解后台在获取优质视频内容时需要和平台价值观做充分绑定的。有些时候用户喜欢喜欢看的未必是在社会上平台中需要努力宣传的视频,这个时候平台需要根据自己推崇的标签分类或是知识图谱中对上述三者选出的内容进行权重的二次分配,从而形成最终的优质内容。

③ 视频互动

视频互动主要作用于优劣视频筛选和优劣互动内容识别,主要的原则有三点:

通过互动数据调教原视频的特征利用互动数据辅助判断视频优劣互动数据分析并赋能给消费及生产

互动数据调教原视频的特征:视频互动数据包括基础的赞、踩、举报,也包括主管评论、标签添加等信息。在内容理解中,可以通过用户的互动数据进行知识图谱、关键词等信息,对原视频特征做二次校正,补充仅通过内容角度分析缺失的数据同时对特征权重按照用户的消费进行重新调整。

利用互动数据辅助判断视频优劣:通过对用户互动内容,可以最直接的得到视频在消费端消费好坏的情况,基于视频消费情况对视频优劣进行二次校正,可以最大限度让优质小众视频不收到埋没,让广泛消费的视频得到更加公众的判罚。

互动数据分析并赋能给消费及生产:一般情况下内容理解后台对于主管评价内容会会进行两个方面的展露,其一是对生产者,其二是对消费者。

劣质评论内容相对于优质评论内容则更容易识别,因为人们往往对优质的定义很多,但是对劣质的定义却是有很强的统一性。因此在劣质内容识别上,内容理解后台可以结合反垃圾的做法快速筛选出来劣质内容。

3. 内容理解后台产品架构

内容理解定义:对接平台线上视频及互动数据,对介入的视频多业务级多维度归类分析,同时进行标签、知识图谱对齐,利用线上数据及算法模型对视频整体内容进行归类、特征梳理、优劣辨析;对视频二创进行制作指导;对视频消费进行业务化处理。

因此在整体内容理解后台的产品架构中,需要先做数据输入与输出的处理,根据所需要的数据找到对应数据平台从而完成整体架构设计。

(1)内容理解后台数据交互

我们将内容理解定义为两部分:通过内容本身理解内容、通过用户行为理解内容。前者主要是针对内容抽取归类于标签。后者通过累计的用户数据,经过统计、建模、平台倾向、产品规则等方面对内容进行分析。

(2)内容理解后台产品架构

通过上述数据交互,可以清晰的了解到内容理解后台外在数据获取及数据处理中需要对接的系统,主要包括了素材库、生产制作系统、运营系统、BI、视频互动数据库、OCR等。

因为内容理解后台的使用特性,故而继承了工具+服务两部分的属性。服务则存在于工程和算法两个方面,工程上主要是数据读写和接口服务,算法上则是内容分析、互动分析等算法。结合数据流转可以得到如下简要内容理解后台架构图:

三、视频内容理解产品设计

在整理完成内容理解后台的业务覆盖,梳理数据流转、业务流程和产品架构以后,下一步就是内容理解后台的产品设计阶段。

由于内容理解后台相对于基础后台比较偏重于算法,因此产品经理在整体的产品阶段需要负责模块不仅仅存在于功能方面,还有一定的算法需求。产品经理在这种类型的产品价值则主要体现在了业务发掘、产品设计、跨部门沟通。

1. 业务发掘

对于视频理解这种新型后台产品,不像传统后台有着天然的使用方,为了能够让产品逐步做起来,最重要的事情是在业务中找到业务痛点,在产品上线初期可以让更多的用户来使用后台(包括后台的数据)从而不断得到优化迭代的机会,让产品能够存续下来。

完成了生存挑战,后续就是让产品覆盖更多的业务,存在更多的能力,整合更多的系统,让产品成为基础建设。最后一步就是让产品变现,将整体的能力变成对外服务,做基础建设的能力输出获利。

产品经理在整体的流程中,很重要的一点就是业务发掘能力,在整体业务发掘中主要是对需求的发现与收集能力,这之中主要是通过对B端的实地观察访谈和对消费端的实际使用。

对B端用户的发掘主要是通过观察法和访谈法进行,主要的目的是通过观察和访谈找到业务操作上的痛点和实际业务流程。业务痛点主要是核心是老生常谈的效率问题,如海量视频归类,优质片段的寻找,优质视频的寻找,高优评论的识别,劣质内容的提示等。

在消费的时候,其实可以发现如视频冷启动内容不够精准,视频评论将更好的评论放在了更靠后的地方等等。通过这些在消费端发现的问题,可以找到内容理解后台可以增加的业务范围或优化的方向。

2. 跨部门沟通

前文说了,对于内容理解这样的后台产品而言,需要很多数据和服务,因此在需求明确之后,产品设计之前,需要罗列出来可能要合作的部门,需要不断开会拉起各个部门的实际负责人和相关产品研发人员,确定哪些能力是当下支持的,哪些能力需要开发,各自负责的边界范围是什么,然后根据现有能力组装内容理解后台的能力覆盖。

后期则是对于功能的研发及为了业务发展更好,对整体数据指标的建立与拉齐。

(1)业务打通

业务初期阶段,产品经理需要在根据架构梳理出来需要对接的外部团队,找到做内容理解后台对于每个业务的收益从而获得其他业务的支持。

之后便是根据数据流转和各服务之间的架构做好相应的业务流程和产品流程。由于现在中台化服务已经在各大公司普及开来,因此串联业务的工作必然是内容理解后台需要做的工作,产品经理在这里最重要的事情便是梳理大体的业务流程。

(2)指标建立与拉齐

在上线以后,为了能够获得系统间更快的响应,让用户及服务前端的数据获得更加敏捷的响应,产品经理需要为内容理解后台做以下3件事情:

找到长期支持内容理解后台的合作伙伴建立各项指标让所有服务方对齐建设长效的问题反馈收集反馈机制,促进产品迭代。3. 产品设计

在对业务发掘以后,下一步就是根据发现的问题,找到功能或者策略可以解决的方式提供服务。由于内容理解后台是集成多种服务的算法+工具+服务形式后台产品,因此产品经理在产品设计中的核心能力是打通系统之间的数据、提供工具给用户使用、优化模型建立评价体系。

(1)流程设计

对于内容理解后台这种需要多服务支持的后台产品,系统间的产品流程是非常重要的。在流程设计中,由于需要进行系统串联,所以需要主要考虑的地方在于分析的敏捷性、精准性。

敏捷性:流程设计主要是希望整体的分析速度能够更快,因此需要在设计中做尽量多的并行事件。需要了解系统间对于数据分析的前后关系,合理安排数据入库的顺序并完成分析。

精准性:需要对输出的数据进行负责,因此在整体设计中需要尽量规避可能出现数据出现问题的流程设计,做到不漏、不偏。

(2)工具设计

内容理解工具主要的目的是有两点:

辅助运营判断内容展示流程提升问题排查效率

① 内容判断

工具设计中主要需要展示原本内容和分析结果,需要将整体视频展示做到全面和准确,在分布上需要做到模块顺序可以调整,默认状态下让根据最大原则定好模块排布顺序。因此从工具上需要为用户展示内容池、内容具体信息两个模块。

内容池:主要是按照业务需求以一定的规则算法选出一些类型的内容池,如热门内容池、新用户冷启动内容池、优质内容池、点赞飙升内容池等等,用户可以设置一些条件和维度进行内容筛查。

内容信息:内容信息一般展示用户查询内容的基本信息及内容理解后台给出的分析信息,功能上需要支持基本的查看和修改能力。同时用户修改的操作的正负向信息需要传递给算法,从而优化算法模型。

② 流程排查

主要用于视频内容分析故障的时候,确定故障原因,找到第一责任人进行故障排查,让业务顺利进行下去。

③ 小结

内容理解工具端的设计组要服务于两大方面,其一是内容判断,其二是流程排查。内容判断主要是内容池展示和内容展示,流程排查需要将分析流程明盒化,提供给研发排查问题,产品也可以根据流程做效率上的进一步优化,

(3)建立评判体系

基于内容理解的算法,产品经理需要建立指标体系不断提升算法能力,提升分析模型。指标体系主要需要应对两个方面的的挑战,企业内部需要查看业务覆盖量,面对用户需要查看推荐数据的具体指标完成情况。产品经理需要和算法工程师一起制定指标,让分析能力增强,推荐数据更优,覆盖业务更广。

企业内考量:

产品经理需要在企业内容寻找到可覆盖的业务,了解清楚业务注重的供给数据和核心看重的规则和数据指标,产品经理需要分业务和算法工程师对齐内容筛选指标,让更多业务用起来。

对于企业内考量则是覆盖有效业务范围是一个考量指标,上限是100%;新业务接入速度也是一个考量指标,服务足够完备的情况下,新业务接入可以按照天来计算。

分析准确性也是一个重要指标,一般情况需要人工进行标注才能不断提升,整体来说分析结果准确度在80%左右就是非常好的效果了,当然上线肯定是还是100%。

用户侧指标:

为了能够真正赋能于业务,整体内容分析与数据提供需要和业务侧对于视频消费数据保持一致的指标。指标分为两类,一类是业务偏重的类型,一类是业务增长中的关键指标。

业务偏重的视频类型主要体现在了识别的精准程度和数据提供的权重;增长关键指标需要紧密贴近消费,如需要查看视频的CTR、UCTR、LTR(点赞率)、长播放占比(电影电视剧视频一般是10min;UGC竖版视频一般是3s)等数据。

四、内容理解在的应用举例

对整体内容理解分析完成以后,我们针对于内容理解后台在视频平台中的应用举几个不错的例子。

1. 优质内容池筛选

什么事优质内容池呢?每个人对于优质视频的定义都不尽相同,因此在优质内容筛选中,内容理解后台通常是通过利用优质内容分析的结果和用户消费数据共同选出优质内容。

如视频源非常清晰,用户填写视频的标题等信息分词明确,音视频质量得分很高,视频主题与当前热门主题或未来可预测到热门主题密切相关等,再通过消费数据如抖视频冷启动LTR及3s播放数据很不错,然后实时监听视频的10w和100w播放量状态,最终确定动态的优质内容池。

2. BGM内容获取

有一个比较有意思的例子是检测影视剧中出现的插曲,一般情况下影视内容插曲质量都非常高,被传唱度很广。

这也意味着用户看完视频以后,会回到视频中的某一段来听那首插曲,所以找到这些优质的插曲便成为了内容理解后台在PPC内容分析应用中很重要的一部分。

通常的方法是首先把音频做秒级别的切片,将音频片段做频谱分析,通过CNN(卷积神经网络)技术对是否是音乐做判断,最后在时序上找出完整的插曲片段;在找到这些音乐片段以后,下一步就是找到片段中优质的音乐,具体方法是剔除劣质音乐,由于影视剧中的插曲很多伴随着演员说话和一些嘈杂的声音出现。

因此可以通过音频检测的方式剔除这些相对低质音频,从而得到优质的BGM。最后可以通过机器学习的方式,将得到的音乐做好分类,如爵士乐、古典乐等。

五、总结与展望

内容理解后台作为融合算法型后台系统,包含策略、功能等多种模块的产品能力,对于产品经理的锻炼是全方面的。在人力成本逐步上升的今天,伴随内容体量不断扩大,通过算法的方式给视频做好相应的归类、描述特征、筛选优质是非常有战略意义的事情。

产品经理在面对这种复杂形势的后台系统中,基础能力是多业务配合与底层架构拆解,进一步的能力在于策略和模型的校验和研发一起推动算法迭代,最重要的能力是要对前端业务有自己深刻的理解,只有理解视频业务,才能知道用户最想要的是什么,找到系统优化与业务前进的方向,并真正做一些对用户有价值的事情。

本文由 @大橘子-视频产品 原创发布于人人都是产品经理,未经许可,禁止转载

题图来自 Unsplash,基于 CC0 协议

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

THE END
0.今天是厉以宁教授的生日新浪财经这也不奇怪,因为自1952年开始独尊“计划经济学说”,加之20年间变革不断,受过现代经济学教育、系统了解西方经济学的学者凤毛麟角,国内许多高校在高考恢复后急需开设西方经济学课程,却没有师资。 北京大学经济系1980级学生张新华也曾在“老师的小册子”一文中回忆道,或许是禁锢太久的缘故,这几jvzquC41el4tkwf0ep5bt}neng5oq{rafgzbkuDwtnCiv}uu'5G&4O*4Hhoocwhg0uooc7hqo0io';Kejktb';Kipep&4O7243323674'4Leql2kmv€te‚~92986593ujvsm(jzvqegmn~u?pq,juowqouoocFsq
1.防汛防台应急管理解决方案数字政府应急管理围绕政府防汛防台减灾应急管理日常和突发事件处置的各项工作,前后贯通、左右衔接、 智能分析、精准预测,全面提高区域防汛防台应急准备、监测与预警、处置与救援、灾 后恢复与重建的各项能力,最大限度地减少或者消除台风、洪汛等气象灾害对经济社会 发展造成的影响,维护广大人民群众的生命财产安全。 jvzquC41yy}/oxiw{wt/exr1uqrvvrtpahrpqmutgxkovrtp0jznn
2.RuoYi若依官方网站|后台管理系统|权限管理系统|快速开发框架|若依基于SpringBoot2.0的权限管理系统 易读易懂、界面简洁美观,文档齐全。核心技术采用SpringBoot、MyBatis、Shiro、Thymeleaf、Bootstrap、Vue没有任何其它重度依赖。直接运行即可用jvzq<84yyy4swx~k0xoq1
3.物业部年终工作总结⑤严格按照消防管理规定抓好楼宇消防设施的日常管理,规范消防设施设备的维修保养;使应急灯、疏散指示灯系统处于运行良好状态; 3、保洁、绿化方面 保洁绿化在各项工作执行当中,对小区所管辖范围内的卫生设施进行了分片区包干管理,具体工作如下: 为了强化小区环卫工作,提高保洁工作质量和服务质量,激发保洁人员工作的动力和服务jvzquC41yy}/im~lu0ipo8xjk{uoi€jp1iuoiƒzq|qthlrj172973@3jvor
4.同城配送智能管理系统实践我们的配送管理系统就像给流程装上了"智能警报器",当订单超时、骑手偏离路线或设备离线时,系统能在30秒内自动触发三级预警机制。通过实时比对订单承诺时间与动态路况数据,智能算法会提前15分钟预测潜在风险,并通过APP弹窗、短信和商米设备震动三种方式同步提醒相关人员。遇到暴雨天气或交通管制等突发状况,系统还能自动调整配jvzq<84yyy4{jnsi|jkoiqfq0et0pn|u146378sgyue17;9135>33B3jvor
5.同城配送智能调度全场景应用系统运营建议:商家在选择配送系统时,建议优先考察其多终端协同能力——支持PC端管理后台、骑手APP及商米POS设备数据互通,可显著降低跨平台操作成本。 目前该系统已实现商户入驻到配送完成的15分钟极速配置,通过可视化数据看板可实时追踪订单状态变化。对于高频使用的营销功能模块,如限时秒杀、满减促销等玩法,系统提供即插即用jvzq<84yyy4kkwlvqpmdjnsi0et0pn|u146378sgyue15::134;75>3jvor
6.天气预报内容通用12篇这个项目还提供短信服务功能,其他用户可以向安装本应用的手机上发送关键字,然后可以把保存在后台数据库的天气情况通过短信的方式自动发送给用户。每一个发送出去的短信都会被保存下来,在系统数据的界面中,用户能查看或者删除这些回复的内容。 2 系统的需求分析jvzquC41yy}/z~jujw4dqv4jcq}fp86283?30qyon
7.成都女孩在巴厘岛疑因食物中毒离世后台配置能力:将数据指标经由数仓计算后落库,再通过策略运营平台下发,形成圈选用户的下发策略。 5)策略协同与冲突解决: 多条策略难免会遇到冲突场景。比如,首页也有“限时促销”推荐,两个模块都想抢流量位。 这种情况并不罕见,此时你需要定义策略之间的协同机制,设计优先级配置系统,根据用户画像动态分配推荐位。比如jvzq<84|jcurkwl0|jgoi}jpi0imq~i1vt{tv87247721:64349/uqyon
8.华为怎样设置应用后台运行如果你是用的华为手机,想让某些应用在后台持续运行,可以尝试进入设置中的应用部分,找到应用启动管理功能,将它的自动管理关闭,并为特定应用勾选允许自启动和允许后台活动。另外,有些用户还会遇到应用退到后台后被清理的问题,这时候可以在多任务界面长按应用卡片,选择锁定来保持其在后台存活。不同系统版本操作略有不同,jvzquC41ycv/|xq0eqs/ew4cum5ya<54::=927mvon
9.人保集团总裁王廷科:保险企业应打造强大中后台科技体系赋能数字化营销例如,我们在打造安全工厂、提供风险解决方案时,构建了物联网风控平台,借助传感设备和平台算法,实现了厂区火焰吸烟动作的实时预警。我们在成都的家具制造企业中试点,重点监测电器火灾风险。在首次推广的63家客户中,系统检测识别各类风险隐患362起,提示并协助客户整改电器设备及线路30余处,提升了工厂火灾风险管理能力。 jvzquC41hktbplj0gcyuoxsg{0ipo8f14282397443;28@84;34ivvq
10.盘点2012中国保险业:国资主导险企凶猛添十丁据悉,汇丰入股平安后,委派了两名管理层加入董事会,参与重大业务方针的制定。同时,汇丰还向中国平安日后发展起来的银行业务派出了骨干人才,并将汇丰的后台风险控制系统直接移植过来,助力中国平安的银行业务。汇丰之于中国平安的影响体现在经营模式、治理结构、管控流程、市场网络、后援服务等。jvzq<84oqpkz0|tjw0ipo87235623A4p58999::650yivvq
11.控制论在水利工程建设施工中,监理质量控制信息管理系统是一个采用系统的科学的思维方法,利用计算机和现代通讯技术,对工程信息进行收集、加工整理、存储、检索、传递、维护、分析和处理,从而为监理决策和实现动态控制而服务的管理信息系统,该系统的建设有利于实现对水利工程建设施工监理质量控制的全面化和系统化的管理。 jvzq<84yyy4vpsx0eqs0y8935:990qyon
12.工程部半年工作总结15篇系统,厨房设备设施等正常运行,特别要提高餐厅部,客房部设施的完好率和舒适度。进一步加大能源管理力度,加强成本意识,完善物耗材料管理,设施备件定置管理,大力抓好挖潜和修旧利废工作。 加强人员培训,服务意识培训,服务技能培训,争取人员一专多能,充分利用人力资源,改善服务,改善后台形象,促使工作质量更上台阶。 jvzq<84yyy4rwwqw0ipo8lqpi€vq8=289970qyon
13.人力资源管理工作要点大全11篇尤其是纳入系统管理的业务实现了统一化和流程化处理。比如对于工资核算与发放这种在所有下属企业都会涉及的常规业务,通过系统集中统一处理,这类业务可以首先考虑纳入HR共享服务中心进行管理。 3.2.3 人事业务数据逐步实现规范化和标准化 近两年,中国石油通过人事档案审查以及系统数据核查,人事业务数据逐步规范和统一,各类数据质量逐年提高,为共 jvzquC41zzpyus3hcdobq7hqo0io1qfqygt04::680nuou
14.全年累计发出台风、暴雨、洪水等灾害预警信息76.9亿次,覆盖6766“全年累计发出台风、暴雨、洪水等灾害预警信息76.9亿次,覆盖6766万个人及企业客户,并为超4.4万家企业客户提供隐患排查等现场服务。”这是平安产险依托自主研发的鹰眼DRS2.0系统,2023年为客户提供灾害预警、风险筛查、巨灾风险管理等多场景服务的真实数据。 作为转移风险、提供保障的行业,保险业应对极端气象灾害的动作逐渐jvzquC41zwkrk~3eqo5479794:;9887:42;4:A6
15.信息系统设计论文汇总十篇2.2架构设计民政服务信息系统采用ExtJS和JSP实现前台页面,通过Struts2、Spring和Hibernate实现后台业务处理,并通过ExtJS和SSH整合搭建一个实现了MVC设计模式的系统架构。ExtJS+SSH架构中ExtJS实现了从用户界面向后台提交请求。控制层使用Struts2来实现MVC模式。业务逻辑层细化为Service层和DAO层,通过Spring来管理Service和DAO之jvzquC41yy}/z~jujw4dqv3ep1nbq€jp1479;=3jvor
16.扬尘噪声污染在线监测系统本系统由颗粒物监测系统、噪声监测系统、气象监测系统、视频监控系统、无线传输系统、供电系统和后台数据处理系统及信息监控管理平台组成。监测子站集成了大气PM2.5、PM10监测、环境温湿度及风速风向监测、噪声监测、视频监控及污染物标视频抓拍(选配)、有毒有害气体监测(选配)等多种功能;数据平台是一个互联网架构的网络jvzq<84yyy4clktgpeq/exr1Kpjfz8utqf{dvMjvckr0km4379:959=630nuou