视觉检测领先者
全国咨询热线:13812953225

阿里AI视频辨认算法新打破:可帧级解读视频

发布时间:2024-11-05 02:19:08 人气: 来源:bob平台官网入口
案例介绍

  手机里存了很多的视频,想编排其间的精彩片段却犹如难如登天?视频网站具有海量视频,怎么严厉审阅防止问题产生?

  近来,在德国慕尼黑举行的计算机视觉世界顶会ECCV(European Conference on Computer Vision)上,阿里安全图灵实验室高档算法专家析策展现了最新的AI视频辨认算法,其辨认精度逾越现在干流办法,有用提高了视频主动标签的职业精度,这一新算法已被ECCV录入。

  阿里安全图灵实验室高档算法专家析策表明,为提高AI技能在实践场景中针对视频辨认的精度,提出一种新的根据图(Graph)的视频建模办法,能表达含有杂乱事情内容的长视频。

  析策表明,这一办法的首要思路是经过“深度卷积图神经网络”(下称“DCGN”)对视频的帧、镜头、事情进行多级的建模,逐渐地从帧级、镜头级,一直到视频级进行笼统,然后取得视频大局的表达,从而进行分类。

  他举例称,“比方一段美食节目视频中,包括厨师长、主持人谈天、食物、观众等内容,AI在学习视频内容时会先根据内容对视频进行逐帧的语义表达,构成特征序列,用不用的标签进行打标,随后在经过多层次的网络对这些不同打标的内容做联系表达,深度了解这一些内容之间的关联度,将相似的节点衔接起来,终究组合出对整个视频的了解。”

  烹饪节目中包括各种内容,不同内容用不同演示边框表明,终究组合出对整个视频的了解

  析策表明,一个视频包括帧、镜头、场景、事情等,帧与帧、镜头与镜头间的联系十分杂乱,不单单是前后帧的次序联系,而现在揭露的建模办法一般都无法表达如此杂乱的联系,DCGN因对杂乱内容的深度学习和了解从而提高辨认精度。

  据悉,阿里安全图灵实验室已将AI才能在内容管理、知识产权、身份认证验证和新零售安防等范畴进行运用,掩盖阿里生态的淘宝、支付宝、优酷、UC等中心事务线。

  近期刷爆交际网络的网红“AI鉴黄师”,每天可审阅数亿张图片,辨认准确率高于99.5%,技能才能便来自阿里安全图灵实验室。连视频内容都能了解了,解读一张图片岂不是小菜一碟?