丁少分享 http://blog.sciencenet.cn/u/pandyliu 庖丁技术众包平台,用众包对接技术与市场(微信公众号:庖丁技术)

博文

谷歌:图像识别你们都学会了,那我识别个视频给你看看

已有 3453 次阅读 2017-3-14 22:11 |系统分类:科普集锦

上周,谷歌在Google Cloud Next ’17 大会上,发布了包括新客户、新合作伙伴、新产品开发等一系列消息,企图再度发力云服务。


庖叔感觉到,谷歌这次是要玩命对抗 AWS(亚马逊云服务)和 Azure(微软云服务)了。



在这次大会上,谷歌宣布收购著名数据科学社区 Kaggle ,引起业界震动。


但庖叔更关注的,倒是另一个重磅技术的发布:


视频内容识别


庖叔还记得很多年以前,第一次看到把一张图片拖进谷歌搜索框,就能识别出图片的内容,并搜索出相似图片时的震撼。


而如今,视频居然也能被识别了?



这就是谷歌云视频识别平台,将视频上传就能进行识别。


废话不多说,来看看识别的效果。


测试的Demo是一部场景丰富的广告片


识别的过程大概是这样的



视频的镜头在不停切换,右下角的场景标签也在实时变化。


庖叔截几张大图让大家看看识别结果



此时的画面是这个场景



实时识别出来的结果显示:92%的可能是野生动物(Wildlife),91%的可能是动物(Animal),81%是动物园(Zoo),78%是旅游胜地(Tourist destination)


除了动物园和旅游胜地不一定准确,前两个标签正确无误。



镜头切到特写,识别结果实时变化为:



后两个标签变成了:90%的可能为老虎(Tiger),68%的可能为陆生动物(Terrestrial animal),非常准确。


场景转换。




大象(Elephants)、长颈鹿(Giraffe)全都无压力识别。


虽然还是Beta版本,但感觉可用度非常高。


关于视频识别的技术原理,谷歌没有透露更多的信息。但我们可以用图片识别的原理来理解视频识别。因为视频本质上也是若干帧图像的连续播放。



当我们要识别一张图片的时候,简单来说,要分以下几个步骤:


先用算法算法对图片进行特征提取。提取前也可能会对图像进行压缩、颜色简化等预处理。


将提取的特征进行编码。


编码后与数据库进行比对,给出相似图像。也可以是给出相似度、检索词等。



说起来很简单,但每一步都涉及到很复杂的算法。海量的数据如何编排才能达到最快的检索速度。这些都是图像识别的核心技术。


等这套系统推广开来,最直接的好处就是,我们可以用视频内容的关键词来搜索视频了。



比如搜索“比基尼”,那能搜到的东西可比以前多得多啦。


谷歌还将此技术以 API 的形式开放,以后我们还能见到更多视频识别奇思妙想的运用。



https://wap.sciencenet.cn/blog-1378817-1039449.html

上一篇:空中客车公司跨界汽车行业,推出一款会飞的汽车
下一篇:一条胶带吊起近1吨巨石,这种新材料的强度堪比钢丝!
收藏 IP: 111.151.60.*| 热度|

2 史晓雷 yangb919

该博文允许注册用户评论 请点击登录 评论 (2 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-9 16:05

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部