“疑犯追踪”中超牛的机器天眼只是幻想?NO,NO,它正在成为现实!
2016-10-14 07:43 格灵深瞳 赵勇 创业 人工智能

格灵深瞳下一步要专心去做的事,是如何做到专业化、产品化、让产品落地。

看过《疑犯追踪》的人,是否对其中的人工智能叹为观止?那么,像剧中那样能够让设备做到深度感知和行为认知,进而发现潜在风险的“天眼”,真能在现实中出现吗?创业家&i黑马人工智能系列专题新的一篇,“人工智能创新公司TOP50”榜单参选公司格灵深瞳的“机器之眼”,或许能给你新的启发。i黑马与今日头条-科技联合出品的“人工智能创新公司TOP50”榜单报名持续进行中,AI领域拥有创新原力的公司,请在文末点击“阅读原文”报名,和我们一起唤醒未来!

文丨杨洁

“要了解我们在做什么,我推荐一部美剧,叫做《疑犯追踪》。”格灵深瞳联合创始人、CTO赵勇一本正经地告诉创业家&i黑马。

这并不是一部简单的罪案类美剧。除了悬疑外,其中还加入了极强的科技因素:超级AI。这不是影视剧里常见的和人类非要搞出个你死我活的机器“生物”,而是与人类相互学习、协助破案的异国“天网”。它能把国家每个角落的图像和语音信息整合,自动理解,并把结果深度关联,汇报出潜在的风险。“这正是我们想做的一件事。”赵勇说。

格灵深瞳从事的是计算机视觉和深度学习的技术研发,它的公司slogan就是一句简单的话语:“让计算机看懂世界”。赵勇是美国布朗大学计算机工程系的博士,曾在Google总部研究院担任研究员,同时,他也是Google Glass早期的核心研发成员。2013年,赵勇创办了格灵深瞳。目前,公司研发的皓目行为分析仪已经进入5家大型银行监控系统,威目车辆分析特征识别系统进入某市公安局视频侦查系统。

这是一家颇有些神秘的公司。据说,其中的员工都是来自海内外名校的学霸,要想加入,比考入哈佛难度还高。而这些“极客”们,办公的地点,却是与之形成了极大反差的,颐和园临河古色古香的一所僻静的四合院。也就是在这里,赵勇和创业家&i黑马谈到了自己创业的原由,以及格灵深瞳现在的技术发展目标。

*格灵深瞳联合创始人、CTO赵勇(受访者供图)

计算机视觉和深度学习密不可分

2014年,比尔∙盖茨访华,除了拜访政商界之外,还专门来到了刚成立一年的格灵深瞳,并在这里留下一句评论:“IT界的下一个大事件,是计算机视觉与深度学习的结合。”

如今在百度就职的吴恩达博士,曾参与“谷歌大脑”项目的研发。在2012年,谷歌大脑通过学习了上百万张图片,从中识别出了“猫”,震惊了世界。吴恩达也因此成为全球深度学习领域的顶尖学者。

格灵深瞳的计算机视觉,也与深度学习密切结合。在这里,机器通过学习设备捕捉到的影像,能够识别图像,认知这个世界。

用赵勇的话来说,计算机视觉,简单来说,就是“用计算机来解决视觉问题”。而深度学习作为机器学习中的一种方法,所对应的,实际上就是算法。“深度学习和计算机视觉现在已经是密不可分的了。当然,这并不是说深度学习能够解决计算机视觉里的所有问题。”赵勇说。他举例道,在计算机视觉里,比如几何类型的问题,比如光学的问题,都有其他的解决方法。像自动驾驶里非常重要的怎么获取深度、怎么测量速度、怎么测量障碍物等问题,可以通过激光雷达或者超声波等其他方法解决,这和机器学习并没有什么关系。

“但是我们做人脸识别或者图像等识别时,是和机器学习相关的。如果今机器学习没有进展到深度学习,那么我们今天在很多领域的各种指标,还会处于一个非常原始的状态。”赵勇表示。深度学习和神经网络,正在帮助格灵深瞳研发出自己的智能设备,让它们具备识图能力,并且在安防、自动驾驶和医疗等领域发挥作用。

在赵勇看来,这正是如今人工智能逐渐走向商业化热潮的一大原因。“人工智能现在已经是第三次浪潮,如果说它前两次浪潮有什么区别,我认为,就是技术成熟到了一定程度,更接近实用了,更接近工业界的期待了。机器学习作为一种技能,它已经在不同的领域,如计算机视觉、语音识别的领域,推动它逐渐走向商业化了。现在很多学者离开了实验室,开始创业,为什么?因为他们感觉到,这已经可以产品化了。”

*格灵深瞳公司外景(受访者供图)

十年之后智能化将不能阻挡

“我们是很幸运的。”赵勇说。在2013年,人工智能并没有被很多人所了解,计算机视觉更是个大多数人陌生的领域,但是,那年刚刚诞生的格灵深瞳,仍然罩上了一层光环。

格灵深瞳成立三个月后,就获得了真格基金和联创策源的联合天使投资。2014年格灵深瞳宣布,拿到红杉资本 A 轮数千万美元的投资。业界也曾流传,真格基金徐小平和联创策源创始合伙人冯波对格灵深瞳高估值的传说。

但是,在赵勇的回忆里,那时还是个艰难的时期。当时O2O还大行其道,技术创业并不被重视,那时赵勇和人讲自己的技术语言,基本还没人听得懂,“而且没人在意。很多投资人见到我,只对一个事情感兴趣,就是谷歌眼镜。他们说:你能不能山寨一个谷歌眼镜,能做的话,我就投你;别再讲人工智能,你还没有搞清楚办企业和当大学老师的差别。”赵勇对创业家&i黑马感慨。“当时遭受的主要都是打击。”

2012年,刚刚见到徐小平时,赵勇曾对他说:“现在是1977年。”那是个人电脑开始逐渐成为主流PC代表的时期。而在赵勇看来,当时人工智能的发展,和那个时代的意义差相仿佛。“或许今天我们不能看出哪个公司会成功,但是我想20年后,当人们回过头来评价中国最好人工智能公司的时候,一定是这个时期诞生的。”

“谁能成为未来发展最好的公司,往往是要看,谁能挺过最艰难的时候。”赵勇说。这也是他认为自己“幸运”的原因,在投资人的支持下,格灵深瞳坚持了下去。

这是个投资未来的时机。

当初谷歌眼镜的研发,就是出于探索未来的目的。“未来人和信息连接的入口,到底还是不是手机,这是一个很难辩论的问题。”赵勇说。“当时我们做谷歌眼镜,也是在畅想,如果有一天有一样东西能够代替手机,它会是什么?是不是有一种设备,你在使用它的时候它就已经在你眼前了,而不需要把你的视线从生活中移开来?”

尽管谷歌眼镜最终还是没能获得成功,但是,语音识别、图像识别等,正在逐渐成为新的智能生活交互入口的道路之上。随着算法的进步,大数据的发展,人工智能逐渐站上了风口,尽管人工智能的发展前景仍然无法全面预测,但是智能化,却已成为大势所趋。

“红杉有一个观点是,所有的公司最后都会变成人工智能公司,我觉得是有道理的。”赵勇说。“我们的家庭,我们的个人信息设备、医疗体系、基础设施,所有的东西都会越来越智能化。比如说滴滴,它的前半场是O2O公司,下半场一定是人工智能公司。因为日后最核心的竞争就在于如何把交通出行的效率提到最高,而要达到这个目标,光靠人是不行的,它将需要更智能的体系。”

那么,格灵深瞳涉足的计算机视觉领域,又将会在哪些行业里最先落地爆发呢?安全、汽车、医疗,这是赵勇给出的答案。

格灵深瞳成立之后,首先选择的行业突破口就是安防。这是因为,大多数安防、监控产品,仍然只是图像性的,只能做到实时播放、抓取和存储图像。

“疑犯追踪”虽然只是一部影视作品,但却开启了可想象的未来。安防产品所需要的,也正是能够让设备做到深度感知和行为认知。“如果要我预测的话,三年以内,国内安防的主流产品和顶尖产品,必然是人工智能的。十年之内,国内的摄像头没有完成智能化,我是不相信的。我认为,这个程度至少会达到90%以上。海康、大华等国内安防公司,用十年左右完成了国内安防行业的数字化、网络化,那么十年后,这个行业将迈进人工智能化。”赵勇说。“自动驾驶也是一样。特定环境下的自动驾驶汽车,我认为明年就会出现。但如果是能够在公共道路上行驶的,我认为五六年之内还不太可能出现。但如果是10年之后,如果还是没有,我会感到很惊讶。”

*格灵深瞳威目车辆特征识别系统(受访者供图)

下注安防、汽车和医疗赛道

视频监控在安防领域已经发挥了重要的作用。“天网”的建立,让大多数公共场所的行为信息得到了监控。在北京,现在就已经有了超过200万个摄像头在各处发挥作用。在现在的监控网络下,如果有犯罪行为,是很难做到毫无线索遗留。

而在这些数量巨大的摄像头,摄录的庞大的数据量中,寻找线索也是一件艰巨的任务。当一个人或物体从一个摄像头移动到另外一个摄像头的时候,追踪其踪迹,需要将其从其他图像中,重新识别出来。

格灵深瞳试图打造的,就是一个利用人工智能去分析线索的系统。格灵深瞳推出了威目视图大数据系统,包括威目车辆特征识别系统、威目视频结构化系统、威目视图大数据分析平台三部分。威目车辆分析特征识别系统,它能够做到车辆识别。系统能够辨识超过3000种车辆,它能够识别出车型、车款、颜色、车牌、年检标、遮阳板、纸巾盒、挂件、摆件、安全带等10大特征。对于上路的无牌车、模糊或故意遮挡车牌的车辆,它可以识别车牌的细分特征,并且实现无论白天或黑夜,以及车头、车尾均能自动识别。

假想一下这样的应用场景。当警方提供一张车辆照片,格灵深瞳的威目,可以在交通视频中,寻找到该车辆的行动轨迹。或者当你提供某种车辆的颜色、车型、尾号等信息,它能够通过结构化信息搜索,检测到相关的图像或视频信息。

“这辆车驶过,它是什么颜色的,车牌号码是什么,它的年检标贴了吗?驾驶人是谁,他有没有系安全带,有没有在开车的时候抽烟或者打电话?我们都可以识别出来。”赵勇说。

同时,威目的视频结构化系统能够支持人/车/三轮或二轮车的分类与抓拍,支持车辆和人体的细分特征识别,同时具备人脸识别功能,可以对动态、静态的人脸进行检测和识别。

“今天我们可以做到,在几千个数据库里面搜索一个人,就像谷歌一样可以搜索结果,并且有很高的几率把正确的结果放到比较靠前的位置。”赵勇说。而这样,如果要检索一个人的行动轨迹,那么,以往可能要通过看四五个小时的视频来寻找,而现在,系统可以把符合特征的人在十几分钟内列出。通过人工辅助,确定对象后,通过标签标出关联信息,得到这个人的完整活动轨迹。而这,将使得情报检索的成本大大降低。

安防是格灵深瞳商业化的主要市场。目前,威目车辆识别系统已经在部分地区的公安和交通管理部门开始推广销售。

此外,格灵深瞳还推出了皓目人体行为分析系统。“在小范围内,比如我们几个人,有没有打架,有没有人摔倒,有没有人在不该接近你的时候接近了你,有没有人在面对敏感设备时做了什么事?它可以提供监控分析。”赵勇表示,截止到去年12月份,该系统已经在30多个银行做了试点,并且在中国目前最大的银行之一的总行入围采购名单。

*格灵深瞳皓目行为分析仪(受访者供图)

另外,还有一件需要攻克的事情是,如何将监控镜头中的图像清晰地识别出来。“大多数的时候,摄像头是看不清人脸的。要看清一张脸,在高清摄像头里,人脸距离摄像头的距离也必须要在四五米以内才行。”赵勇介绍。例如,当一个人出现在视频画面里,20米外,他的脸孔就可能还不到18*18个像素,他的模样是无法准确辨别出的。如果要解决这个问题,就需要有一个更加高清分辨率的相机。格灵深瞳寄予厚望的人眼摄像机已经研制成功,并计划在今年十月下旬的北京安博会正式发布,在明年初开始销售。它采用独创的像素动态瞬时分配技术,在距离人体50米外,可以达到数亿级等效像素,展现清晰人脸。

坚信汽车行业未来将被人工智能颠覆的赵勇,在研发了一年多的无人驾驶之后,认为这是个长长的链条,需要引入更多的资源。今年2月,赵勇联合前英特尔研究院院长吴甘沙、国家智能车未来挑战赛前冠军团队负责人姜岩等一同创办了驭势科技,专注于无人驾驶和自动驾驶,为整车厂提供相应方案。“不要急着看产品,时间到了自然会推出。”赵勇笑着回答创业家&i黑马。

医疗图像识别同样是格灵深瞳深入的重点行业。格灵深瞳从消化道窥镜入手,检测息肉腺瘤和肿瘤。“现在我能透露的就这么多了。”赵勇说。

安全、医疗与汽车,“我选择的方向都是和生命息息相关的。”赵勇说。“不是说娱乐、影视等行业不需要人工智能,而是我要做最重要的需求。尤其是,每一种新兴技术,都必须要从2B做起,我们要做的,必须是客户的刚需。”

所有的高新技术,一开始时,必然是成熟度不高,且只能在专业的监督环境下工作,复杂工作场景是它还不能应付的。“这也就决定了,人工智能最先开始的,必然是企业应用。”赵勇说。“第一,它还很贵;第二,它还并不成熟,只能适应单一的环境,在复杂的环境容易出问题。所以它必须得成为某一个客户的刚需,人家才会在它不成熟的时候去应用,而这种客户往往是政府或者是大企业的客户,它们有的需求太强了,必须这么做,而且又不差钱。只有等到技术成熟了,价格降低了,它才可能应用到C端。”

在计算机视觉领域,目前已经存在着众多技术创业公司,其中也不乏明星企业的存在。但赵勇并不担心,行业竞争将会因此爆发。“整个安防行业那么大,光视频这部分每年都有超过1000亿的销售额,在这千亿市场里面,智能化占了多少?我觉得连千分之一可能都不到。我们要怎么每年扩大我们的销售额?我觉得,这才是我们现阶段应该关心的事情。”

而格灵深瞳下一步要专心去做的事,则是如何做到专业化、产品化、让产品落地。“我们以前是更加偏向算法的公司,所以,我们下一步要考虑的是,未来如何跟产业、跟我们的客户、跟销售离得更近一些,把产品设计得离用户的业务系统更近一些。”赵勇说。

在这个人工智能爆发前夜,i黑马与今日头条-科技联合出品,合作多家业界顶级媒体、投资机构,邀请人工智能领域专家、大咖,从专业、以及产业洞察的角度,一起来评选《人工智能创新公司TOP50》榜单。拥有创新原力的人工智能领域公司,快来报名一起“唤醒未来”!

戳链接快速进入报名页面:http://form.mikecrm.com/mnXP6E