免费论文查重: 大雅 万方 维普 turnitin paperpass

阐述计算机用“三只眼”看懂世界

最后更新时间:2024-02-14 作者:用户投稿原创标记本站原创 点赞:21199 浏览:94981
论文导读:
何搏飞走进一栋破旧的居民楼,气喘吁吁地爬上了5层。他来到这里,完全是因为投资人徐小平的劝说:“我最后再向你推荐一个人,你一定要去看看。”
2013年4月,何搏飞辞去了一家美国上市公司中国区总经理的职务。他用几个月的时间在中国寻找创业伙伴,结果却让人失望。当时,他已经做好打算,和这个团队随便聊半个小时,然后就飞去美国硅谷。
何搏飞推开门,看见几个光着上身的年轻人坐在电脑前,整个屋子被各种大小的显示屏围绕。随后,他和团队CTO赵勇从下午两点一直聊到了凌晨两点,就决定加入担任CEO。这家公司的名字叫做“格灵深瞳”。
格灵深瞳是一家计算机视觉和人工智能的技术公司,通过深度数据和机器学习算法让计算机主动获取三维视觉信息,并进行精确的实时智能分析。简单来说,他们想让计算机像人一样,看见并理解这个世界。
“计算机视觉的技术已经存在了几十年,我们想要做第一个将计算机视觉商业化的公司。”何搏飞说。切入智能安防监控领域是格灵深瞳选择将计算机视觉商业化的第一步。今年6月,格灵深瞳获得了红杉资本数千万美元的A轮融资。10月,其智能安防系统开始在国有四大银行中的三大银行进行试点。
格灵深瞳CTO赵勇创业之前在Google工作,是Google Glass的核心研发团队成员之一。Google的工作原则是80/20,员工可以利用20%的时间自由创新。赵勇利用空闲的时间,重新开始研究自己在美国博士期间的研究方向—计算机视觉的人工智能。
计算机视觉过去主要建立在光学镜头采集的二维图像上。光学镜头在生成图像时,会丢失掉一个维度“深度”,只保留长度和宽度。当时人们觉得,通过二维图像加上算法,就能够让计算机看懂世界。但赵勇和他布朗大学的博士导师并不同意这个观点。他们坚持认为,计算机必须要通过三维信号才能够看懂这个世界。因此,他们主张要增加“深度”这一维度的信息。“我们有两只眼睛,就是为了判断深度。人脑比计算机聪明多少倍?人脑进行判断还需要三个维度的信息,计算机只通过两个维度怎么能够准确判断?”何搏飞对《第一财经周刊》说。格灵深瞳的这一代智能安防系统上一共装有3个镜头。一个是和普通安防系统一样的RGB摄像头,另外两个用来发射和接收激光。激光发射镜头能够在1/30秒的时间里发送36万束激光,安防系统借助它们扫描出现实世界的三维立体图像。
这3个镜头就相当于计算机的“眼睛”。格灵深瞳所做的,不仅是给计算机装上“眼睛”,而且给计算机设置了一套“视网膜神经系统”,让计算机能够看懂“眼睛”里出现的东西。
借助机器学习算法,格灵深瞳的系统能够同时分辨多人的运动轨迹和行动速度,并一一精确记录。比如早上8时的北京地铁站,人群正处于早高峰极端拥挤的状态,格灵深瞳可以从中分辨出一个穿红衣服的女孩,精确跟踪她在人群中的行走轨迹。同时,格灵深瞳的系统还能够监测人类肢体的运动幅度和速度,从而精确识别人们的姿势和正在做的事情。
最初,赵勇和团队已经解决了基本的技术理由,但还没有想好商业化应该选择的行业。办公区域前的大黑板上密密麻麻地写着80多条可能的商业化方向,包括安防、教育、医疗等等。这些是格灵深瞳团队的工程师们一个晚上头脑风暴之后的成果。
“你们这是科学家在实验室里想理由的方式。”熟悉商业的何搏飞对赵勇说。“如果格灵深瞳的目标是成为全球最好的计算机视觉和人工智能公司,最需要的是什么?”“海量的数据。”赵勇说。
要获得海量的数据,有两种策略。第一个是像Google街景一样,自己到各地去拍摄采集。另外一种,是通过现成的行业和设备实现。有没有一个行业,已经在所有能够采集数据的地方都装上了摄像头?赵勇和何搏飞同时想到了安防。安防是一个足够大的市场。2013年中国安防市场的复合增长率为30%,销售收入约为4000亿元。美国的摄像头与人口比是1:10,但在中国的北京和上海这个数字还只是1:50。
更难得的是,格灵深瞳的技术正可以解决安防领域目前面对的两个难题—看不见和找不到。一方面,一个安保人员往往要同时负责监看100多个摄像头,随便里面某个摄像头拍摄到突发事件,当时就被监控人员发现的可能性非常小。另一方面,想要查找监控录像中的某一段录像也非常困难,就算快进,一段6个小时的视频也得近1个小时才能看完。而格灵深瞳的智能计算机视觉系统可以很好地解决这些理由。
选择安防领域作为商业化切入口之后,赵勇和何搏飞开始分析市场和客户。他们发现安防系统在机场、火车站、广场等场景应用最多。但场景一多,很多东西就无法制约。他们希望首先找到一个具有高度可复制性的场景,他们将目光投向了银行。“中国的银行几乎都长得一模一样。由于银监会有严格的条例规定,它们的需求也都一样。而且银行本身底子厚,它们有很强的应用安防新技术的动力。”何搏飞告诉《第一财经周刊》。
一开始跟银行谈合作时,何搏飞和赵勇将重点放在了暴力事件的监控和报警上面。但他们发现实际情况并不如自己所想。暴力事件的概率极小,因此在很长一段时间内,格灵深瞳无法向银行展示出产品优势。
银行的工作人员告诉他们,比起外部风险,银行更头疼的是内部风险。银行一直有双人加钞的规定,一个人保管钥匙,一个人保管。但这条规定执行得并不好,就算排班排了两人,也常出现一个人出去抽支烟,另一个人自己加钞的情况。媒体曾经报道有顾客在ATM机中取出过假钞,就是加钞过程中出了理由。
何搏飞和赵勇将这点作为了产品的突破口。经过一段时间的研发,他们的安防监控已经能够确保当ATM机的加钞盖子被打开的时候,必须有两个人在场。甚至当一个人输入时,另一个人没有转过身,系统都能够自动报警。银行长久以来的难题被格灵深瞳解决了,它们开始接受格灵深瞳成为自己的安防合作伙伴。2013年12月,格灵深瞳进入全国网点最多的银行中国农业银行进行无人监控安防测试。2014年10月,格灵深瞳在国有四大银行的三大银行中进行大规模推广试点,测试地区包括北京、重庆等省市。
除了安防,格灵深瞳还曾尝试将计算机视觉应用在消费者购物行为分析上。2013年年底,它进入北京新光天地购物中心进行论文导读:定将精力集中在技术研发上。目前格灵深瞳团队有30多个成员,只有5个不是工程师。何搏飞计划到年底将团队拓展至100人,其中绝大部分还是工程师。“在人力有限的情况下,专注很重要。我们的短期目标是智能安防,但中长期目标是做最好的计算机视觉与人工智能公司。”何搏飞说。上一页12
消费者行为分析测试,取得了不错的测试效果。
尽管格灵深瞳的技术已经可以在多个领域进行商业化应用,但何搏飞和赵勇还是决定将精力集中在技术研发上。目前格灵深瞳团队有30多个成员,只有5个不是工程师。何搏飞计划到年底将团队拓展至100人,其中绝大部分还是工程师。“在人力有限的情况下,专注很重要。我们的短期目标是智能安防,但中长期目标是做最好的计算机视觉与人工智能公司。”何搏飞说。