融资6200万 3分42秒建以图搜图引擎 他用人工智能眼取信息助决策

在微软,黄鼎隆和Matt被同事誉为黄金搭档。


文| 铅笔道 记者 汪晨


导语


台上,清华美女工程师晨帆打开了码隆科技研发的ProductAI后台。在她背后,计时器上的数字正在疯狂转动,与她争分夺秒。


但晨帆不做演讲,而是做了一次极客式的挑战展示:5分钟内,用ProductAI建立一个以图搜图搜索引擎


当晨帆放下鼠标时,计时器上的数字定格在00:03:42,现场观众惊愕。在3分42秒内,一个以图搜图的搜索引擎快速搭建完成。


演示发生在今年10月24日,黄鼎隆、Matt创办的码隆科技在程序员节上召开发布会,宣布获得6200万元A轮融资,并发布ProductAI平台。企业可在平台中搭建以图搜图引擎、使用智能图像识别等服务,并通过API接口置入产品当中。


黄鼎隆提供的6200万元融资银行打款记录


目前,码隆科技的人工智能图像识别技术能够识别两万个物体,测试环境下比人的识别精准度高8%。“若用人来识别图片信息,为图片打标签,成本将是ProductAI的70倍。”


10月24日的发布会后,申请试用ProductAI的企业超过100家,拥有大客户18家。




注: 黄鼎隆已晒出融资打款记录,且确认文中数据无误,为其真实性负责;铅笔道已备份录音速记,为内容客观性背书。

超过人眼识别成功率的人工智能


苏州街微黄的灯光下,绵绵小雪缓缓落下。在白家大院旁的饭店内,黄鼎隆与刚刚新婚的Matt点了份烤肉,把酒言欢。


在2014年的腊月寒冬里,两人彻夜难眠,兴奋之余不断畅想未来。“现在,计算机能比人类更准确识别图片中的物体属性,我们多年的夙愿也能实现了。”


黄鼎隆和Matt在发布会后击掌庆祝


夙愿在2010年萌发。此刻,两人仍是微软的一对黄金中外搭档。


在带领团队开发必应词典时,他们为了快速抓取千万量级的词汇,在算法中加入机器学习的代码,不断训练计算机,使它自行提取新词汇。


成效在“犀利哥”一词走红时显现。那时,“犀利哥”尚未有对应的英文词汇,而当外媒造出其英文单词的时候,必应词典第一时间抓取,“比人工编辑的速度要快上许多倍,能节省不少人力。”


但他们不满足于词汇这类的文本信息抓取,而是想挑战识别难度更大的图片识别。


图片当中蕴含信息众多,例如街头店铺、人们穿着的靓丽衣服等。


在识别、提取图像信息后,图片和视频将成为主要的信息输入和输出源头,能够像文字信息一样帮助人们做出决策。


“识别街头店铺后,图片中可以显示店铺地址,给出推荐商品;识别街拍的衣服,或能直接出现购物链接,甚至给出搭配选项。”


但图像识别技术尚未成熟,计算机的图片识别率提升速度缓慢,仍未接近人眼识别水平。“识别成功率的提升幅度每年仅为0.1%左右。”


在2012年的ImageNet大规模图像识别挑战赛上,技术突破到来了。其中一个团队采用深度学习方法,将识别率大幅提升,超出第二名10%以上,识别成功率已接近人眼水平。


2012年ImageNet图像分类竞赛结果,第一名的错误率降低至0.15315,大幅高出其他参赛小组。


查阅这一技术突破的公开论文后,黄鼎隆和Matt有如醍醐灌顶,仿佛无限的商机扑面而来,不知从何下手。“人脸识别之所以出现多个独角兽,就是因为前两年,机器对人脸识别的精准度超过了人,柔性物体、商品的图像识别技术也理应如此。”


他们决定不再等待。在那次寒冬腊月的烤肉会后,两人离开各自公司(黄鼎隆此时已离开微软,Matt仍在微软留任),研发图像识别技术,并探寻商业化之路。

验证想法


“图片社交OK吗?”


“挺好的方向,但这么多人做了,我们恐怕会被淹没在大海里。”


2014年7月前,黄鼎隆和Matt报名参加科技部主办的中国创新创业大赛,一万家企业来此竞争头名,众多投资人前来评价、筛选项目。


但此时的二人还未定好技术切入口和商业方向,甚至没有注册公司。


那从服装领域切入怎么样?柔性物体,形态不固定,计算机最难识别,也几乎没人做这件事。”


“OK,服装方向离商业化更近,而且与服装有关的图片是海量的,电商网站上基本都有服装的属性标签,比如说条纹长袖。但我们得在识别技术上狠下一番功夫。”


“不管怎样,我们要挑战一把,这样才能形成足够高的技术壁垒。”


2014年7月,二人正式注册成立码隆科技,决定建立一套视觉决策引擎:通过图像识别出服装的品类、颜色等属性特征,为图片打上文字标签。此后匹配1-2套合适搭配,并附有网购链接。


此时,距离报名截止只剩一周,加上刚加入的设计师,团队共三人,成为比赛当中人数最少,成立时间最短的团队。


大赛共分为7轮,每一轮选拔中途间隔1-2周时间。第一轮,团队只有PPT,没有实际产品。


但根据评委每一轮给出的具体建议,他们成功研制出成形的产品,并杀入互联网行业组总决赛。


中途,他们需要不断调试识别算法可能的变量,让计算机的视觉认知接近人类。“它得知道那是什么颜色的包、什么风格的裙子,就像带小孩一样,一步步地教。”


决赛上,黄鼎隆和Matt上台合力演讲。展示出的产品可通过图片识别高圆圆街拍中的包、裙子,并搜索出同款。最终,他们拿到了该行业组竞赛的总冠军。


随之而来的是投资人的青睐。2015年2月,码隆科技获得1200万元天使轮投资,投资方为达晨创投远镜创投


不过,在黄鼎隆和Matt心中,这项技术的验证阶段还未结束,市场是否接受尚未可知。他们需要先做出一款终端软件产品,验证这项技术的大众接受度。


今年年初,StyleAI App正式上线。用户除了图片搜同款,还能显示出配套的穿搭方案,网购链接暗含其中。“没有做任何推广的情况下,在苹果商店中搜索人工智能,StyleAI App排在前二名。”


StyleAI中的找同款界面

技术开放共用


对于图像识别技术的未来前景,黄鼎隆更愿意用变形金刚中的能量块来形容。“一个微波炉、一台车本身是普通机械,但植入能量块后会被赋予智能,给它们带来无限可能性,我们也想让码隆科技的技术达到这一状态。”


StyleAI远未达到这样的状态。在黄看来,App的推广成本高昂,且技术未开放,无法快速让大众受用。“很多人还说StyleAI与其余导购App类似,会与他们产生竞争。”


具体切入点在哪?来自大客户的需求启发了他和Matt。


码隆科技曾为蒙牛的H5营销页面提供技术支持。在“嗨Milk”公众号中,用户拍下蒙牛的牛奶盒子后,计算机识别牛奶盒子,可显示出AR视频效果。“这一营销方案的转化率有30%之高。”


此外,众多大企业希望将图像识别技术应用在多个领域,例如内部搜索引擎、营销、大数据分析、视频内容审查(鉴黄鉴恐)等。需求之多,让团队应接不暇,也给了他们做技术开放平台的信心。


StyleAI上线后,团队便开始调试算法,以识别刚性物体(形状较固定的物体),提高识别物体的覆盖度。


同时,黄与许多拥有图片、视频数据的企业约谈,愿意为他们提供定制化的技术服务。今年10月前,码隆科技已与18家大企业达成合作,为它们提供定制服务。


10月24日,网络流传的码农节,码隆科技正式发布了ProductAI平台。他们打算将此前的图像识别技术应用场景标准化,统一至该企业平台当中,开放给中小企业使用。


ProductAI搭建以图搜图引擎的后台界面


由此,中小企业可在平台中自助搭建API端口,上传图集、自动打标签,定制以图搜图引擎等标准化功能,接入自己的产品当中。


发布会上,清华美女程序员晨帆展示了以图搜图引擎的搭建过程。原本计划5分钟内搭建的以图搜图搜索引擎,在3分42秒内就建立完成。


3分42秒内,美女工程师就将以图搜图引擎搭建完成。


搭建中途,图像当中的物体、风格均被自动打上标签。“我们测试的情况是,机器打标签的精准度比人还高,成本是人工打标签的1/70。”


大客户可根据自己的需求定制更为复杂的应用场景,例如在视频播放时实时识别明星同款、根据用户所选商品自动识别用户画像等。




收费上,ProductAI根据API调用次数收费。针对大客户的定制化服务,则根据项目难易度等因素收取费用。


目前,码隆科技的人工智能图像识别技术能够识别两万个物体,测试环境下比人的识别精准度高8%。在10月24日的发布会后,申请试用的企业超过100家,拥有大客户18家。


/The End/

编辑   韩正阳    校对  洪佳添


求报道

请加pencil-news为好友