相关赛道：图像识别搜索引擎人工智能人脸识别机器学习

融资6200万 3分42秒建以图搜图引擎他用人工智能眼取信息助决策

不说谎的创业媒体 2016.11.09 来源: 铅笔道热度: 426

◆ 在微软，黄鼎隆和Matt被同事誉为黄金搭档。

文| 铅笔道记者汪晨

►导语

台上，清华美女工程师晨帆打开了码隆科技研发的ProductAI后台。在她背后，计时器上的数字正在疯狂转动，与她争分夺秒。

但晨帆不做演讲，而是做了一次极客式的挑战展示：5分钟内，用ProductAI建立一个以图搜图搜索引擎。

当晨帆放下鼠标时，计时器上的数字定格在00：03：42，现场观众惊愕。在3分42秒内，一个以图搜图的搜索引擎快速搭建完成。

演示发生在今年10月24日，黄鼎隆、Matt创办的码隆科技在程序员节上召开发布会，宣布获得6200万元A轮融资，并发布ProductAI平台。企业可在平台中搭建以图搜图引擎、使用智能图像识别等服务，并通过API接口置入产品当中。

◆ 黄鼎隆提供的6200万元融资银行打款记录

目前，码隆科技的人工智能图像识别技术能够识别两万个物体，测试环境下比人的识别精准度高8%。“若用人来识别图片信息，为图片打标签，成本将是ProductAI的70倍。”

10月24日的发布会后，申请试用ProductAI的企业超过100家，拥有大客户18家。

注: 黄鼎隆已晒出融资打款记录，且确认文中数据无误，为其真实性负责；铅笔道已备份录音速记，为内容客观性背书。

超过人眼识别成功率的人工智能

苏州街微黄的灯光下，绵绵小雪缓缓落下。在白家大院旁的饭店内，黄鼎隆与刚刚新婚的Matt点了份烤肉，把酒言欢。

在2014年的腊月寒冬里，两人彻夜难眠，兴奋之余不断畅想未来。“现在，计算机能比人类更准确识别图片中的物体属性，我们多年的夙愿也能实现了。”

◆ 黄鼎隆和Matt在发布会后击掌庆祝

夙愿在2010年萌发。此刻，两人仍是微软的一对黄金中外搭档。

在带领团队开发必应词典时，他们为了快速抓取千万量级的词汇，在算法中加入机器学习的代码，不断训练计算机，使它自行提取新词汇。

成效在“犀利哥”一词走红时显现。那时，“犀利哥”尚未有对应的英文词汇，而当外媒造出其英文单词的时候，必应词典第一时间抓取，“比人工编辑的速度要快上许多倍，能节省不少人力。”

但他们不满足于词汇这类的文本信息抓取，而是想挑战识别难度更大的图片识别。

图片当中蕴含信息众多，例如街头店铺、人们穿着的靓丽衣服等。

在识别、提取图像信息后，图片和视频将成为主要的信息输入和输出源头，能够像文字信息一样帮助人们做出决策。

“识别街头店铺后，图片中可以显示店铺地址，给出推荐商品；识别街拍的衣服，或能直接出现购物链接，甚至给出搭配选项。”

但图像识别技术尚未成熟，计算机的图片识别率提升速度缓慢，仍未接近人眼识别水平。“识别成功率的提升幅度每年仅为0.1%左右。”

在2012年的ImageNet大规模图像识别挑战赛上，技术突破到来了。其中一个团队采用深度学习方法，将识别率大幅提升，超出第二名10%以上，识别成功率已接近人眼水平。

◆ 2012年ImageNet图像分类竞赛结果，第一名的错误率降低至0.15315，大幅高出其他参赛小组。

查阅这一技术突破的公开论文后，黄鼎隆和Matt有如醍醐灌顶，仿佛无限的商机扑面而来，不知从何下手。“人脸识别之所以出现多个独角兽，就是因为前两年，机器对人脸识别的精准度超过了人，柔性物体、商品的图像识别技术也理应如此。”

他们决定不再等待。在那次寒冬腊月的烤肉会后，两人离开各自公司（黄鼎隆此时已离开微软，Matt仍在微软留任），研发图像识别技术，并探寻商业化之路。

验证想法

“图片社交OK吗？”

“挺好的方向，但这么多人做了，我们恐怕会被淹没在大海里。”

2014年7月前，黄鼎隆和Matt报名参加科技部主办的中国创新创业大赛，一万家企业来此竞争头名，众多投资人前来评价、筛选项目。

但此时的二人还未定好技术切入口和商业方向，甚至没有注册公司。

“那从服装领域切入怎么样？柔性物体，形态不固定，计算机最难识别，也几乎没人做这件事。”

“OK，服装方向离商业化更近，而且与服装有关的图片是海量的，电商网站上基本都有服装的属性标签，比如说条纹长袖。但我们得在识别技术上狠下一番功夫。”

“不管怎样，我们要挑战一把，这样才能形成足够高的技术壁垒。”

2014年7月，二人正式注册成立码隆科技，决定建立一套视觉决策引擎：先通过图像识别出服装的品类、颜色等属性特征，为图片打上文字标签。此后匹配1-2套合适搭配，并附有网购链接。

此时，距离报名截止只剩一周，加上刚加入的设计师，团队共三人，成为比赛当中人数最少，成立时间最短的团队。

大赛共分为7轮，每一轮选拔中途间隔1-2周时间。第一轮，团队只有PPT，没有实际产品。

但根据评委每一轮给出的具体建议，他们成功研制出成形的产品，并杀入互联网行业组总决赛。

中途，他们需要不断调试识别算法可能的变量，让计算机的视觉认知接近人类。“它得知道那是什么颜色的包、什么风格的裙子，就像带小孩一样，一步步地教。”

决赛上，黄鼎隆和Matt上台合力演讲。展示出的产品可通过图片识别高圆圆街拍中的包、裙子，并搜索出同款。最终，他们拿到了该行业组竞赛的总冠军。

随之而来的是投资人的青睐。2015年2月，码隆科技获得1200万元天使轮投资，投资方为达晨创投、远镜创投。

不过，在黄鼎隆和Matt心中，这项技术的验证阶段还未结束，市场是否接受尚未可知。他们需要先做出一款终端软件产品，验证这项技术的大众接受度。

今年年初，StyleAI App正式上线。用户除了图片搜同款，还能显示出配套的穿搭方案，网购链接暗含其中。“没有做任何推广的情况下，在苹果商店中搜索人工智能，StyleAI App排在前二名。”

◆ StyleAI中的找同款界面

技术开放共用

对于图像识别技术的未来前景，黄鼎隆更愿意用变形金刚中的能量块来形容。“一个微波炉、一台车本身是普通机械，但植入能量块后会被赋予智能，给它们带来无限可能性，我们也想让码隆科技的技术达到这一状态。”

StyleAI远未达到这样的状态。在黄看来，App的推广成本高昂，且技术未开放，无法快速让大众受用。“很多人还说StyleAI与其余导购App类似，会与他们产生竞争。”

具体切入点在哪？来自大客户的需求启发了他和Matt。

码隆科技曾为蒙牛的H5营销页面提供技术支持。在“嗨Milk”公众号中，用户拍下蒙牛的牛奶盒子后，计算机识别牛奶盒子，可显示出AR视频效果。“这一营销方案的转化率有30%之高。”

此外，众多大企业希望将图像识别技术应用在多个领域，例如内部搜索引擎、营销、大数据分析、视频内容审查（鉴黄鉴恐）等。需求之多，让团队应接不暇，也给了他们做技术开放平台的信心。

StyleAI上线后，团队便开始调试算法，以识别刚性物体（形状较固定的物体），提高识别物体的覆盖度。

同时，黄与许多拥有图片、视频数据的企业约谈，愿意为他们提供定制化的技术服务。今年10月前，码隆科技已与18家大企业达成合作，为它们提供定制服务。

10月24日，网络流传的码农节，码隆科技正式发布了ProductAI平台。他们打算将此前的图像识别技术应用场景标准化，统一至该企业平台当中，开放给中小企业使用。

◆ ProductAI搭建以图搜图引擎的后台界面

由此，中小企业可在平台中自助搭建API端口，上传图集、自动打标签，定制以图搜图引擎等标准化功能，接入自己的产品当中。

发布会上，清华美女程序员晨帆展示了以图搜图引擎的搭建过程。原本计划5分钟内搭建的以图搜图搜索引擎，在3分42秒内就建立完成。

◆ 3分42秒内，美女工程师就将以图搜图引擎搭建完成。

搭建中途，图像当中的物体、风格均被自动打上标签。“我们测试的情况是，机器打标签的精准度比人还高，成本是人工打标签的1/70。”

大客户可根据自己的需求定制更为复杂的应用场景，例如在视频播放时实时识别明星同款、根据用户所选商品自动识别用户画像等。

收费上，ProductAI根据API调用次数收费。针对大客户的定制化服务，则根据项目难易度等因素收取费用。

目前，码隆科技的人工智能图像识别技术能够识别两万个物体，测试环境下比人的识别精准度高8%。在10月24日的发布会后，申请试用的企业超过100家，拥有大客户18家。

/The End/

编辑韩正阳校对洪佳添

求报道

请加pencil-news为好友

融资6200万 3分42秒建以图搜图引擎 他用人工智能眼取信息助决策

融资6200万 3分42秒建以图搜图引擎他用人工智能眼取信息助决策