随着AI技术的普及应用,图像识别、人脸识别等算法应用是目前AI企业发力的方向。对其中的芯片厂商来说,加强算法领域的部署,也是建设软硬一体化解决方案的关键。近日,嘉楠先后公布其研发的人脸口罩检测模型和活体检测算法模型,迈出了探索软硬一体化端侧AI解决方案的重要一步。
打造设备级AI解决方案
疫情期间,佩戴口罩人脸的检测成了AI厂商的突破口之一。百度、阿里云和腾讯优图等多家厂商均上线了人脸检测的“口罩版本”。可以发现的是,在目前智能化抗疫的应用中,很多是基于云端研发的平台级解决方案。
云端平台通常需要下游厂商以API接口方式获取服务,并实现在智能楼宇、智能园区等场景的部署。虽然目前主流平台选择免费开放“人脸口罩”API,但对于非云用户的企业而言,要想应用模型就需要进行云平台的部署。同时,对用云企业而言,要想实现更多模型的应用则需要购买服务,长期付费抬高了运营成本。
这种情况下,加强算法软实力,打造设备级AI解决方案就成了芯片厂商的突围方向。
作为一家AI芯片厂商,嘉楠在坚持芯片研发的同时,不断加大对算法研发的投入。近日,嘉楠就先后公布了其研发的人脸口罩检测模型和活体检测模型。
根据公开资料,嘉楠人脸口罩模型的主要原理是通过使用Mobilenet-YOLO进行目标检测,并据此判断用户佩戴口罩的情况。据介绍,该模型最多可一次性检查30张口罩人脸,可以满足办公区域、车站等人流密集型场景对口罩人脸的检测需求。
活体检测则是人脸识别的升级版本。嘉楠本次研发的人脸活体检测模型采用了多模态(可见光+近红外)人脸特征融合的方法进行判断,即可见光人脸和近红外人脸先通过嘉楠自研的轻量化卷积神经网络提取特征图,然后采用“SE Block”方式reweighting后进行融合。
嘉楠研发人员介绍,该模型可有效抵挡视频、工卡、照片(单一背景、复杂背景、抠除五官)、屏幕翻拍等常见的攻击手段。
对于此次公布的两个算法模型,嘉楠表示将积极推进其在设备端的部署和应用。这些由嘉楠研发的算法模型可以无缝集成到其AI芯片中,并作为软硬一体化的解决方案一次性交付给企业客户,开箱即用。
软硬一体化是趋势
AI的真正落地离不开设备的智能化,其中的核心器件就是芯片。事实上,主流的算法厂商都试图建立在芯片领域的影响力,通过自研芯片以完全兼容自己的深度学习框架。谷歌就是最明显的一例。同时,无论Nvidia还是Intel,芯片巨头也纷纷通过投资或研发的方式布局算法领域。可以说,“软硬一体化”是所有AI厂商的发展趋势。
值得注意的是,搭载本次人脸口罩检测模型的模块是PaddlePi-K210。公开资料显示,该模块是去年5月由嘉楠与百度联合发布的终端运算产品。PaddlePi-K210是嘉楠为百度边缘侧应用开发的定制版本,也是首款打通百度PaddlePaddle模型设备端部署解决方案的硬件。
PaddlePi-K210的核心是嘉楠自主研发的AI芯片勘智K210。K210内置专门处理视觉任务的计算模块KPU,可以实现图像分类、人脸识别及检测、目标检测等功能。在QVGA网络输入下,该芯片80类目标检测模型帧速率可达到35帧/秒,能够满足大多数应用场景的需求。
去年9月,阿里云栖大会发布向量化RISC-V TinyML算法模型,嘉楠勘智K210也因兼容其最新TinyML算法模型而意外亮相。
这些都印证了嘉楠在巨头端侧AI生态中的独特地位。根据公开资料,嘉楠已经与包括百度在内的30家海内外算法厂商达成合作,共同研发软硬件解决方案。
嘉楠一方面通过合作进入巨头端侧AI生态,另一方面则博采众长推进AI算法模型的研发和对终端的适配。通过加快算法建设,补齐软件短板,嘉楠将为客户带来更优的AI解决方案。