华捷艾米戚胜刚:真正的3D视觉是感知环境

因为有了视觉我们才能看见世界,才能更好地进行互动交流。据调查统计,人与外界交互的信息约80%通过眼睛得到。在现代社会,随着科技的发展,为了让机器能更好的为人类服务,给机器安装上眼睛,让其拥有视觉无疑是一个很好的思路。

基于这样的思路,国内的华捷艾米已经在计算机视觉乃至AI+AR领域取得非常不错的突破。

资料显示,华捷艾米是一家专注于计算机3D视觉、人机智能交互及3D MR混合现实技术的人工智能企业,经过八年的技术积累,拥有全套计算机3D视觉算法、自主芯片及终端硬件产品,是中国第一家可提供3D视觉及3D MR全面解决方案的高科技公司,成功打破了苹果、微软、技术垄断。

华捷艾米在人工智能商业落地方面也卓有成效,新零售、智能家居、消费电子、MR等领域都有诸多成功案例。客户及合作伙伴涵盖腾讯、阿里巴巴、华为、中兴、小米、OPPO、vivo、科大讯飞、三星、Qualcomm、Intel。三大电信运营商、创维、海信、TCL等。目前已申请各项专利100余项,并包括多项美国专利。

日前,在由芯智讯主办的2018年生物识别技术与应用高峰论坛期间,华捷艾米市场总监戚胜刚就3D视觉技术以及华捷艾米在AI领域的整体布局接受了全球半导体观察的采访。

戚胜刚表示,目前华捷艾米主要关注三个领域:第一,3D视觉;第二,人机智能交互;第三,MR混合现实。这其中就会涉及到手势识别、3D骨架识别、3D人脸识别、人物抠像、手柄枪等算法,而华捷艾米则是国内唯一一家拥有全套核心算法的公司。也是唯一一家同时拥有3D SLAM和3D骨架算法的公司。同时还有自研的MR芯片。

戚胜刚指出,3D骨架算法是人工智能3D机器视觉的核心技术,是MR混合现实的基础,在各行各业具有广阔的应用前景,如:MR社交、新零售、人机交互、消费电子、自动驾驶、异常行为监控等。

据介绍,目前3D骨架算法存在空间分割、人体部位分类、辨识人、锁定并追踪人、找出可动物体、建立骨架这六大难点。华捷艾米的3D骨架算法花了八年左右的时间,才功课了这些难点。同时,与目前流行的彩色骨架算法,拥有稳定性高、交互效果好、运算量小、支持人物锁定和追踪、识别误差小(毫米级)等众多优势。

戚胜刚透露,3D骨架算法的门槛较高,理论获取难度大,资金成本至少3亿,时间成本数年。因此,中小企业基本不可能在此领域有所作为;而大企业立项困难,且资源分散,难以专注于3D骨架研发。另外,在行业解决方案应用中,只有强大的芯片支撑,才能实现系列算法联动;只有专用芯片能实现实时3D机器视觉。要想实现实时3D机器视觉,必须要专用芯片。而在这方面,华捷艾米也是有着自己的芯片。所以优势比较大,应用前景也比较广泛。

至于华捷艾米为什么要研发3D骨架算法?戚胜刚表示,主要是为真正的3D视觉准备,真正的3D视觉不是说准确识别图片就可以了,而是要识别环境。

而识别环境有两点很重要,第一,认识人,以及这个人所处的环境状况,这需要识别出来,需要知道如何在这个环境里面进行导航;第二,芯片的支撑,算法再能跑,如果没有专用芯片的支撑,在环境感知的速度上也是有问题的。

戚胜刚认为,目前来说,全球范围来看,除了苹果和微软,华捷艾米的3D骨架算法算是真正的自主研发。因为苹果和微软在中国市场适配能力有限,所以华捷艾米能为客户提供更多更本土化的支持。

戚胜刚进一步表示,3D骨架是整个人体行为的基础,是实现真正3D机器视觉的前提,3D骨架算法的应用范围涵盖MR社交、新零售、人机交互、消费电子等等领域,应用广阔,而华捷艾米的所有努力就是让机器能够感知环境,实现这正的人工智能。

来源:全球半导体观察

0

付费内容

查看我的付费内容