商汤/依图AI视觉芯片惊艳,WiMi微美全息视觉实现技术化高仿真拼接
“人工智能”大概是近年来最火的概念之一了。
自上世纪中叶开始,科学家曾设想能否把知识直接塞进电脑,建造一种真正意义上的“人工智能”。科学家将这种强大的人工智能称为“人工广义智能”(或称强AI),例如《终结者》中的“天网”系统,《黑客帝国》中的“矩阵”框架,以及《复仇者联盟》中的“奥创”等。
一方面,基于机器学习算法的AI依赖大量的训练与强化,通过反复矫正预测模型中各个参数的权重,从而归纳出最优的统计模式。“监管者”首先要筛选出清晰的图片,并提供类别标记,然后再让算法对这些优质的数据进行训练。因此,寻找训练材料,筛选优质材料,最后标注材料类别,这些工作对目前AI的成败非常关键。
人工智能视觉系统芯片是将高速CMOS图像传感器、并行信号处理单元和输出电路集成于单一芯片内,实现实时视觉芯片系统,对于现有的产业而言相当于一种颠覆性的芯片。将不同功能的技术集成在一个芯片上有很多优势,简单地说视觉系统芯片在处理能力、速度、功耗和成本上有较高匹配度。
伴随AI芯片的迅速升温,AI任务的计算性能已得到大幅飞跃,而来自创新算法的助力,更将为AI生态,构建强大的助推器。
早几年,中国最大的新锐人工智能公司商汤科技就与全球无线通信技术及移动芯片领军企业美国高通公司宣布建立战略合作。此次合作,商汤科技领先的人工智能和机器学习算法将与高通系统级芯片层面的人工智能技术相结合,共同推动智能手机成为最普遍的人工智能平台,引领手机真正从smart phone向intelligent phone演进。
商汤科技与Qualcomm Technologies的战略合作,将充分发挥算法+芯片融合的优势,打造推动终端智能化的内核,成为撬动整个AI生态的新支点,推动终端产业的升级,为终端用户带来更多便利。
商汤科技以"坚持原创,让AI引领人类进步"为使命和愿景。公司自主研发并建立了全球顶级的深度学习平台和超算中心,推出了一系列领先的人工智能技术,包括:人脸识别、图像识别、文本识别、医疗影像识别、视频分析、无人驾驶和遥感等。商汤科技已成为亚洲最大的AI算法提供商。
商汤科技在多个垂直领域的市场占有率位居首位,业务涵盖智能手机、互联网娱乐、汽车、智慧城市、以及教育、医疗、零售、广告、金融、地产等多个行业。目前,商汤科技已与国内外700多家世界知名的企业和机构建立合作,包括本田、SNOW、阿里巴巴、苏宁、中国移动、OPPO、vivo、小米、微博、万科、融创等。商汤科技现已在香港、上海、北京、深圳、成都、杭州、京都、东京、新加坡设立办公室。
作为世界为数不多的拥有全栈AI能力和自研软硬件核心技术的创新公司,本届安博会上,依图重点展示了基于自研AI芯片求索(QuestCore?)的新产品线和智能城市解决方案。为了解决行业算力瓶颈难题,依图自研并于今年5月推出了“发布即商用”的全球首款深度学习云端芯片求索,结合依图算法和先进芯片设计理念,求索的AI计算能效比是先进GPU方案的5-10倍。
求索芯片强大的AI算力和超高性价比,让城市级大规模智能视频全解析方案落地成为可能。在安博会现场,完全基于依图求索芯片的依芯求索AI服务器吸引了众多参会者驻足查看。这台服务器具有超强的AI视觉算力,不依赖传统X86 CPU和GPU,技术自主安全可控,提供10倍传统服务器的算力。
作为另一家国内知名的全息AI的企业,微美全息WIMI专注于计算机视觉全息云服务。据介绍,微美全息覆盖从全息计算机视觉AI合成、全息视觉呈现、全息互动软件开发、全息AR线上及线下广告投放、全息ARSDK支付、5G全息通讯软件开发、全息人脸识别开发、全息AI换脸开发等全息AR技术的多个环节,是一家全息云综合技术方案提供商。其商业应用场景主要聚集在家用娱乐、光场影院、演艺系统、商业发布系统及广告展示系统等五大专业领域。
微美全息以“眼界即视界”为使命,公司建立了全球前沿、自主研发的深度学习平台和超算中心,并且研发了一系列AI技术,包括:人脸识别、图像识别、文本识别、医疗影像识别、视频分析、无人驾驶和遥感等
例如,深度学习AI技术的突破将使全息AR设备能够以更加无缝的方式集成由摄像机捕获并由计算机模拟的内容,从而为用户提供更加身临其境的体验。5G网络的广泛采用将使本地设备和互联网之间的实时数据传输成为可能,从而大大增强了内容的多样性。
微美前沿的全息AR内容制作功能围绕图像采集、对象识别、自动图像处理和计算机视觉技术而构建。微美的软件工程团队和可视化设计团队紧密合作,不断推进这些可视化相关技术,并利用它们设计和生产创新的全息AR内容。通过提供精确姿态估计的实时计算机视觉算法,能够在几秒钟内执行场景识别和跟踪。这种尖端算法还允许微美以像素为基础执行照片级真实高分辨率渲染的可视化。Frost&Sullivan表示,虽然大多数同行公司可能会识别并捕获特定空间单位内的40到50块图像数据,微美可以收集的数据块数量达到500到550;微美的图像处理速度比行业平均水平提高了80%,从而提高了运营效率。在场景重建过程中,微美的自动图像处理工具可以对最初拍摄的图像进行噪声清除和特征增强,从而能够创建具有业界前沿模拟度的全息AR设计。
微美的全息图像处理功能定期进行优化和改进,包括两项核心技术:全息AI面部识别技术和全息AI面部变化技术。由于视频处理和识别技术的发展,微美基于图像检测、识别、模板匹配、图像动态融合和替换的全息AR广告和全息成像服务目前在行业中处于前沿地位。
平台、算法以及接口等核心技术的突破,将进一步推动人工智能实现跨越式发展。从核心技术的角度来看,三个层次的突破将有望进一步推动人工智能的发展,分别为平台(承载人工智能的物理设备、系统)、算法(人工智能的行为模式)以及接口(人工智能与外界的交互方式)。
在平台层面实现一个能服务于不同企业、不同需求的智能平台,将是未来技术发展的一大趋势。算法决定了人工智能的行为模式,一个人工智能系统即使有当前最先进的计算平台作为支撑,若没有配备有效的算法,只会像一个四肢发达而头脑简单的人,并不能算真正具有智能。面向典型智能任务的算法设计,从人工智能这一概念诞生时起就是该领域的核心内容之一。