常见的AI模型开发平台
一、简介
近些年来,各大IT公司在人工智能领域投入了大量的开发,开源了Pytorch、Tensorflow、PaddlePaddle等深度学习库。
为了提高开发效率,IT公司在深度学习库的基础上,开发了一系列的AI模型开发平台,包含了深度学习模型开发、训练、部署、应用的全流程,同时开源了包含图像、语音、NLP等领域的预训练模型。
通过使用这些开源平台和开源模型,可以大幅度提高开发效率。
国外平台:OpenVINO(英特尔)、TensorRT(英伟达)、Mediapipe(谷歌)、Azure AI(微软)
国内平台:OpenMMLab、百度AI开放平台、讯飞开放平台、腾讯AI开放平台
二、OpenVINO(英特尔)
OpenVINO官网为英特尔® 发行版 OpenVINO™ 工具套件 (intel.cn);开发文档为Interactive Tutorials (Python) — OpenVINO™ documentation — Version(2022.3),开发文档中有许多demo。
可以通过pip install openvino
进行安装。
支持Pytorch、Tensorflow、PaddlePaddle等深度学习库。
二、Mediapipe(谷歌)
MediaPipe 是一款由 Google Research 开发并开源的多媒体机器学习模型应用框架。在谷歌,一系列重要产品,如Google Lens、ARCore、Google Home都已深度整合了 MediaPipe。
MediaPipe 不仅可以被部署在服务器端,更可以在多个移动端 (安卓和苹果 iOS)和嵌入式平台(Google Coral 和树莓派)中作为设备端机器学习推理 (On-device Machine Learning Inference)框架。
Mediapipe官网为MediaPipe Studio (google.com),官网提供了有许多demo,开发过程特别简单。
可以通过pip install mediapipe
进行安装。
支持Tensorflow更多一些,其他的深度学习库也支持。
三、Ultralytics
Ultralytics 是一家专注于视觉人工智能领域的公司,致力于将图像转化为有用的人工智能见解。他们提供了一个无代码平台,用户可以通过简单的拖放操作来训练和部署强大的人工智能模型。。
Ultralytics 的核心产品是 Ultralytics YOLO,这是一个智能工具,它能够进行图像分类、物体检测和实例分割。该公司比喻这个工具就像哈佛大学的学生——高智商,永远渴望学习。只需创建课程表,它就能成长¹。
此外,Ultralytics 还提供了 Ultralytics HUB,这是一个云培训平台,用户可以在上面上传图像数据集,选择或创建 ML 模型进行训练,并将模型部署到现实世界中¹。
其中价值较大的是Ultralytics YOLO,提供了目标检测、实例分割、分类、人体关键点检测等功能。
四、OpenMMLab
OpenMMLab 是一个开源的算法体系,旨在为计算机视觉领域的重要方向创建统一且开源的代码库。该项目由 MMLab(香港中文大学多媒体实验室)和商汤科技于2018年年中联合启动。
目前已陆续开源30多个视觉算法库,实现了300多种算法,并包含2000+预训练模型,涵盖2D/3D目标检测、语义分割、视频理解、姿态分析等多个方向。
OpenMMLab 的目标是推进可复现算法生态的建立,为计算机视觉领域的学术研究和工业应用提供支持。
最大的优势是算法的模块化,可以用来快速搭建自己的模型。
五、其他平台
国内平台,比如百度AI开放平台、讯飞开放平台、腾讯 AI 开放平台,一般只提供API,在有网络的情况下还是可以使用的,此外对于快速搭建产品原型也很有帮助。
其中百度AI开放平台和讯飞开放平台的在线语音识别与合成API较为好用。
Azure AI(微软)也是提供了在线API。
TensorRT(英伟达)现价段开发文档不全,部署较为困难,不推荐使用。