2022-08-01 09:50:09 +08:00
|
|
|
|
\chapter{开源机器学习平台概述}
|
|
|
|
|
|
|
|
|
|
\section{平台介绍}
|
|
|
|
|
随着人工智能(artificial intelligent,AI)技术的不断发展,各种AI产品已经逐步进入了我们的生活。但是局限专业知识,非AI开发人士无法快速、简单地了解AI知识、使用AI产品。
|
|
|
|
|
AI平台以深度学习技术研究和业务应用为基础,集深度学习核心框架、基础模型库、端到端开发套件、工具组件和服务平台于一体, 是全面开源开放、技术领先、功能完备的产业级深度学习平台。AI平台源于产业实践,始终致力于与产业深入融合。
|
|
|
|
|
|
|
|
|
|
\section{功能介绍}
|
2022-08-30 12:16:02 +08:00
|
|
|
|
本平台主要包含\textbf{开放能力}、\textbf{实践平台}、\textbf{知识学习}三个模块。其中开发平台集成了主流深度学习工具的开发接口,开放能力集成了多领域的端到端的模型训练和预测服务,知识学习模块包含了当下主流的机器学习算法的介绍,例如:算法描述、优点、缺点、适用范围、实现方法、应用场景等。
|
2022-08-01 09:50:09 +08:00
|
|
|
|
\subsection{开放能力}
|
|
|
|
|
平台开放的能力包含了当下主流的可供学习使用的机器学习任务,涉及智能图像处理、自然语言处理、智能语音等多领域多方面的服务,可以让用户根据自身需要,依据自己的数据获得端到端的AI模型服务。\\
|
|
|
|
|
\indent 用户可以依据当前的进行该任务所选择的机器学习算法进行自主调节参数,用户在选择完参数之后可以自主决定是否选择上传本地的训练数据文件,如果选择上传,则会依据上传的数据文件训练模型,如果不选择上传,则会使用平台默认的数据文件进行训练。在参数和文件全部输入完毕后,用户点击“训练开始”即可开始训练模型。在模型训练完毕后,则会给出模型相应的性能指标。
|
|
|
|
|
各模块集成的模型如下:
|
|
|
|
|
\subsubsection{回归预测模块}
|
|
|
|
|
回归预测模块包含海浪高度预测、波士顿房价预测、碳排放预测和股票预测四个基础功能,并提供端到端的训练功能。
|
|
|
|
|
\subsubsection{智能图像模块}
|
|
|
|
|
智能图像模块包含MNIST手写体分类、汽车目标检测、智能图像分割、人体关键点检测、智能图像生成、图片文字识别等基础模型,用户可以在相应模块下上传图片,获得预测结果。
|
|
|
|
|
\subsubsection{自然语言处理模块}
|
|
|
|
|
自然语言处理模块(Natural Language Process,NLP)深度整合了顶级的NLP技术,包括文本情感分类、机器翻译、智能阅读理解、语义匹配、对话系统、文本生成、句法分析等模块,主要利用Transformer模型建模,提供端到端的预测服务。
|
|
|
|
|
\subsubsection{智能语音模块}
|
|
|
|
|
智能语音模块包含智能语音合成(Text To Speech, TTS)和智能语音识别(Automatic Speech Recognition,ASR)功能,智能语音合成将用户输入的文本合成成音频,智能语音识别则可以将用户上传的语音中的文字识别出来。
|
2022-08-30 12:16:02 +08:00
|
|
|
|
\subsection{实践平台}
|
|
|
|
|
考虑到真实应用场景的个性化需求,在实践平台上,针对一些典型任务,进行了代码层面的建模示例。用户可以根据平台代码给出的训练模型的框架中,基于自己的实际数据进行本地化建模、训练和应用。在实践平台中,我们主要提供了基于PyTorch, Tensorflow以及其他一些经典模型或框架进行机器学习和深度学习模型训练的详细教程,包括数据预处理、模型搭建、参数调整,希望能给予用户一站式建模体验。
|
2022-08-01 09:50:09 +08:00
|
|
|
|
\subsection{知识学习}
|
|
|
|
|
知识学习模块主要包含了对主流的监督学习、无监督学习、半监督学习、强化学习等不同机器学习、深度学习方法的讲解。用户可以在该模块了解传统机器学习和前沿模型的建模思路和特点,以便于在自己建模时选择合适的模型。
|