使用S计划Model S训练会不会太枯燥?

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”


预训练模型用起来非常容易,但是你是否忽略了可能影响模型性能的细节呢?

请长按或扫描二维码关注本公众号

喜欢的话,请给我个好看吧

Sklearn是一个很好的库,有各种机器学习模型,可以用来训练数据。但是如果你的数据很大,你可能需要很长时间来训练你的数据,特别是当你用不同的超参数来寻找最佳模型时。

有没有一种方法可以使机器学习模型的训练速度比使用Sklearn的速度快150倍?答案就是你可以使用cuML。

cuML是一套快速的,GPU加速的机器学习算法,设计用于数据科学和分析任务。它的API类似于Sklearn的,这意味着你可以使用训练Sklearn模型的代码来训练cuML的模型。

在本文中,我将比较使用不同模型的这两个库的性能。我还将演示如何增加显卡,使得速度提高10倍。

要安装cuML,请按照Rapids页面上的说明进行安装。请确保在安装库之前检查先决条件。你可以安装所有软件包,也可以只安装cuML。如果你的计算机空间有限,我建议安装cuDF和cuML。

虽然在很多情况下,不需要安装cuDF来使用cuML,但是cuDF是cuML的一个很好的补充,因为它是一个GPU数据帧。

确保选择适合你计算机的选项。

我们将创建用于训练模型的函数。使用此函数将使我们更容易比较不同的模型。

我们使用iPython的magic命令%timeit运行每个函数7次,取所有实验的平均值。

让我们通过图片来可视化它。我们创建一个函数来绘制模型的速度。

由于cuML的模型在运行大数据时比Sklearn的模型快,因为它们是用GPU训练的,如果我们将GPU的内存增加三倍会发生什么?

在前面的比较中,我使用的是一台搭载geforce2060的Alienware M15笔记本电脑和6.3gb的显卡内存。

当它在一个显卡内存为17gb的机器上训练时,cuML的支持向量机比Sklearn的支持向量机快18倍!它的速度是笔记本电脑训练速度的10倍,显卡内存为6.3gb。

这就是为什么如果我们使用像cuML这样的GPU加速库。

你可以在这里找到其他比较的代码。

以下两个表总结了两个库之间不同模型的速度:

相当令人印象深刻,不是吗?

你刚刚了解了在cuML上训练不同的模型与Sklearn相比有多快。如果使用Sklearn训练你的模型需要很长时间,我强烈建议你尝试一下cuML,因为与Sklearn的API相比,代码没有任何变化。

当然,如果库使用GPU来执行像cuML这样的代码,那么你拥有的显卡越好,训练的速度就越快。

有关其他机器学习模型的详细信息,请参阅cuML的文档:

欢迎关注磐创AI博客站:

sklearn机器学习中文官方文档:

欢迎关注磐创博客资源汇总站:

我要回帖

更多关于 怎么判断自己健身进入瓶颈 的文章

 

随机推荐