2019深度学习框架排行榜 (从TOP 10到TOP 3)(2)
不过现在,如果稍微深入了解TensorFlow和Pytorch,就会发现他们越来越像,TF加入了动态图架构,Pytorch致力于其在工业界更加易用。打开各自的官网,你也会发现文档风格也越发的相似。 PaddlePaddle PaddlePaddle是由百度自主研发的开源深度学习平台,近期有了中文名字,飞桨。官网截图也很有意思,很多人在划桨。飞桨刚发布的时候,并不被看好,感觉更像是Google有,百度也要有的腔调,但是近来在做一个关于语义识别的项目,其他框架支持中文的模型实在是少的可怜,时间紧张也没有时间大规模训练,于是就来试试飞桨,其中基于BERT的ERNIE模型取得了较好的效果,部署也不折腾。个人认为可以将模型库中的经典模型套在自己的问题上,作为baseline模型快速试验,而后慢慢调优追求更好的效果。 从模型库找到适合自己的模型,按照实践教程一步步进行就行了,过程还是比较简单的,遇到的问题在GitHub的issues中都有找到,虽然不像TF那么活跃,但是支持也是很及时的。我是从官网找模型,发现官网又更新了,盗张图过来感受下支持的模型。 Figure 5 PaddlePaddle模型库(源:百度PaddlePaddle官网) 功能上,飞桨同时支持动态图和静态图,能方便地调试模型,方便地部署,非常适合业务应用的落地实现。飞桨也已经支持数百个节点的高效并行训练。可以说在过去2年的时间里,深度学习领域在大规模的落地应用,各家框架也都在快速的发展,但是百度的飞桨看来是这个阶段发展更快的框架,甚至是发展更快的AI开发生态。 目前,以上三个框架可以说发展比较快,并且仍在稳定更新与维护。功能上来说,各框架已经“越长越像”,三个框架还是会有各自的特点,如何选择还是要根据自己的目标来看。 下面简单介绍一下其他的一些主要框架。 Keras Keras的出现大大降低了深度学习应用的门槛,通过Keras的API可以通过数行代码就构建一个网络模型,曾几何时,Keras+Theano,Keras+CNTK的模式深得开发者喜爱。目前Keras整套架构已经封装进了TensorFlow,在TF.keras可以完成Keras的所有事情。 Deeplearning4j Deeplearning4j,顾名思义,它是用JAVA编写的,并且与任何JVM语言兼容,如Scala,Clojure或Kotlin,基础计算模块是用C,C++和CUDA开发的,基于此,DL4J对Spark和Hadoop生态有很好的支持,在多卡GPU上也有很好的性能。相比TF,Pytorch和飞桨,DL4J的文档和社区体系并不是很完善,而且其本身并不支持Python,而是由高层级的Keras API支持,上手难度稍大,另外其应用示例也很有限。 Mxnet Mxnet可以说成名很早,发展一直不温不火,现在在Apache项目下孵化,当下背靠企业的TensorFlow,Pytorch和飞桨都依靠广泛的应用场景踏上了AI发展的快车道,而Mxnet缺少的可能就是大厂应用场景的落地实现。 Caffe&Caffe2 Caffe 是一个优先考虑表达、速度和模块化来设计的框架,它由贾扬清和伯克利人工智能实验室研究开发。支持 C、C++、Python等接口以及命令行接口。它以其速度和可转性以及其在卷积神经网络建模中的适用性而闻名。 使用Caffe库的好处是从深度网络存储库"Caffe 模型Zoo"访问可用网络,这些网络经过预先培训,可以立即使用。Caffe是一个曾经叱咤风云的视觉识别深度学习网络。但是,Caffe 不支持精细粒度网络层,给定体系结构,对循环网络和语言建模的总体支持相当差,必须用低级语言建立复杂的层类型,使用门槛很高。 Caffe2是由Facebook组织开发的深度学习模型,虽然使用门槛不像Caffe那样高,但仍然让不那么看重性能的开发者望而却步,很快就被并入Pytorch项目。而Caffe自2017年以来都没有再更新了,新的项目已经鲜有其身影,曾名噪一时的框架就此落幕。 Chainer Chainer是纯粹用Python在NumPy,CuPy等库的基础上开发的,它的创新是网络不再是静态图,而是可以灵活定义,快速运行的一套深度学习架构,同时可以运行于大型系统并保持较高的性能,后来Pytorch的设计灵感就是部分借鉴于Chainer。 Theano Theano是深度学习框架的鼻祖,它由Yoshua Bengio和蒙特利尔大学的研究小组于2007年创建,是率先广泛使用的深度学习框架。Theano 是一个 Python 库,速度更快,功能强大,可以高效的进行数值表达和计算,可以说是从NumPy矩阵表达向tensor表达的一次跨越,为后来的深度学习框架提供了样板。遗憾的是Theano团队已经停止了该项目的更新,深度学习应用框架的发展进入到了背靠工业界大规模应用的阶段。 CNTK (编辑:ASP站长网) |