在近期我们进行了一项调查——企业里的人工智能,收到了超过1300份的回复。我们发现几个机器学习的库和框架被广泛地使用。超过半数的受访者说他们已经使用了TensorFlow和scikit-learn,第三位被使用的是PyTorch和Keras。
我最近参加了RISELab的Caroline Lemieux做的一个有趣的演讲。她介绍了AutoPandas和依赖于程序合成的自动化工具的最新工作。在演讲过程中,Lemieux回顾了他们收集的对于不同深度学习框架和数据科学库的使用统计数据。她很大度地分享给我了一些数据。我用这些数据绘制出下面这张图:
图1 发布在arXiv.org上的提到每个框架的论文数量。来源:数据来自RISELab,图由Ben Lorica提供
图1里的数字是对预发表平台arXiv.org上的论文进行全文搜索获得的,即在全文搜索里,提到每个框架的论文数量。基于这个指标我们发现,在研究人员里最流行的两个深度学习框架是TensorFlow和PyTorch。从2019年1月到6月底,有1800多篇论文提到了TensorFlow,同时也有差不多的论文提到了PyTorch。最值得注意的是,研究人员里对于PyTorch的兴趣正在快速增加:年度增长率为194%(2019年1月到6月相比于2018年1月到6月)。
在某种程度上研究人员和老师都是最爱尝鲜的用户,并且强烈影响着未来从业人员可能会使用的东西。看起来PyTorch也在从数据科学家、开发人员和机器学习工程师和公司社区中吸引用户。在最近的一篇文章中我们概述了用于管理企业中机器学习的工具套件。我们在其中强调的许多工具和公司都支持流行的机器学习库和深度学习框架(特别是TensorFlow和PyTorch),因此我们预测这两个框架对于企业用户来说都是同样可行的选择。
相关内容:
- 《现代深度学习:工具和技术》,在2019年9月10的人工智能圣何塞大会上的一个新教程
- RISELab的AutoPandas暗示着自动化技术将会改变软件开发的性质
- Ion Stoica的《RISELab里的人工智能和系统》
- 人工智能和机器学习将会对你的整个机构进行重新训练
- 什么是模型管理和模型运维?
- 一张简单的幻灯片:谁对Spark NLP感兴趣?
- 已改进的工具生态系统正在助推人工智能的落地
- 对高质量数据的需求