吐血整理!绝不能错过的24个Python库(2)
Pandas在Python or Anaconda中已完成预安装,但以防需要,安装代码如下:
Pandas有以下特点:
下面是一篇文章以及一份很棒的Cheatsheet,有助于使Pandas技能达标:
5. PyOD 传送门:https://pyod.readthedocs.io/en/latest/ 难以发现异常值?这绝非个例。别担心,PyOD库就在这里。 PyOD是一个全面的、可伸缩的Python工具包,用于检测外围对象。离群值检测基本上是识别与大多数数据显著不同的稀有项或观测值。 以下代码可用于下载pyOD:
PyOD是如何工作的?如何实现PyOD?下面一则指南将回答所有关于PyOD的问题: 《学习在Python中使用PyOD库检测异常值的绝佳教程》传送门: https://www.analyticsvidhya.com/blog/2019/02/outlier-detection-python-pyod/ 6. NumPy 传送门:https://www.numpy.org/ 与Pandas一样,NumPy也是一个非常受欢迎的Python库。NumPy引入了支持大型多维数组和矩阵的函数,同时还引入了高级数学函数来处理这些数组和矩阵。 NumPy是一个开源库,有多方贡献者。在 Anaconda和Python中已预安装Numpy,但以防需要,下面是安装代码:
下面是使用NumPy可执行的一些基本功能: 创建数组:
基本运算:
以及更多其他功能! 7. SpaCy 传送门:https://spacy.io/ 目前已经讨论了如何清理数据和处理数值数据。但是如果正在处理文本数据呢?到目前为止,现有的库都无法解决该问题。 Spacy是一个非常有用且灵活的自然语言处理( NLP )库和框架,用于清理创建模型的文本文档。与类似用途的其他库相比,SpaCy速度更快。 在Linux中安装Spacy:
其他操作系统上安装Spacy,请点击:https://spacy.io/usage 以下是学习spaCy的课程: 《简化自然语言处理——使用SpaCy(在Python中)》传送门: https://www.analyticsvidhya.com/blog/2017/04/natural-language-processing-made-easy-using-spacy-%e2%80%8bin-python/ 用于数据可视化的Python库 下一步是什么呢?数据可视化!此处假设已得到验证,并且发掘了隐藏的观点和模式。 下面是三个用于数据可视化的绝佳Python库。 8. Matplotlib 传送门:https://matplotlib.org/ Matplotlib是Python中最流行的数据可视化库。允许生成和构建各种各样的图。Matplotlib是笔者的首选库,可与Seaborn一起用于进行数据可视化研究。 以下是安装Matplotli的代码:
下面是使用Matplotlib构建的不同类型图示的部分例子: (编辑:ASP站长网) |