混合派
· Knock Knock:从Python发送通知到移动设备、桌面或电子邮件。
· tqdm:可扩展的Python和CLI进度条,内置对pandas的支持。
· Colorama:简单的跨平台彩色终端文本。
· pandas -log:提供熊猫基本操作的反馈。非常适合调试长管道链。
· Pandas-flavor:扩展pandas DataFrame/Series的简单方法。
· More-Itertools:增加了类似于itertools的额外功能。
· streamlit:为机器学习项目创建应用程序的简单方法。
数据清理和操作
· ftfy:修复mojibake和Unicode文本中的其他故障。
· janitor:有很多很酷的功能来清理数据。
· Optimus:另一个数据清理包。
· Great-experctations:一个检查数据是否符合预期的好工具。
数据探索和建模
· Pandas-profile:创建一个包含来自pandas DataFrame的统计数据的HTML报告。
· dabl:允许使用可视化和预处理进行数据探索。
· pydqc:允许比较两个数据集之间的统计数据。
· pandas-summary:对panda DataFrames描述功能的扩展。
· pivottable-js:pands在jupyter notebook的拖放功能。
数据结构
· Bounter:有效的计数器,使用有限(有界)的数量的内存,无论数据大小。
· Python -bloomfilter:可扩展的Bloom Filter,使用Python实现。
· datasketch:提供概率数据结构,如LSH、加权MinHash、HyperLogLog等。
· ranges:Python的连续范围、范围集和范围令数据结构
性能检查和优化
· Py-spy:Python程序的采样分析器。
· pyperf:用于运行Python基准测试的工具箱。
· snakeviz:一个浏览器内的Python配置文件查看器,对jupyter notebook有很大的支持。
· Cachier:Python函数的持久、无延迟、本地和跨机缓存。
· Faiss:用于高效的相似性搜索和密集向量聚类的库。
本文内容不用于商业目的,如涉及知识产权问题,请权利人联系51Testing小编(021-64471599-8017),我们将立即处理。