Python
的依赖管理工具一直没有标准化,原因主要包括:
Python
发展早期对于依赖管理的重视程度不足,缺乏从一开始就进行统一规划和设计的意识Python
社区庞大且分散,众多开发者和团队各自为政,根据自己的需求和偏好开发工具,缺乏统一的协调和整合机制Python
应用场景广泛,从 Web 开发到数据科学、机器学习、系统管理脚本等。不同场景对依赖管理有着不同的要求Python
语言本身非常注重向后兼容性,这在一定程度上限制了对依赖管理工具进行根本性变革的可能性Java
有 Oracle 主导的规范制定)不同,Python
没有一个强有力的单一实体来主导依赖管理工具的标准化工作Python
生态系统发展迅速,新的库和框架不断涌现,这使得依赖关系变得越来越复杂依赖管理工具常用于处理软件项目中的依赖关系。
在软件开发过程中,一个项目往往会依赖于许多其他的软件库、框架或组件。
依赖管理工具能够帮助开发者精确地指定这些依赖项的版本,自动下载和安装它们,并且可以在不同的环境中(如开发、测试、生产环境)保证依赖项的一致性。
这样可以有效避免因依赖版本混乱而导致的软件故障、兼容性问题等情况。
比如,其他编程语言的标准依赖管理工具有:NodeJS
的npm
,Rust
的cargo
,Java
的Maven
等等。
依赖管理工具最关键的作用是可重复性,意味着我们可以遵循一系列步骤,最终得到的软件项目是完全相同的。
特别是现在的项目(不管是开源的还是内部的)基本都需要多人协作,确保每个人的代码编译出来的软件运行结果一致是至关重要的。
良好的依赖管理可以对开发、构建和部署阶段的所有依赖关系都明确声明,并与版本控制中的代码一起跟踪。
简单来说:应用程序=代码+所有依赖项。
具体可以归纳为以下几个步骤:
Python
的依赖管理工具虽然没有统一,但是有很多可供选择,下面一一分析每个工具的优缺点。
pip
是自带的默认包管理器,也是使用最多的工具,它的特点是只能用来安装Python
包。
优势:
Python 3.4
起包含在Python
中,无需额外安装wheels
分发格式,安装速度大大提高不足之处:
Python
,也就是说使用pip
必须先安装Python
用于创建虚拟环境的内置工具,在虚拟环境中可使用 pip 安装包,通过设置环境变量来隔离环境。
优势:自Python 3.3
起包含在Python
中。
不足之处:
Python
工具,依赖 Python
安装Python
解释器Python
包在 venv
成为 Python
内置工具前,我们通常使用virtualenv
创建虚拟环境,可指定不同的 Python
解释器创建虚拟环境,需通过 pip
安装。
优势:能指定不同 Python
解释器创建虚拟环境。
不足之处与venv
是一样的。
轻量级工具,引入锁文件机制。
需先编写requirements.in
作为定义文件,再用pip-compile
生成requirements.txt
锁文件,同步环境是使用pip-sync
。
优势:轻量、简单,与基本的 <font style="color:rgba(0, 0, 0, 0.85);">pip/venv</font>
工具协同工作。
不足之处:
Python
工具,需安装到项目环境中,可能存在兼容性问题pip
可安装的包整合了 pip
、virtualenv
和 pip-tools
的功能,通过Pipfile
和Pipfile.lock
管理依赖和虚拟环境,自动更新文件。
优势:轻量、简单,包装了基本的 pip/venv
工具。
不足之处:
Python
工具pip
可安装的包旨在涵盖 Python
项目整个开发流程,包括项目引导、虚拟环境、依赖管理、构建和发布包。
通过pyproject.toml
管理依赖,自动维护poetry.lock
,支持依赖分组。
优势:
不足之处:
Python
工具,较重量级,依赖多,安装可能有问题pip
可安装的包类似于 Poetry
,但遵循 PEP
标准,可使用uv
进行依赖解析和安装,其构建后端可独立使用。
uv
是后面将要介绍的另一个依赖管理工具。
优势:
PEP
标准uv
进行依赖管理不足之处:与 Poetry
类似,是 Python
工具,有较多依赖,存在相关缺点。
用于安装和管理不同版本的 Python
,可在全局或项目级别激活指定版本,是简单的 shell
实用程序,不依赖 Python
安装。
优势:
shell
脚本,无 Python
依赖Unix
哲学,专注于管理 Python
版本不足之处:
Python
版本需下载并编译源代码,耗时Windows
将 pip
包安装在用户级别的独立虚拟环境中,避免依赖冲突,通过 symlink
(软链接) 将入口点链接到PATH
,方便调用。
优势:比直接在用户级别 pip
安装工具更好,能隔离依赖,可使用不同 Python
解释器。
不足之处:
Python
工具用 Rust
编写的全能工具,旨在替代多个 Python
管理工具,处理整个开发流程,包括安装包、管理虚拟环境、构建和发布等。
遵循 Python
标准,依赖定义在pyproject.toml
,锁文件为uv.lock
,支持任意依赖分组,能安装 pip
包作为可执行文件,可管理 Python
版本,维护全局包缓存。
优势:
Rust
编写,速度极快,单二进制文件,无外部依赖Python
标准不足之处:
pip
可安装的包由 Anaconda
公司开发的不同生态系统的包管理器,主要用于安装anaconda.org
上的包,
能创建虚拟环境,与 pip
生态系统不同,对【包】 的定义更广泛,包括共享库、头文件、可执行文件等。
优势:
Conda
环境中使用 pip
不足之处:
shell
配置Python
生态系统互操作性有限Conda
包较痛苦是Conda
的改进版,旨在解决Conda
的痛点,如慢的依赖解析和并行下载问题,用 C++
实现,使用不同算法,推荐安装方式已改变。
速度比Conda
快很多,其他方面和Conda
类似。
类似于 uv
,但针对 Conda
生态系统,用 Rust
编写,支持多平台。
通过pyproject.toml
或pixi.toml
配置,有方便的命令行界面,支持管理多个虚拟环境和定义文件,有锁文件机制,支持类似 Makefile
的项目自动化任务,可指定系统依赖,但不帮助构建包。
优势:
Python
二进制文件和anaconda.org
上的非 Python
包pyproject.toml
和pixi.toml
配置不足之处:与其他工具兼容性有限,且没有遵循 Conda
的全局环境理念。
如此之多的依赖管理工具,我们应该如何选择呢?
如果我们的项目只有对Python包的依赖,那么推荐uv
和Pixi
;
如果需要维护多个互斥的环境,那么推荐pip + venv + pip-tools + pyenv
;
如果需处理无法通过 pip
安装的依赖,那么建议使用Pixi
。
Python
的依赖管理工具很多,但是大部分工具其实大同小异,只是互相做了一些小的改进。
我们选择时,除了考虑遗留项目的问题之外,尽量优先选择新出的工具。
新的工具除了会改进原有工具的缺点,还会借鉴其他语言的优秀的依赖管理工具。
目前,我个人的话,使用uv
来管理项目比较多。