對於編譯型的語言,比如C#中的一個.cs文件,Java中的一個.java或者編譯後的.class文件可以認為是一個模塊(但常常不表述為模塊);對於解釋型的語言會更加直觀些,比如PHP的.php文件,在Python中就是.py文件可以認為是一個模塊。在“模塊”之上有“包”,主要是為了方便組織和管理模塊。比如C#中編譯後的.dll文件(但常常不表述為包Package,而是庫Library),Java將.class打包後的.jar文件,PHP的.phar文件(模仿Java包),在Python中一個特殊定義的文件夾是一個包,可以打包為egg文件。但對於解釋型語言“包”並沒有編譯成低級語言而後打包的意思,只是更加方便模塊化和管理模塊間的依賴。每種編程語言對於模塊和包管理都有一定的約定,不瞭解這些約定,那會給學習這種語言的帶來障礙。下面我想來梳理一下Python的這些約定。
一、Python查找模塊的路徑
運行Python應用或引用Python模塊,Python解釋器要有一個查找的過程。可以通過設置一個環境變量PYTHONPATH為Python增加一個搜索路徑,以方便查找到相關Python模塊(不同的操作系統環境變量的設置稍有不同,默認以下都是WIndows環境),這與眾多應用程序需要設置一個系統環境變量的道理是一樣的。在命令行中可以通過以下命令設置:
C:UsersAdministrator>set PYTHONPATH=E:/Project/Python/ModuleAndPackage/
進入Python環境後可以,通過Python的sys.path屬性獲得當前搜索路徑的配置,可以看到之前我們設置的路徑已經在當前搜索路徑中了。
C:UsersAdministrator>python Python 2.7.11 (v2.7.11:6d1b6a68f775, Dec 5 2015, 20:32:19) [MSC v.1500 32 bit (Intel)] on win32 Type "help", "copyright", "credits" or "license" for more information. >>> import sys >>> sys.path ['', 'E:ProjectPythonModuleAndPackage', 'C:Windowssystem32python27.zip','C:PythonDLLs','C:Python lib', 'C:Pythonlibplat-win', 'C:Pythonliblib-tk', 'C:Python', 'C:Pythonlibsite-packages'] >>>
也可以通過sys模塊的append方法在Python環境中增加搜索路徑。
>>> sys.path.append("E:ProjectPythonModuleAndPackage2") >>> sys.path ['', 'E:ProjectPythonModuleAndPackage', 'C:Windowssystem32python27.zip','C:PythonDLLs','C:Python lib', 'C:Pythonlibplat-win', 'C:Pythonliblib-tk', 'C:Python', 'C:Pythonlibsite-packages','E: ProjectPythonModuleAndPackage2'] >>>
二、Python中的模塊和包
前面已經提到每個.py文件都是可以認為是一個Python模塊,.py文件中可以包含類、方法、變量和常量(Python還沒有嚴格意義上的常量,只是約定大寫的變量作為常量),文件內也可以直接寫所有的邏輯語句並在加載時從上之下直接執行,這與其他解釋型語言是類似的。例如我們選擇在文件夾ModuleAndPackage中創建一個文本文件person.py文件即創建了一個簡單的Python模塊,其內容如下:
# -*- coding: utf-8 -*- ID = 1 name = "This person" print name def say(something): print name,'says', something
那麼接下來我們就可以在Python環境中執行person.py。我們可以直接像執行一個批處理文件那樣執行person.py,在cmd命令行輸入:
Python E:/Project/Python/ModuleAndPackage/person.py
本質上任何一個Python應用的入口模塊都是這樣被執行的(像C#和Java中的main函數),但是引用一個模塊,就要建立運行它的上下文環境。我們先設置一個環境變量PYTHONPATH,以便Python解釋器找到person.py模塊,然後import person模塊,即可訪問其中的方法或變量。
C:UsersAdministrator>python Python 2.7.11 (v2.7.11:6d1b6a68f775, Dec 5 2015, 20:32:19) [MSC v.1500 32 bit ( Intel)] on win32 Type "help", "copyright", "credits" or "license" for more information. >>> import person This person >>> person.say("hello") This person says hello >>> print person.name This person >>>
Python需要去某些固定的路徑下去查找Python模塊,上面我們設置在ModuleAndPackage中查找。但是這些路徑下也是有目錄層次的,Python是如何查找子目錄中的模塊呢?特別是引用第三方包時,我們也需要知道一定的層次關係。實際上,Python通過目錄和文件構建包結構,並且包是層層嵌套的,和目錄層層嵌套是一樣的,這樣就構成了包內的訪問路徑(或者命名空間,也可以說Python應用的命名空間與其目錄和文件結構是對應了,似乎缺少了一些靈活,但也更簡單)。例如我們在ModuleAndPackage文件夾下,創建一個文件夾animal,裡面創建一個文本文件pet.py,其內容如下:
# -*- coding: utf-8 -*- ID = 2 name = "This pet" print name def run(somewhere): print name,'runs', somewhere
那麼如何引用pet.py這個模塊呢?按照Python的約定,需要在animal文件夾中創建名為__init__.py的空文本文件,以標識animal文件夾是一個包。倘若animal文件夾內還有文件夾作為包,也必須包含__init__.py文件。這樣就層層標識了訪問的路徑。
>>> import animal.pet This pet >>> print animal.pet.name This pet >>> animal.pet.run("everywhere") This pet runs everywhere >>>
或者使用from關鍵字直接導入模塊內的屬性或方法:
>>> from animal.pet import name,run >>> print name This pet >>> run("everywhere") This pet runs everywhere >>>
知識點擴展:
使用模塊有什麼好處?
當一個模塊編寫完畢,就可以被其他地方引用。我們在編寫程序的時候,也經常引用其他模塊,包括Python內置的模塊和來自第三方的模塊。
模塊還可以避免函數名和變量名衝突。相同名字的函數和變量完全可以分別存在不同的模塊中。但是也要注意,儘量不要與內置函數名字衝突。
如果不同的人編寫的模塊名相同怎麼辦?為了避免模塊名衝突,Python又引入了按目錄來組織模塊的方法,稱為包(Package)。
[techdo ] python模塊如何查看已經有243次圍觀