App下載

python源碼剖析之PyObject詳解

猿友 2021-08-03 14:13:18 瀏覽數(shù) (6123)
反饋

對于python而言,對象這個概念貫穿整個python學(xué)習(xí)過程。python對象為何如此重要,因為python中一切皆是對象。接下來我們結(jié)合python源碼進(jìn)行分析,來對python對象進(jìn)行一個更深入的學(xué)習(xí)吧!

一、Python中的對象

Python中一切皆是對象。
————Guido van Rossum(1989)

這句話只要你學(xué)過python,你就很有可能在你的Python學(xué)習(xí)之旅的前30分鐘就已經(jīng)見過了,但是這句話具體是什么意思呢?

一句話來說,就是面向?qū)ο笾械摹邦悺焙汀皩ο蟆痹赑ython中都是對象。類似于int對象的類型對象,實現(xiàn)了“類的概念”,對類型對象“實例化”得到的實例對象實現(xiàn)了“對象”這個概念。

通常的說法是,對象是數(shù)據(jù)以及基于這些數(shù)據(jù)的操作的集合。在計算機上,一個對象實際上就是一片被分配的內(nèi)存空間,這些內(nèi)存可能是連續(xù)的,也有可能是離散的,這都不重要,重要的是這片內(nèi)存在更高的層次上可以作為一個整體來考慮,這個整體就是一個對象。在這片內(nèi)存中,存儲著一系列的數(shù)據(jù)以及可以對這些數(shù)據(jù)進(jìn)行修改或讀取的一系列操作的代碼。

在 Python 中,對象就是在堆上申請的結(jié)構(gòu)體,對象不能是被靜態(tài)初始化的,并且也不能是在棧空間上生存的。唯一的例外就是類型對象(type object),Python中所有的類型對象都是被靜態(tài)初始化的。在 Python 中,一個對象一旦被創(chuàng)建,它在內(nèi)存中的大小就是不變的了。 這就意味著那些需要容納可變長度數(shù)據(jù)的對象只能在對象內(nèi)維護(hù)一個指向一個可變大小的內(nèi)存區(qū)域的指針。

1.1 對象機制的基石PyObject

PyObjectPyVarObject分別表示定長對象和變長對象,使用的C的struct實現(xiàn)的,在結(jié)構(gòu)中分別只定義了 PyObject_HEADPyObject_VAR_HEAD,后者僅僅是前者加上一個表示容納元素個數(shù)的ob_size。

[object.h]
/* PyObject_HEAD defines the initial segment of every PyObject. */
#define PyObject_HEAD 
	_PyObject_HEAD_EXTRA 
	int ob_refcnt; 
	struct _typeobject *ob_type;

#define PyObject_VAR_HEAD 
	PyObject_HEAD 
	int ob_size; /* Number of items in variable part */

而對于兩者共有的PyObject_HEAD中,只有兩個東西,一個是維護(hù)引用計數(shù)的ob_refcnt和一個指向類型對象PyTypeObject結(jié)構(gòu)體的指針。因此, Python 中實際上對象機制的核心非常的簡單,一個是引用計數(shù),一個就是類型。并且Python中每一個對象的開始字節(jié)都是相同的頭部,這使得對Python對象的引用十分統(tǒng)一,只需要一個PyObject*可以引用任意一個對象。

python數(shù)據(jù)類型的數(shù)據(jù)結(jié)構(gòu)

這兩個結(jié)構(gòu)體定義的只是Python中對象共有的部分,其他的具體類型會有額外的結(jié)構(gòu)體來定義,否則的話所有的對象豈不是都一樣了?比如int類型的結(jié)構(gòu)體定義PyIntObject中包含了PyObject_HEADob_ival后者是一個long,存放具體的值。

二、類型對象

那初始化對象的時候,去那里獲得對象的大小呢?只能是在類型對象PyTypeObject中了!類型對象中存放了大量對象的元信息,大小顯然是一種和對象的類型有關(guān)的元信息!注意,一個PyObject對象就是Python中對面向?qū)ο罄碚撝蓄愡@個概念的實現(xiàn),這里面存放了類型名、內(nèi)存空間、操作函數(shù)指針等信息。

2.1 對象的創(chuàng)建

Python會用兩種方法創(chuàng)建對象,一種是泛型API(AOL:Abstract Object Layer),可以應(yīng)用在任何Python對象上,API內(nèi)不會有機制確定最終調(diào)用哪個具體函數(shù),比如PyObject_New(PyObject, &PyInt_Type)。另一種是類型相關(guān)API(COL:Concrete Object Layer),只能應(yīng)用于具體類型的對象上,比如PyInt_FromLong(10)。

自定義對象在Python內(nèi)部不可能存在COL,所以只能根據(jù)其類型對象來創(chuàng)建實例對象,這就需要PyTypeObject中的tp_new函數(shù)指針,如果是自定義對象,這個指針可能是空,那就通過PyTypeObjecttp_base找到類型對象的基類,再找tp_new指針,這個過程中會利用類型對象中記錄的空間信息申請內(nèi)存。對于 Python 中的任何一種變長對象,tp_itemsize 這個域是必須設(shè)置的,tp_itemsize 指明了由變長對象保存的元素的單位長度,所謂單位長度即是指一個對象在內(nèi)存中的長度。這個 tp_itemsizeob_size 共同決定了應(yīng)該額外申請的內(nèi)存的總大小是多少。

內(nèi)建對象最終會使用COL完成創(chuàng)建工作。

new函數(shù)完成后,會執(zhí)行init函數(shù),前者類似于new操作符,后者類似于構(gòu)造函數(shù)。

python對象創(chuàng)建

2.2 對象的行為

像前面說的,對象的行為被類型對象中的函數(shù)指針?biāo)x。這些操作中,有三組非常重要的操作族:tp_as_number、tp_as_sequencetp_as_mapping分別指向PyNumberMethods、PtSequenceMethods、PyMappingMethods函數(shù)族結(jié)構(gòu)體。所謂“鴨子類型”,就行能找到該類型對應(yīng)的操作,就可以當(dāng)做這個類型來用。

class MyInt(int):
    def __getitem__(self, key):
        return key+str(self)

a=MyInt(1)
b=MyInt(2)
print(a+b)
print(a['somekey'])

可以發(fā)現(xiàn)通過int繼承得到的數(shù)值對象,通過重寫魔術(shù)方法,使其支持了字典類型的操作,其實我們可以認(rèn)為是,制定了MyInt這個類型對象tp_as_mapping.mp_subscript操作。

2.3 類型的類型

之前說了,作為類的實現(xiàn)的類型對象也是Python對象,那么類型對象PyObjectob_type指針指向哪呢?是指向自己嗎?盡管我一開始也是這么想的,但可惜這個答案不對,類型對象指向的對象是PyType_Type。這個對象在Python類型機制中很重要,所有用戶自定義class的PyTypeObject對象都是通過這個對象創(chuàng)建的,因此他是Python中的元類(metaclass)。他是所有class的class。而元類的類型是自己,這里出現(xiàn)了我們一開始認(rèn)為會出現(xiàn)的自己只想自己的情況!

i=1
class A:
    pass
a=A()
print(i.__class__) # 類型對象
print(i.__class__.__class__) # 元類
print(a.__class__) # 類型對象
print(a.__class__.__class__) # 元類
print(a.__class__.__class__.__class__) # 指向自己

類型的類型

留在這里的疑問:虛線和虛線指向的對象是啥玩?

三、Python的多態(tài)性

通過 PyObject 和類型對象, Python 利用 C 語言完成了 C++所提供的繼承和多態(tài)的特性。一開始已經(jīng)提到,Python中所有對象的前面幾個字節(jié)都是PyObject類型也就是PyObject_HEAD結(jié)構(gòu)體。因此在 Python 內(nèi)部各個函數(shù)之間傳遞的都是一種范型指針PyObject*。這個指針?biāo)傅膶ο缶烤故鞘裁搭愋偷?不知道,只能從指針?biāo)笇ο蟮?code>ob_type域判斷,而正是通過這個域,Python 實現(xiàn)了多態(tài)機制。

真正執(zhí)行的時候,通過找到實例對象指向的類型對象的函數(shù)指針來執(zhí)行方法。這里同一個函數(shù)在不同情況下表現(xiàn)出了不同的行為,這正是多態(tài)的核心所在。

四、引用計數(shù)

在 Python 中,主要是通過Py_INCREF(op)Py_DECREF(op)兩個宏來增加和減少一個對象的引用計數(shù)。當(dāng)一個對象的引用計數(shù)減少到 0 之后, Py_DECREF將調(diào)用該對象的析構(gòu)函數(shù)(deallocator function)(但是不一定真的釋放該對象所占有的內(nèi)存和系統(tǒng)資源),即類型對象中tp_dealloc指向的函數(shù)。例外的是類型對象,PyTypeObject是超越引用計數(shù)規(guī)則的,永遠(yuǎn)不會被析構(gòu),每一個對象中指向類型對象的指針不被視為對類型對象的引用。

這有些觀察者模式(Observer)的影子,在ob_refcnt減為 0 之后,將觸發(fā)對象銷毀的事件;從 Python 的對象體系來看,各個對象又提供了不同的事件處理函數(shù),而事件的注冊動作正是在各個對象對應(yīng)的類型對象中靜態(tài)完成的。

PyObject中我們看到ob_refcnt是一個 32 位的整形變量,這實際是一個Python所做的假設(shè),即對一個對象的引用不會超過一個整形變量的最大值。

五、Python對象的分類

對象的分類

到此這篇根據(jù)python源碼剖析python對象的文章就介紹到這了,更多python學(xué)習(xí)內(nèi)容請搜索W3Cschool以前的文章或繼續(xù)瀏覽下面的相關(guān)文章。

0 人點贊