將一門語言轉(zhuǎn)換為另一門語言,大家是不是覺得很奇幻?其實這個不難,下面就為大家介紹一下將C語言中的字符串轉(zhuǎn)換為Python語言的字符串。下面是詳情內(nèi)容,供大家學習參考。
問題
怎樣將C中的字符串轉(zhuǎn)換為Python字節(jié)或一個字符串對象?
解決方案
C字符串使用一對 char *
和 int
來表示, 你需要決定字符串到底是用一個原始字節(jié)字符串還是一個Unicode字符串來表示。 字節(jié)對象可以像下面這樣使用 Py_BuildValue()
來構建:
char *s; /* Pointer to C string data */
int len; /* Length of data */
/* Make a bytes object */
PyObject *obj = Py_BuildValue("y#", s, len);
如果你要創(chuàng)建一個Unicode字符串,并且你知道 s 指向了UTF-8編碼的數(shù)據(jù),可以使用下面的方式:
PyObject *obj = Py_BuildValue("s#", s, len);
如果 s
使用其他編碼方式,那么可以像下面使用 PyUnicode_Decode()
來構建一個字符串:
PyObject *obj = PyUnicode_Decode(s, len, "encoding", "errors");
/* Examples /*
obj = PyUnicode_Decode(s, len, "latin-1", "strict");
obj = PyUnicode_Decode(s, len, "ascii", "ignore");
如果你恰好有一個用 wchar_t *, len
對表示的寬字符串, 有幾種選擇性。首先你可以使用 Py_BuildValue()
:
wchar_t *w; /* Wide character string */
int len; /* Length */
PyObject *obj = Py_BuildValue("u#", w, len);
另外,你還可以使用 PyUnicode_FromWideChar()
:
PyObject *obj = PyUnicode_FromWideChar(w, len);
對于寬字符串,并沒有對字符數(shù)據(jù)進行解析——它被假定是原始Unicode編碼指針,可以被直接轉(zhuǎn)換成Python。
討論
將C中的字符串轉(zhuǎn)換為Python字符串遵循和I/O同樣的原則。 也就是說,來自C中的數(shù)據(jù)必須根據(jù)一些解碼器被顯式的解碼為一個字符串。 通常編碼格式包括ASCII、Latin-1和UTF-8. 如果你并不確定編碼方式或者數(shù)據(jù)是二進制的,你最好將字符串編碼成字節(jié)。 當構造一個對象的時候,Python通常會復制你提供的字符串數(shù)據(jù)。 如果有必要的話,你需要在后面去釋放C字符串。 同時,為了讓程序更加健壯,你應該同時使用一個指針和一個大小值, 而不是依賴NULL結(jié)尾數(shù)據(jù)來創(chuàng)建字符串。
以上就是C語言字符串轉(zhuǎn)換為Python字符串的方法的詳細內(nèi)容,更多關于C語言字符串轉(zhuǎn)換為Python字符串的資料,請關注W3Cschool其它相關文章!