Кодиране на Perl и символи

Четене на статията.

кодиране

Както В автор, така и В преводач

Статията

Публикувано на 28В октомвриВ 2014В - Актуализирано на 29В юниВ 2016В

Социални връзки

I. Въведение ▲

II. ASCII ▲

Тъй като байтът съдържа 8B бита, най-значимият бит от ASCII символ винаги е 0.

III. Други кодировки на символи

IV. Unicode

V. Формати за преобразуване на Unicode

кодови точки

Герои

VI. Perl 5 и кодиране на символи

В противен случай можете много бързо да бъдете подведени и да загубите представа кои низове са байтови и кои текстови.

VII. Тествайте средата си

Знакът евро € не е в таблицата за кодиране Latin-1, така че ако вашият терминал е в това кодиране, знакът за евро няма да се появи правилно.

Терминалите на Windows използват предимно cp * кодировки, например cp850 или cp858 (налични само в по-новите версии на Encode) за немски инсталации. Останалата част от средата използва Windows- * кодиране, например Windows-1252 за няколко западноевропейски местоположения.

връща списък с налични кодировки.

VIII-A. В "В Големи символи за печат" В "▲

Понякога може да видите това предупредително съобщение: Широк знак в печат .

VIII-B. Огледайте веригите