Дейвид Мадоре s WebLog Опит за писане на Unicode за манекени
Опит за писане на Unicode за манекени
Мета: Целта на тази публикация в идеалния случай би била да издаде някакъв документ, който бих искал да нарека Unicode for Dummies: идеята би била да има нещо разбираемо за широката публика (да кажем от всички с минимални познания за използването на компютър - като знам как да копирам и поставям например) и който представя нещата, които бих искал всички да знаят за Unicode (за какво е, за какво е, защо съществува, но също така и за това какво влияние може да има върху тях - особено по отношение на сигурността - и как да го използвам). Очевидно такъв документ наистина би имал смисъл само в по-общата рамка на основното компютърно обучение за широката публика (което би обяснило например в една от неговите глави, какво е мрежата и общата идея за мрежата браузър, какъв URL и уеб страница, такива неща, за да мога да дам съвети за сигурност и т.н.), но нямам време или търпение да се опитам да напиша такъв курс, тогава просто мисля за много малка тухла, тази, свързана с Unicode. (И отново ще опиша това, което си представям, че трябва да бъде написано, вместо да го пиша всъщност.) • Защо конкретно Unicode? Първо, защото мисля, че това е плод с нисък вис (широката публика може да спечели много за малко усилия, за да знае малко по темата); но и по егоистична причина, която е, че ме дразни, когато общувам с хора по електронен път, да се озовавам като чета или отговарям на неща като как пишете ℝ в съобщение в Twitter? (е, точно те по-скоро ще ме попитат как да напиша двойна лента R (т.е. удебелена черна дъска); и това, което откровено ме дразни, са хората, които пишат | R, за да се опитат да имитират това ℝ) или друго Не знам как да напиша e-in-the, той не е на клавиатурата ми и нямам предвид такива неща.

Този запис не е предназначен за завършване и по-специално поставя въпроса пред технически компетентните читатели какво още трябва да се каже там или как да направим нещата по-достъпни за мадам Мичу и мосю Дюгену. (Но честно казано, със сигурност ще ме мързи непрекъснато да завърша този текст. Както ще ме мързи да опростя пасажите, в които съм се упражнявал, като казвам твърде сложни неща. Въпреки това се интересувам от обратната връзка от възможната г-жа Мичу и г-н Dugenou, който би попаднал на този текст, така че да ми казват онова, което им се струва неясно или да го подобря.)
Накратко. Какво искам от широката публика да разбере за Unicode? Основно пасажите с удебелен шрифт в следващото (но така или иначе, това, което е между пасажите с удебелен шрифт ...):
Първо, разбира се, какво представлява: Unicode е компютърен стандарт, дефиниращ набор от символи (но също така и конвенции за това как да се управляват тези символи), позволяващ да се представи гигантски брой различни езици, както и огромна маса от различни символи (включително известните емотикони, които може би сега правят това, което прави Unicode най-известен сред широката публика). Може би трябва да добавим тук примери за езици, поддържани от Unicode, и за думи, написани на тези езици, но нека кажем, че почти всяка система за писане на езици, все още живеещи на Земята, и доста куп мъртви езици и някои изкуствени езици (Каквото и да означава това) са представими от Unicode. Що се отнася до символите, те обхващат всички видове общи пиктограми, технически символи, включително огромен брой математически символи, но също така, съвсем просто, много малко странни или екзотични пунктуационни знаци.
От друга страна, това, което мисля, че е важно да подчертая, е това в днешно време Unicode е навсякъде: в по-голямата част от ситуациите, когато компютър манипулира низове (т.е. текст), тези символи са Unicode символи. Уеб страниците са в Unicode; адресите на уеб страници са (или поне могат да бъдат) в Unicode; имейлите са в Unicode (за имейл адресите е по-съмнително); Документите на Word или LibreOffice са в Unicode; Търсения в Google/Bing/DuckDuckGo/и др са направени в Unicode; Уикипедия е в Unicode; туитовете са в Unicode; дори SMS са в Unicode (въпреки че тук има някои тънкости, които правят всички символи не еднакви); на много операционни системи имената на файлове са в Unicode; И така нататък. (Има и изключения, разбира се: авиокомпаниите със сигурност не използват Unicode в своите допотопни резервационни системи и ако името ви има някакви странни знаци, вероятно знаете, че когато се опитвате да получите билет.)