KomputerTeknologi informasi

Ngodhe "Unicode": karakter werna standar

Saben panganggo Internet ing upaya kanggo nyiyapake siji utawa liyane fungsi sawijining paling tau weruh ing layar ditulis ing aksara Latin tembung "Unicode." Apa iku, sampeyan bakal sinau maca artikel iki.

definisi

Ngodhe "Unicode" - karakter enkoding standar. Sampeyan iki ngajokaken dening Unicode Inc. organisasi non-profit ing taun 1991. standar wis dirancang kanggo ngowahi bebarengan nomer paling gedhé bisa beda jinis karakter ing document. Page, kang diadegaké ing basis kuwi, bisa ngemot huruf lan karakter saka macem (saka Rusia nganti Korea) lan pratandha matematika. Ing kasus iki, kabeh karakter ing pesawat karakter ditampilake tanpa masalah.

Alasan kanggo penciptaan

Sawise marang wektu, dawa sadurunge munculé sistem siji "Unicode" enkoding dipilih adhedhasar pilihan saka penulis saka dokumen. Menawi mekaten, asring kanggo maca document, iku perlu nggunakake tabel beda. Kadang iku perlu kanggo nindakake kaping pirang-pirang, kang nemen complicates gesang pangguna rata-rata. Minangka wis kasebut, ing solusi kanggo masalah iki ing taun 1991 diundang kanggo Unicode Inc. organisasi non-profit kanggo kurban jinis anyar saka enkoding karakter. Sampeyan iki dirancang kanggo gabungke kuna lan macem-macem standar. "Unicode" - lan enkoding sing ozvolila entuk uga ing wektu: kanggo nggawe alat sing ndhukung nomer ageng karakter. Asil ngluwihi akeh pangarepan - ana dokumen bebarengan ngemot loro Inggris lan teks Russian, Latin, lan ungkapan matématis.

Nanging nitahaken saka werna ndadekake sadurungé dening perlu kanggo mutusake masalah sawetara masalah sing wis wungu amarga ing macem-macem ageng saka standar wis ana ing wektu iku. Paling umum saka wong-wong mau:

  • nulis Elvish, utawa "ngawur";
  • ing watesan saka pesawat karakter;
  • masalah ndandani codings;
  • duplikasi font.

excursus sajarah cilik

Mbayangno sing 80th yard. hardware komputer ora dadi umum lan nduwèni wangun beda saka dina iki. Nalika saben OS punika unik lan olahan kabutuhan tartamtu saben penggemar kang. Perlu kanggo ijol-ijolan informasi diowahi menyang nulis ulang tambahan kabeh. Nyoba kanggo maca document digawe dening sistem operasi liyane, asring nampilake pesawat aneh saka karakter, lan game ing ngandap enkoding ing. Iku ora tansah nindakaken cepet, lan kadhangkala document perlu Ora kanggo mbukak ing nem sasi, lan malah mengko. Wong-wong sing seneng ijolan informasi, nggawe piyambak Tabel konversi. Lan banjur digarap marang sawijining rinci menarik: perlu kanggo nggawe wong ing rong arah, "saka sandi ing" bali lan kasebut. Priksa banal bantahan mesin komputasi ora bisa, iku ing kolom sisih tengen saka sumber, lan kiwa - asil, nanging ora kosok balene. Yen sampeyan ndeleng sing perlu kanggo nggunakake sembarang karakter khusus ing dokumen, padha kanggo ditambahake pisanan, lan banjur liyane, lan kanggo nerangake kanggo partner apa perlu kanggo nindakake kanggo karakter iki ora dadi "ngawur." Lan supaya ora lali sing kanggo saben enkoding kedah berkembang utawa ngleksanakake fonts dhewe, ingkang nitahaken saka sawetara ageng duplikasi ing OS.

Mbayangno luwih sing fonts ing kaca, sampeyan bakal weruh 10 bagéyan identik Times New Roman karo cathetan cilik: kanggo UTF-8, UTF-16, ANSI, UCS-2. Saiki sampeyan ngerti sing pangembangan standar universal ana utomo?

"Wong tuwa pendiri pencipta"

Asli saka nitahaken saka Unicode ditemokake ing taun 1987 nalika Dzho Bekker saka Xerox, bebarengan karo Lee Collins lan Mark Davis saka Apple wiwit riset ing bidhang tumitah praktis saka pesawat karakter universal. Ing Agustus 1988, Dzho Bekker nerbitaké sawijining konsep proposal kanggo penciptaan 16-dicokot multi-lingual sistem werna internasional.

A sawetara sasi mengko Unicode grup apa ditambahi nambahi Ken Langkawi lan Mike Kernegana saka RLG, Glenn Rayt saka Sun Microsystems lan saperangan specialists liyane, mbisakake completion saka karya ing tatanan pambuka saka standar werna umum.

gambaran umum

The Unicode adhedhasar konsep simbol. Ing dhéfinisi iki nuduhake fenomena abstrak sing ana ing wangun tartamtu saka nulis lan temen maujud liwat grapheme (sing "potret"). Saben karakter wis diwenehi ing "Unicode" kode unik gadhahanipun standar unit tartamtu. Eg grapheme B uga ing Inggris lan Aksara-aksara Russian, nanging cocok kanggo Unicode 2 karakter beda. Padha tundhuk konversi kanggo cilik, t. E., Saben sing nggambaraké database tombol, karo pesawat saka situs lan jeneng lengkap.

Keuntungan Unicode

Saka contemporaries liyane enkoding "Unicode" Ana Simpenan sanget pratandha kanggo "enkripsi" karakter. Kasunyatan sing raja wis 8 bit, sing didhukung dening 28 karakter, nanging rancangan anyar wis 216 karakter, sing ana langkah buta maju. Iki maraaké encode meh kabeh aksara ana lan umum.

Kanthi tekane saka "Unicode" maneh kudu nggunakake Tabel konversi: minangka standar siji iku mung negated perlu kanggo wong-wong mau. Kajaba iku, padha dicemplungke menyang lalen, lan "ngawur" - standar siji digawe wong mokal, uga aturan metu perlu kanggo nggawe duplikat fonts.

pangembangan Unicode

Mesthi, kemajuan ora ing panggonan, lan wiwit kawitan presentation wis liwati 25 taun. Nanging, charset "perubahan" stubbornly tansah posisi ing donya. Akeh cara iki wis bisa digawe thanks kanggo kasunyatan sing wis dadi gampang kanggo ngleksanakake lan wis nyebar, diakoni gawe saka tertutup (mbayar) lan mbukak software sumber.

Kita ora kudu pracaya sing dina iki kita ndeleng kode padha "Unicode" minangka waktu abad kepungkur. Ing wayahe, iku digantèkaké versi 5.h.h, lan nomer simbol kode wis tambah 231. Ing kamungkinan saka nggunakake wates luwih tandha gelem isih njaga support kanggo Unicode-16 (enkoding, endi jumlah maksimum nomer winates sing 216). Wiwit ngadeg lan munggah kanggo versi 2.0.0 "The Unicode Standard" wis tambah nomer karakter sing klebu meh ing 2 kaping. kesempatan lan wutah terus ing taun teka. Kanggo versi 4.0.0 wis ana perlu kanggo nambah standar dhewe, lan apa kang wis kelakon. Akibaté, "Unicode" wis ketemu wangun kang kita ngerti dina iki.

Apa maning ing Unicode?

Saliyane sungguh, saya dianyari karo nomer karakter, "Unicode" -Encoding Alexa teks punika sipat liyane migunani. Iki supaya disebut-normal. Luwih saka nggulung kabeh karakter document dening karakter, lan sulih ing lambang saka Tabel Correspondence, nggunakake salah siji saka kalkulus normalake ana. Apa iku?

Tinimbang mbuang sumber daya saka komputer ing mriksa biasa saka karakter sing padha, kang uga padha ing Aksara-aksara sing beda-beda, nggunakake algoritma khusus. Nanging ngidini sampeyan kanggo nggawe simbol padha tabel telung kolom Goleki kapisah lan aplikasi wis kanggo wong-wong mau, ora liwat lan liwat maneh kanggo diperiksa maneh kabeh data.

kalkulus kuwi sing dikembangaké lan dipun ginakaken papat. Saben konversi njupuk Panggonan dening asas strictly pesti, beda saka liyane, supaya kanggo nelpon salah sijine ora bisa paling efisien. Saben dirancang kanggo kabutuhan tartamtu, iki ditempelake lan digunakake kasil.

standar penyebaran

Ing 25 taun sajarah enkoding "Unicode" sawijining aku wis nampa mbokmenawa paling wiyar ing donya. Ing standar iki sing diatur minangka program lan web-kaca. Ombone aplikasi bisa nunjukaké sing Unicode saiki digunakake dening luwih saka 60% saka sumber Internet.

Saiki, sampeyan ngerti, nalika "Unicode" standar muncul. Apa iku, sampeyan uga ngerti lan bisa kanggo appreciate pinunjul kebak ing penemuan, digawe dening grup ahli Unicode Inc. Luwih saka 25 taun kepungkur.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 jw.birmiss.com. Theme powered by WordPress.