Unicode

百度在2月27日颁发的年度全球移动大奖中，华为共摘得8个奖项，其推出的5GReady超宽带无线电家族荣获最佳移动网络基础设施奖项，并凭借5G全云化解决方案和美国两家公司共同获得最佳移动技术突破奖项。

Unicode er et tegnsett som har som form?l ? skape et standard tegnsett for alle datamaskiner som st?tter alle spr?k som er i praktisk bruk. Unicode blir utviklet av en privat organisasjon kalt Unicode Consortium. Organisasjonen ble stiftet i 1991 og utga i oktober dette ?ret Unicode-standardversjon 1.0.0 med 7161 tegnkoder. Standarden er senere blitt utvidet, i mai 2019 utkom versjon 12.1 som omfatter 137 994 tegnkoder.

Unicode bruker forskjellige metoder for ? representere tegnene i filer. I UTF-32 brukes 32 bit per tegn for ? representere hele dagens Unicode-tegnsett, mens i UTF-16, som brukes i nyere versjoner av Windows, deles tegnene opp i porsjoner p? 16 bit. UTF-8 bruker sekvenser p? 8 bit, og er gjort bakoverkompatibelt med 7-biters ASCII tegnsettet som brukes i en stor andel av verdens datasystemer, slik at det enkelt kan benyttes i en rekke operativsystemer og kommunikasjon over Internett.

Fordelen med Unicode er at det tillater flerspr?klig kommunikasjon. Mens ASCII-baserte tegnsett hindrer brukeren i ? skrive p? flere spr?k innenfor ett og samme dokument, st?tter Unicode de fleste spr?k man innenfor rimelighetens grenser kan tenkes ? bruke i et datasystem. Dermed gj?r Unicode det mulig ? enkelt representere flerspr?klig data elektronisk. For mange spr?k er det uten Unicode vanskelig eller umulig ? finne applikasjoner som st?tter det.

Historie

Opprinnelsen til Unicode dateres til 1987. Det er p? denne tiden Joe Becker fra Xerox sammen med Lee Collins og Mark Davis fra Apple, begynte ? utforske mulighetene for etablering av et universelt tegnsett.

Etter innspill fra Peter Fenwick og Dave Opstad, publiserte Joe Becker et utkast til et internasjonalt tegnsettsystem i august 1988 ved navn Unicode. Han mente at navnet “Unicode” betyr et unikt, enhetlig og universelt tegnsett koding.

I dokumentet Unicode 88, presenterte Becker en 16-bit tegnsettmodell. Unicode ble skapt for ? im?tekomme behovet for en brukervennlig og p?litelig koding av verdenstekst. Unicode kan omtrent beskrives som "wide body ASCII" som har blitt strukket til 16 bit for ? omfatte tegn fra alle verdens spr?k (16 bit per tegn var mer enn tilstrekkelig for dette form?let). Den originale versjonen med 16 bit per tegn ble basert p? antagelsen at kun tegn som er i bruk p? verdensbasis b?r kunne kodes. Historiske spr?k ble ikke tatt med i vurderingen.

I begynnelsen av 1989 ble teamet som jobbet med Unicode utvidet med nye medlemmer som Ken Whistler og Mike Kernaghan fra Metaphor, Karen Smith-Yoshimura og Joan Aliprand fra RLG, og Glenn Wright fra Sun Microsystems. Senere I 1990 ble ogs? Michel Suignard og Asmus Freytag fra Microsoft og Rick McGowan fra NeXT en del av arbeidsgruppen. Mot slutten av 1990 var mesteparten av arbeidet med ? kartlegge eksisterende tegnsett fullf?rt, og et endelig utkast av Unicode var klart.

Unicode Consortium ble etablert i California, 3. januar 1991, og i oktober 1991 ble den f?rste versjonen av Unicode som standard publisert. Den andre versjonen, som dekker ogs? Han-ideografier, ble utgitt i juni 1992.

I 1996 ble en ny tegnteknikk implementert i Unicode 2.0, slik at Unicode ikke lenger var begrenset til 16 bit per tegn. Dette ?kte Unicode-kodearealet til over en million kodepunkter, noe som tillot koding av mange historiske tegn (f.eks. egyptiske hieroglyfer) og tusenvis av sjeldent brukte eller foreldede kinesiske tegn som opprinnelig ble utelukket fra Unicode.

Microsoft TrueType-spesifikasjonen versjon 1.0 fra 1992 brukte navnet Apple Unicode i stedet for Unicode som plattform-ID.

Kritikk

Unicode har mottatt en del kritikk for sin implementasjon av kinesiske tegn. Tegnene har varierende utseende i forskjellige asiatiske skriftspr?k, mens Unicode har gitt samme kode til flere av disse variantene. Samtidig inkluderer Unicode flere tegn som ser relativt like ut p? flere plasser, for ? bevare kompatibilitet med eldre tegnsett. Eldre versjoner av Unicode manglet ogs? en del kinesiske tegn, men dette har blitt korrigert i senere revisjoner. Kina har s?gar brukt Unicode som basis for sitt nye nasjonale tegnsett GB18030, som kombinerer det eldre kinesiske tegnsettet GB2312 med Unicode. GB18030 kan anses ? v?re en kinesisk ekvivalent av UTF-8.

Tastatur

Ulike operativsystemer gir p? ulike m?ter adgang til ? finne de ulike tegnsettene og deres assosierte koder. Operativsystemet Mac OS X gir enkel adgang til dette med tastekombinasjonen ??T, mens Microsoft Windows har ?Tegnkart? under tilbeh?rsmenyen. I Ubuntu trykker man CTRL+SHIFT+u og deretter koden. Flere linuxdistribusjoner er basert p? UTF-8 fra filsystemet og oppover, mens mulighetene for ? skrive det varierer.

Se ogs?

Eksterne lenker

(en) Offisielt nettsted
(en) Offisiell blogg
(en) Unicode – kategori av bilder, video eller lyd p? Commons
(en) Unicode – galleri av bilder, video eller lyd p? Commons
A Programmer’s Introduction to Unicode
DecodeUnicode – Unicode WIKI, 50 000 gifs

圣诞节的礼物什么时候送	属鼠的是什么命	元五行属什么	发财树为什么叫发财树	梦见鞋丢了是什么意思
羊膜束带是什么意思	饭中吃药是什么时候吃	血管炎不能吃什么食物	拉肚子可以吃什么食物	nibpdia过高是什么意思
什么蔬菜补钾	黄连素又叫什么名字	吃什么食物养肝	什么app可以买烟	头发厚适合剪什么发型
跑完步想吐是什么原因	怀孕周期是从什么时候开始算的	4a广告公司什么意思	嘴发苦是什么原因	人生观价值观世界观是什么意思

湿疹是什么原因hcv9jop6ns2r.cn	脚板疼是什么原因hcv9jop3ns1r.cn	贴士是什么意思hcv7jop4ns5r.cn	六月初六是什么星座hcv8jop2ns8r.cn	鸡胸是什么原因引起的hcv8jop6ns4r.cn
渴望是什么意思hcv8jop0ns4r.cn	蜱虫怕什么hcv9jop5ns2r.cn	热伤风感冒吃什么药hcv7jop5ns5r.cn	初音未来是什么hcv8jop2ns9r.cn	黑户什么意思bjhyzcsm.com
为什么喝中药会拉肚子hcv9jop6ns7r.cn	什么是氧化剂hcv8jop1ns6r.cn	生产方式是什么hcv8jop7ns1r.cn	纳字五行属什么hcv7jop6ns2r.cn	每天吃鸡蛋有什么好处和坏处hcv9jop5ns1r.cn
头不自觉的晃动是什么原因hcv9jop5ns3r.cn	L是什么hcv8jop9ns8r.cn	千年修炼是什么生肖hcv9jop3ns9r.cn	嘴唇发麻是什么病兆hcv8jop0ns0r.cn	脸肿是什么原因hcv8jop6ns1r.cn