計(jì)算機(jī)中的文字表達(dá)方式.pptx
《計(jì)算機(jī)中的文字表達(dá)方式.pptx》由會(huì)員分享,可在線閱讀,更多相關(guān)《計(jì)算機(jī)中的文字表達(dá)方式.pptx(11頁珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
計(jì)算機(jī)中的文字表達(dá)方式,1.ASCII碼2.GB2312編碼3.Big5編碼4.Unicode編碼5.輸入編碼6.字型碼,一.文字表達(dá)方式的種類1.ASCII碼,ASCII(AmericanStandardCodeforInformationInterchange,美國信息互換標(biāo)準(zhǔn)代碼)是基于拉丁字母的一套電腦編碼系統(tǒng)。它主要用于顯示現(xiàn)代英語和其他西歐語言。它是現(xiàn)今最通用的單字節(jié)編碼2010年12月8日叫基礎(chǔ)ASCII碼,使用7位二進(jìn)制數(shù)來表示所有的大寫和小寫字母,數(shù)字0到9、標(biāo)點(diǎn)符號(hào),以及在美式英語中使用的特殊控制字符。ASC11碼編碼的編碼規(guī)則是在下表中確定的,它是一種約定順序編碼,每個(gè)字符在ASC11碼表中的順序號(hào)成為字符的ASC值,它有兩種形式,一種包含128個(gè)字符,另一種包含256個(gè)字符。包括128個(gè)字符的ASC碼表,ASC值范圍是0~127,計(jì)算機(jī)中使用7個(gè)二進(jìn)制位就可以表示,因此稱為7位二進(jìn)制碼。包含256個(gè)字符的ASC碼表,在7位碼表的基礎(chǔ)上,增加了對(duì)128個(gè)字符的支持。國際上7位ASC碼有廣泛的支持,對(duì)8位ASC11值支持程度較弱,尤其在中文環(huán)境下因?yàn)橥瑵h字的存儲(chǔ)編碼相沖突,8位ASC11碼值不被支持。在7位ASC11碼值中,字符總體上分為兩大類:控制字符和可顯示字符??刂谱址糜陲@示、打印、警告或傳輸過程和解釋,在頻幕上不顯示,其ASC11值得范圍是0~31及127??娠@示字符則同英文中出現(xiàn)的各種字母和個(gè)符號(hào)相對(duì)應(yīng),涵蓋了英文所需要的所有文字符號(hào),其ASC11值范圍是32~126,可細(xì)分為以下幾大類:英文字符,ASC11值范圍是32~47、58~64、91~96及123~126;數(shù)字字符,ASC11值是48~57;大寫英文字母,ASC11值是65~90;小寫英文字母,ASC11值范圍是97~122.,2.GB2312編碼,GB2312或GB2312-80是一個(gè)簡體中文字符集的中國國家標(biāo)準(zhǔn),全稱為《信息交換用漢字編碼字符集基本集》,又稱為GB0,由中國國家標(biāo)準(zhǔn)總局發(fā)布,1981年5月1日實(shí)施。GB2312編碼通行于中國大陸;新加坡等地也采用此編碼。中國大陸幾乎所有的中文系統(tǒng)和國際化的軟件都支持GB2312。GB2312標(biāo)準(zhǔn)共收錄6763個(gè)漢字,其中一級(jí)漢字3755個(gè),二級(jí)漢字3008個(gè);同時(shí),GB2312收錄了包括拉丁字母、希臘字母、日文平假名及片假名字母、俄語西里爾字母在內(nèi)的682個(gè)全角字符。ASC11碼值得出現(xiàn)有效的解決了西文文字的信息化問題,但對(duì)于漢字字符卻完全不適用,為了滿足國內(nèi)在計(jì)算機(jī)中使用文字的需要,中國國家標(biāo)準(zhǔn)總局發(fā)布了一系列的漢字字符集國家標(biāo)準(zhǔn)編碼,統(tǒng)稱為GB碼或國標(biāo)碼,其中最有影響的是與1980年發(fā)布的《信息交換用漢字編碼字符集基本集》,標(biāo)準(zhǔn)號(hào)為GB2312-1980.因其使用非常普遍,也常被統(tǒng)稱為國標(biāo)碼.GB2312是一個(gè)簡體中文字符集,由6763個(gè)常用漢字和682個(gè)全角的非漢字字符組成,其中漢字根據(jù)使用的頻率可分為兩級(jí)。一級(jí)漢字3755個(gè),二級(jí)漢字3008個(gè)。由于字符數(shù)量比較大,GB2312采用了二維矩陣編碼法對(duì)所有字符進(jìn)行編碼。首先構(gòu)造一個(gè)94列的方陣,對(duì)每一行成為一個(gè)“區(qū)”,每一列稱為一個(gè)“位”,然后將所有字符依照下表的規(guī)律填寫在方陣中。這樣所有的字符在方陣中都有一個(gè)唯一的位置,這個(gè)位置可以用區(qū)號(hào)、位號(hào)合成表示,稱為字符的區(qū)位碼。因?yàn)閰^(qū)位碼同字符的位置是完全對(duì)應(yīng)的,因此區(qū)位碼同字符之間也是一一對(duì)應(yīng)的。,3.Big5編碼,“大五碼”(Big5)是在1984年由臺(tái)灣13家廠商與臺(tái)灣地區(qū)財(cái)團(tuán)法人信息工業(yè)策進(jìn)會(huì)為五大中文套裝軟件所設(shè)計(jì)的中文內(nèi)碼,所以就稱為Big5中文內(nèi)碼,雖然五大套裝軟件并沒有成功,但Big5碼卻深遠(yuǎn)地影響中文電腦內(nèi)碼,直至今日?!拔宕蟠a”的英文名稱“Big5”后來被人按英文字序譯回中文,以致現(xiàn)在有“五大碼”和“大五碼”兩個(gè)中文名稱。大五碼是一種繁體中文漢字字符集,其中繁體漢字13053個(gè),808個(gè)標(biāo)點(diǎn)符號(hào),希臘字母及特殊符號(hào)。大五碼的編碼碼表直接針對(duì)存儲(chǔ)而設(shè)計(jì)、每個(gè)字符統(tǒng)一使用兩個(gè)字節(jié)存儲(chǔ)表示。第一字節(jié)范圍81H~FEH,避開了同ASCII碼的沖突,第二字節(jié)范圍是40H~7EH和A1H~FEH,在同一正文不能對(duì)兩種字符集的字符同時(shí)支持。,Big5編碼的字符編碼分布表,4.Unicode編碼,Unicode字符集可以簡寫為UCS(UnicodeCharacterSet)。早期的Unicode標(biāo)準(zhǔn)有UCS-2、UCS-4的說法。UCS-2用兩個(gè)字節(jié)編碼,UCS-4用4個(gè)字節(jié)編碼。UCS-4根據(jù)最高位為0的最高字節(jié)分成2^7=128個(gè)group。每個(gè)group再根據(jù)次高字節(jié)分為256個(gè)平面(plane)。每Unicode是國際組織制定的可以容納世界上所有文字和符號(hào)的字符編碼方案。Unicode用數(shù)字0-0 x10FFFF來映射這些字符,最多可以容納1114112個(gè)字符,或者說有1114112個(gè)碼位。碼位就是可以分配給字符的數(shù)字。UTF-8、UTF-16、UTF-32都是將數(shù)字轉(zhuǎn)換到程序數(shù)據(jù)的編碼方案。,UCS是一種字符集編碼法,主要用于計(jì)算機(jī)程序和操作系統(tǒng)內(nèi)部。在存儲(chǔ)和傳輸中,往往不直接使用UCS編碼而是通過一定的轉(zhuǎn)換程序來實(shí)現(xiàn)。這些轉(zhuǎn)換編碼最通用的是utf8和utf16.由于大量使用的ASC11碼字符兼容所提出的UCS的一種實(shí)現(xiàn)就是utf8.utf8就是采用變長字節(jié)表示一個(gè)字符,盡管有節(jié)約存儲(chǔ)和傳輸資源的好處,但也同時(shí)導(dǎo)致軟件實(shí)現(xiàn)有困難。平面根據(jù)第3個(gè)字節(jié)分為256行(row),每行有256個(gè)碼位(cell)。group0的平面0被稱作BMP(BasicMultilingualPlane)。將UCS-4的BMP去掉前面的兩個(gè)零字節(jié)就得到了UCS-2。,五輸入編碼,世界上使用漢字的人口約占世界總?cè)丝诘乃姆种?,因此研究和發(fā)展?jié)h字輸入編碼是一項(xiàng)非常急迫的任務(wù)。中國是漢字的發(fā)源國,漢字應(yīng)用已有數(shù)千年歷史。一九八七年中國研究漢字輸入編碼的人員已近四百人,不論在深度和廣度上,都走在世界前列。漢字從形編碼利用人們已有的漢字書寫知識(shí),在鍵盤上象寫字一樣打入筆畫和字根,從計(jì)算機(jī)內(nèi)選出漢字,既直接又方便。從音編碼是以一九五八年二月十一日全國人大批準(zhǔn)公布的《漢語拼音方案》為基本編碼元素。漢語拼音是以北京語音為標(biāo)準(zhǔn)音,以北方語為基礎(chǔ)方言,以典范的白話文著作為語法規(guī)范的普通話。自推廣普通話以來,已有相當(dāng)數(shù)量的人掌握了漢語拼音,以此為基礎(chǔ)作漢字輸入編碼,為這部分人所樂于接受。但中國各地方言復(fù)雜,不少人還難以做到準(zhǔn)確認(rèn)讀漢字,因此容易出現(xiàn)差錯(cuò)。,6.字型碼,漢字字型碼又稱字字模,用于漢字在顯示屏或打印機(jī)輸出。漢字字型碼通常有兩種表示方式:點(diǎn)陣和矢量表示方法。用點(diǎn)陣表示字型時(shí),漢字字型碼指的是這個(gè)漢字字型點(diǎn)陣的代碼。根據(jù)輸出漢字的要求不同,點(diǎn)陣的多少也不同。簡易型漢字為16*16點(diǎn)陣,提高型漢字為24*24點(diǎn)陣,32*32點(diǎn)陣,48*48點(diǎn)陣等等。點(diǎn)陣規(guī)模愈大,字型愈清晰美觀,所占存儲(chǔ)空間也愈大矢量表示方式存儲(chǔ)的是描述漢字字型的輪廓特征,當(dāng)要輸出漢字時(shí),通過計(jì)算機(jī)的計(jì)算,由漢字字型描述生成所需大小和形狀的漢字點(diǎn)陣。矢量化字型描述與最終文字顯示的大小,分辨率無關(guān),因此可以產(chǎn)生高質(zhì)量的漢字輸出。Windows中使用的TrueType技術(shù)就是漢字的矢量表示方式。,二.文字輸入到顯示流程,將字符寫入一個(gè)MN的空白方格中,對(duì)表格中每個(gè)方格用一個(gè)比特(Bit)來表示,字符通過的方格用“1”表示,未通過的方格用“0”來表示,這樣將每個(gè)方格的值按照從左到右,從上到下的順序?qū)懴聛?,就形成了字符的點(diǎn)陣字型碼。顯示漢字時(shí),則執(zhí)行相反的過程,對(duì)于點(diǎn)陣字形為“0”的比特,在頻幕中像素顯示為背景色,而為“1”的比特,則顯示為前景色。根據(jù)點(diǎn)陣編碼時(shí)使用的表格大小,常用的漢字點(diǎn)陣字庫一般分為16點(diǎn)陣、24點(diǎn)陣、32點(diǎn)陣等格式。每個(gè)漢字碼占(MN)/8個(gè)字節(jié)數(shù)。點(diǎn)陣字型碼顯示漢字的熟讀很快,但在進(jìn)行放大時(shí)由于使用字塊填充,會(huì)出現(xiàn)明顯的鋸齒邊緣。因此點(diǎn)陣字庫一邊不用于圖形環(huán)境,常用在字符操作界面中。,1.點(diǎn)陣編碼法,文字輸入到顯示流程,2.矢量編碼法,文字字符的字形信息都是由多個(gè)筆畫子圖形組成的,適量編碼發(fā)將組成的字符每一筆畫用一組直線勾勒,然后按一定順序?qū)Ω鞴P畫一體組適量來表示.顯示漢字是,首先從矢量庫中檢索字型碼。矢量編碼法所占存儲(chǔ)空間的字節(jié)數(shù)不是固定的,取決于字符本身的復(fù)雜度,一般來講,所含筆畫越多,筆畫越復(fù)雜的字符,字型碼所占空間越大。矢量字符在顯示時(shí),需要進(jìn)行大量的矢量計(jì)算,耗費(fèi)時(shí)間要長一些。但矢量字形方法是以幾何方法精確勾畫輪廓的,因此具有無級(jí)縮放的優(yōu)點(diǎn)。目前,矢量字形廣泛應(yīng)用在各種圖形用戶界面的系統(tǒng)以及文本的打印輸出環(huán)境。,計(jì)算機(jī)中的文字表達(dá)方式,,完,- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 計(jì)算機(jī) 中的 文字 表達(dá)方式
鏈接地址:http://kudomayuko.com/p-3589358.html