字元在記憶體中最終的表示形式是什麼?是某種字元編碼還是碼位 Code Point ?

時間 2021-06-01 03:37:00

1樓:貝葉斯

通常我們會用U+0000這樣的文本來表示字元的unicode。但是它只是書面表達,並不是字元在記憶體中的儲存形式。

可以看看下圖中的關於unicode的平面和字元值(碼點),摘自wiki:

可以看出來,其實字元值最大是10FFFF,也就是4*6=24位,可以看出來值的範圍是可以用int型(32位)來表示。那麼應用在執行的時候,很有可能是使用整型或」3位元組「整型,當然不同的程式語言會有不同風格。

但是需要指出的是字符集是儲存在作業系統上的,一般來說,作業系統裡的字符集會是乙個很大的陣列,我們的碼點就是這個陣列的下標。所以,記憶體中儲存的字串一般是碼點,碼點可以使用int整型來表示。

使用碼點來表示字元有很多好處,作業系統可以根據不同的字型展示不同的字元。

最後用《深入理解計算機系統》的一句話總結一下:

資訊就是位+上下文

2樓:仇偉佳

字元在記憶體裡就是乙個或若干個byte,但這寫byte表示的含義是由編碼決定的。

比如乙個byte的值是65,在ascii裡表示'A',ascii 有128個碼位,65號是'A'。你有興趣也能自己搞個編碼,只有26個碼位,第0位是'A'。

然後提供這種編碼到各種其它編碼的轉換演算法。所謂編碼就是製造一種對映a->b

形式語義學的最終目標是什麼?

科技表音字 乙個學科的最終目標,往往很簡單,也和當前發展程度 使用的方法 流行的理論無關。語言學的語義學研究目的在於找出語義表達的規律性 內在解釋 不同語言在語義表達方面的個性以及共性。形式語義學的目標是構建組合語義,用有限的語義單元,組合出無窮的語義,並且和語法結構有一定對應關係。從理論思想來說,...

你隱藏在內心中最真實的「惡」是什麼

茉莉花 每個人心中都有屬於自己的另外一面,就像好人也有壞的一面,壞人也有好的一面。我們在評判別人好壞的同時,也要注意別人的另外一面。我們內心深處的 惡 都被自己的理性所覆蓋,但是我們還是保留著內心深處的慾望,就像我們內心深處時刻都在渴望著暴力 色情,但是我們的理性告訴我們,這是不能做的。而我內心深處...

為什麼顯示卡在記憶體中的對映是0b8000H

勝勳 有什麼歷史典故嗎?有,據說當年IBM PC記憶體容量只有640KB 16進製表示就是A0000,用8086位址格式就是A000 0000 視訊記憶體位址緊接著記憶體位址,所以 A000 0000圖形模式,容量64KB B000 0000開始是文字,文字不需要太多容量,分一半B000 0000純...