1樓:yang leonier
中文系統中連續出現單人旁的生僻字,很有可能是SJIS的全形假名,整段文字編碼很可能是SJIS。記得有人能背下SJIS全形假名和那些生僻字的關係。
2樓:亜恵恵阿由
會熟悉一些亂碼特徵,會較快反應出來原本是哪種語言以及被錯誤地用哪種編碼。
比如看到全篇簡體字且有大量「酒」()「膠」()「父」()「撈」()等字的亂碼,可以確定是EUC-KR韓文被以GB顯示了。遇見大量半形片假名夾雜著少量複雜漢字的,基本可以確定是GB中文被以Shift_JIS顯示了。
我到現在還清楚地記得「酒福力膠」。
早期跨語言遊戲玩家對於經常看到的短語會記得一些常見的對應,但是主動去記憶它們的對應完全沒有必要,程式設計師更是不會做這種無意義的事兒,編碼轉換是常識。且GB若被以Shift_JIS顯示,因為每個字元使用的位元組數不同,兩者顯示出來的字元無法一一對應。
3樓:王贇 Maigo
現在的 CJK 文字一般都使用 UTF-8 編碼了,所以亂碼已經比較少見了。
二○○幾年的時候,日文編碼主要有兩種:EUC 和 Shift-JIS,(簡體)中文編碼主要就是 GBK。
EUC 編碼和 GBK 編碼中,假名的編碼是相同的,所以把 EUC 編碼的日文按 GBK 編碼開啟,只有漢字會亂碼。大概就是這個畫風:
この坤であなたの唉を 緘に掐れるもの
唾るライト斧つめて撕れない ahh 奇が豺けてゆく
礬はまだ 悼うことなく
艇茫と鈣べた泣」 冊ごし 海もずっと
無あふれ 賄まらなくて
己うことだけを 兜えてゆくつもり
警しでも帕えたくて 燼む看が
どんな沸賦しても やっぱり搪うのよ
この坤であなたの唉を 緘に掐れるもの
唾るライト斧つめて撕れない ahh 奇が豺けてゆく
如果文字中漢字的密度不高的話,根據假名就能猜出不少漢字,就跟完形填空一樣;常見的漢字見多了,就連猜也不用猜了。EUC 裡的漢字是按音讀順序排列的,它們的編碼對應著 GBK 的一級漢字區,這個區里的漢字是按拼音順序排列的。當你記住了一些常用字的對應關係後,還可以用二分法猜測不常見的字。
總體而言,熟練的人能看懂相當一部分。
而 Shift-JIS 編碼中的假名,按 GBK 編碼開啟後,則會變成一大堆單人旁的生僻字:
偙偺悽偱偁側偨偺垽傪庤偵擖傟傞傕偺
梮傞儔僀僩尒偮傔偰朰傟側偄 ahh 撲偑夝偗偰備偔
孨偼傑偩媈偆偙偲側偔
桭払偲屇傋偨擔乆夁偛偟崱傕偢偭偲
椳偁傆傟巭傑傜側偔偰
幐偆偙偲偩偗傪嫵偊偰備偔偮傕傝
彮偟偱傕揱偊偨偔偰彎傓怱偑
偳傫側宱尡偟偰傕傗偭傁傝柪偆偺傛
偙偺悽偱偁側偨偺垽傪庤偵擖傟傞傕偺
梮傞儔僀僩尒偮傔偰朰傟側偄 ahh 撲偑夝偗偰備偔
看上去就有一種要暈的感覺,破解難度明顯增加。不過,據說有些遊戲玩家能背下來這些生僻字與假名的對應關係,這是真愛啊!
牆外的知友,可以來看 QuizKnock 的成員們人肉解讀亂碼:
【わりと読めた】東大生なら文字化けも読検證】
為什麼很多Linux運維經驗豐富的人做不出基礎的測試題?
養貓的陌生人 如果基礎測試題偏向實務經驗或許還答得出來一點,但每個人實務經驗都有一點不同,還偏向各自的性格習慣等因素,不是每個人都會照著教科書去實踐。並且每家公司的基礎測試題,也都是主管出的,他們也擁有自己的實踐經驗,所以筆試只能當作乙個參考,不能當作是絕對的依據。 matthew tang 沒有看...
有哪些只有經驗豐富的司機才知道的駕駛技巧?
董同學 對於很多新手來說,評判是不是 老司機 的關鍵點或許在於能不能把車開得又快又穩 或者有沒有相對高階的駕駛技術如聽起來很牛X的跟趾 降檔補油 左腳剎車等不明所以的名詞。但這些技術在日常駕駛中的實際意義並不大。前邊很多答主都羅列了許多分門別類的詳細技巧,對於初學者來說,能夠認真閱讀並牢記這些細節技...
今天聽了乙個故事,A工作經驗豐富 ?
1pig豬仔 總的來說,A很容易找到工作,而這個老闆可能很難找到自己滿意的員工。A問薪酬問題,而老闆卻反問他。這種反應證明了老闆在薪酬上要麼沒想好,也就是說老闆在對A的安排上還沒想好,對A所能產生的價值沒有乙個大概的估算,甚至可能對整個專案 這個行業的薪酬都不太了解 要麼就是有乙個大概的薪酬範圍了,...