經驗豐富的人有可能從文字亂碼中直接讀出資訊嗎?

時間 2021-06-01 00:00:05

1樓:yang leonier

中文系統中連續出現單人旁的生僻字,很有可能是SJIS的全形假名,整段文字編碼很可能是SJIS。記得有人能背下SJIS全形假名和那些生僻字的關係。

2樓:亜恵恵阿由

會熟悉一些亂碼特徵,會較快反應出來原本是哪種語言以及被錯誤地用哪種編碼。

比如看到全篇簡體字且有大量「酒」()「膠」()「父」()「撈」()等字的亂碼,可以確定是EUC-KR韓文被以GB顯示了。遇見大量半形片假名夾雜著少量複雜漢字的,基本可以確定是GB中文被以Shift_JIS顯示了。

我到現在還清楚地記得「酒福力膠」。

早期跨語言遊戲玩家對於經常看到的短語會記得一些常見的對應,但是主動去記憶它們的對應完全沒有必要,程式設計師更是不會做這種無意義的事兒,編碼轉換是常識。且GB若被以Shift_JIS顯示,因為每個字元使用的位元組數不同,兩者顯示出來的字元無法一一對應。

3樓:王贇 Maigo

現在的 CJK 文字一般都使用 UTF-8 編碼了,所以亂碼已經比較少見了。

二○○幾年的時候,日文編碼主要有兩種:EUC 和 Shift-JIS,(簡體)中文編碼主要就是 GBK。

EUC 編碼和 GBK 編碼中,假名的編碼是相同的,所以把 EUC 編碼的日文按 GBK 編碼開啟,只有漢字會亂碼。大概就是這個畫風:

この坤であなたの唉を 緘に掐れるもの

唾るライト斧つめて撕れない ahh 奇が豺けてゆく

礬はまだ 悼うことなく

艇茫と鈣べた泣」 冊ごし 海もずっと

無あふれ 賄まらなくて

己うことだけを 兜えてゆくつもり

警しでも帕えたくて 燼む看が

どんな沸賦しても やっぱり搪うのよ

この坤であなたの唉を 緘に掐れるもの

唾るライト斧つめて撕れない ahh 奇が豺けてゆく

如果文字中漢字的密度不高的話,根據假名就能猜出不少漢字,就跟完形填空一樣;常見的漢字見多了,就連猜也不用猜了。EUC 裡的漢字是按音讀順序排列的,它們的編碼對應著 GBK 的一級漢字區,這個區里的漢字是按拼音順序排列的。當你記住了一些常用字的對應關係後,還可以用二分法猜測不常見的字。

總體而言,熟練的人能看懂相當一部分。

而 Shift-JIS 編碼中的假名,按 GBK 編碼開啟後,則會變成一大堆單人旁的生僻字:

偙偺悽偱偁側偨偺垽傪庤偵擖傟傞傕偺

梮傞儔僀僩尒偮傔偰朰傟側偄 ahh 撲偑夝偗偰備偔

孨偼傑偩媈偆偙偲側偔

桭払偲屇傋偨擔乆夁偛偟崱傕偢偭偲

椳偁傆傟巭傑傜側偔偰

幐偆偙偲偩偗傪嫵偊偰備偔偮傕傝

彮偟偱傕揱偊偨偔偰彎傓怱偑

偳傫側宱尡偟偰傕傗偭傁傝柪偆偺傛

偙偺悽偱偁側偨偺垽傪庤偵擖傟傞傕偺

梮傞儔僀僩尒偮傔偰朰傟側偄 ahh 撲偑夝偗偰備偔

看上去就有一種要暈的感覺,破解難度明顯增加。不過,據說有些遊戲玩家能背下來這些生僻字與假名的對應關係,這是真愛啊!

牆外的知友,可以來看 QuizKnock 的成員們人肉解讀亂碼:

【わりと読めた】東大生なら文字化けも読検證】

為什麼很多Linux運維經驗豐富的人做不出基礎的測試題?

養貓的陌生人 如果基礎測試題偏向實務經驗或許還答得出來一點,但每個人實務經驗都有一點不同,還偏向各自的性格習慣等因素,不是每個人都會照著教科書去實踐。並且每家公司的基礎測試題,也都是主管出的,他們也擁有自己的實踐經驗,所以筆試只能當作乙個參考,不能當作是絕對的依據。 matthew tang 沒有看...

有哪些只有經驗豐富的司機才知道的駕駛技巧?

董同學 對於很多新手來說,評判是不是 老司機 的關鍵點或許在於能不能把車開得又快又穩 或者有沒有相對高階的駕駛技術如聽起來很牛X的跟趾 降檔補油 左腳剎車等不明所以的名詞。但這些技術在日常駕駛中的實際意義並不大。前邊很多答主都羅列了許多分門別類的詳細技巧,對於初學者來說,能夠認真閱讀並牢記這些細節技...

今天聽了乙個故事,A工作經驗豐富 ?

1pig豬仔 總的來說,A很容易找到工作,而這個老闆可能很難找到自己滿意的員工。A問薪酬問題,而老闆卻反問他。這種反應證明了老闆在薪酬上要麼沒想好,也就是說老闆在對A的安排上還沒想好,對A所能產生的價值沒有乙個大概的估算,甚至可能對整個專案 這個行業的薪酬都不太了解 要麼就是有乙個大概的薪酬範圍了,...