乱码,汉字圈电脑用户难免遭遇的问题。今日又串《内核恐慌》,乱谈乱码。
本期 123 分钟,我们着眼汉字,回望字符集发展简史,一览常见遗留编码,笑看端序内战风云,携手拥抱 Unicode。
「纽伦堡内麦塔狐」,典出《字谈字畅》第二十三期)
曲)(qū/qǔ),麯 / 麴 (qū)
区位码)的「区位」即「row-cell」,日语称「区点」
各国读写电话号码的习惯);另有 ITU-T E.123),包含国际电话号码的注记格式
TeX) 指令通常以反斜杠开头
「乱码」在几种外语里的表述:
文字化け)(日语)
Mojibake)(英语,音译自日语)
Zeichensalat)(德语,直译即「符号沙拉」)
Emoji)(音译自日语「絵文字」)
JIS X 0201);前身 JIS C 6220,是日本最早的编码字符集规范
언문(諺文)/ 한글(韩字)/ 조선글(朝鲜字)),英语通称 Hangul
GBK)
「干 / 乾」这对字具有「一繁对多简」和「一简对多繁」的双重属性)
Big5(大五码)),港澳台常用的编码及字符集标准
Unicode),当下常用的三种编码格式:
芸(U+82B8)),中文「蕓」、日文「藝」的简化字
Surrogate pair),UTF-16 用以扩展编码范围
Endianness(端序)),术语典出《格列佛游记》
欢迎与我们交流或反馈,来信请致 [email protected])。如果你喜爱本期节目,也欢迎用 PayPal 或支付宝向我们捐赠,账户与联络信箱一致:[email protected]。