tag gbk

標籤
貢獻4
21
04:50 PM · Nov 21 ,2025

@gbk / 博客 RSS 訂閱

Adam - 字符集和字符編碼什麼關係

嚴格來説,字符集和字符編碼不是一個概念: 字符集定義了字符和二進制的對應關係,為每個字符分配了唯一的編號。可以將字符集理解成一個很大的表格,它列出了所有字符和二進制的對應關係,計算機顯示文字或者存儲文字,就是一個查表的過程。 字符編碼規定了如何將字符的編號存儲到計算機中。如果使用了類似 GB2312 和 GBK 的變長存儲方案(不同的字符佔用的字節數不一樣),那麼為了區分一個字符到底使用了幾個字節

gbk , utf-8 , 字符編碼 , unicode , 字符集

收藏 評論

編程碼農 - 記錄一個關於 GBK 編碼的問題

背景 區分 UTF-8 和 GBK GBK 是在國家標準 GB2312 基礎上擴容後兼容 GB2312 的標準,專門用來解決中文編碼的,是雙字節的,不論中英文都是雙字節的。 UTF-8 是一種國際化的編碼方式,包含了世界上大部分的語種文字(簡體中文字、繁體中文字、英文、日文、韓文等語言),也兼容 ASCII 碼。 雖然 GBK 比 UTF-8 少節省兩個字節,但是 GBK 只包含中文,UTF-8

gbk , utf-8 , JAVA

收藏 評論

Jeffid - PHP字符串移除emoji字符

前言 在做一個電商項目使用微信支付發起訂單付款時,遇到遇到因商品描述字段含有 emoji 字符微信接口返回字符集超出UTF-8範圍的錯誤提示。 於是特意在網上查找了些解決方案,有通過正則過濾的,也有通過字符集過濾的,經過權衡我最終在項目中採用的是字符集過濾的方案。 正則過濾方案 解決原理是UTF-8編碼長度超過3個字節(一般中文3個字節)的全部替換成空字符串 $str = '平安,喜樂。PA

gbk , php , utf-8 , emoji

收藏 評論

禹鼎侯 - 編碼格式介紹及C語言處理漢字編碼

什麼是編碼格式 從一個小問題引入 我們在學習C語言的時候,有一道必做的題目是將大寫字母轉換成小寫,相信有點基礎的同學都能不加思索的寫出下面的代碼: char toLower(char upper){ if (upper = 'A' upper = 'Z'){ return upper + 32; }else{ return upper; }

iconv , gbk , utf-8 , 編碼 , c

收藏 評論