本文共 1738 字,大约阅读时间需要 5 分钟。
题目:
在很多软件中,输入拼音的首写字母就可以快速定位到某个词条。比如,在铁路售票软件中,输入: “bj”就可以定位到“北京”。怎样在自己的软件中实现这个功能呢?问题的关键在于:对每个汉字必须能计算出它的拼音首字母。
GB2312汉字编码方式中,一级汉字的3755个是按照拼音顺序排列的。我们可以利用这个特征,对常用汉字求拼音首字母。 GB2312编码方案对每个汉字采用两个字节表示。第一个字节为区号,第二个字节为区中的偏移号。为了能与已有的ASCII编码兼容(中西文混排),区号和偏移编号都从0xA1开始。 我们只要找到拼音a,b,c,...x,y,z 每个字母所对应的GB2312编码的第一个汉字,就可以定位所有一级汉字的拼音首字母了(不考虑多音字的情况)。下面这个表给出了前述信息。请你利用该表编写程序,求出常用汉字的拼音首字母。a 啊 B0A1b 芭 B0C5c 擦 B2C1d 搭 B4EEe 蛾 B6EAf 发 B7A2g 噶 B8C1h 哈 B9FEj 击 BBF7k 喀 BFA6l 垃 C0ACm 妈 C2E8n 拿 C4C3o 哦 C5B6p 啪 C5BEq 期 C6DAr 然 C8BBs 撒 C8F6t 塌 CBFAw 挖 CDDAx 昔 CEF4y 压 D1B9z 匝 D4D1【输入、输出格式要求】 用户先输入一个整数n (n<100),表示接下来将有n行文本。接着输入n行中文串(每个串不超过50个汉字)。 程序则输出n行,每行内容为用户输入的对应行的汉字的拼音首字母。 字母间不留空格,全部使用大写字母。 例如: 用户输入:3大家爱科学北京天安门广场软件大赛 则程序输出:DJAKXBJTAMGCRJDS分析:
1.思路:根据输入汉字的ASCII码,在题目中给的表中找对应的首字母。
2.每个汉字占2个字节,所以求汉字的ASCII码的时候需要读取数组中的2个数,然后把应该在高位的数左移2位,再加上地位的数就得出了编码。
#includeusing namespace std;const int table[27]={0xB0A1,0xB0C5,0xB2C1,0xB4EE,0xB6EA,0xB7A2,0xB8C1,0xB9FE,0xBBF7,0xBBF7,0xBFA6,0xC0AC,0xC2E8, 0xC4C3,0xC5B6,0xC5BE,0xC6DA,0xC8BB,0xC8F6,0xCBFA,0xCDDA,0xCDDA,0xCDDA,0xCEF4,0xD1B9,0xD4D1,0xFFFF}; char c[100];int pos(int n){ for(int i = 0; i < 27; ++i){ if(n < table[i]) return i-1; }}int main() { int n; cin >> n; while(n--){ cin >> c; int len = strlen(c); for(int i = 0; i < len; i+=2){ int t1 = c[i]&0x00ff; //前一个字节存高8位 int t2 = c[i+1]&0x00ff;//后一个字节存低8位 int p = pos((t1<<8)+t2); //这里是左移8位(高位加上低位) 也可以写成 t1*0x100 printf("%c",'A'+p); } cout <
下面是对中文编码处理的一些学习
#includeusing namespace std;int main() { /* 中文GB2312编码 采用 2位编码 (每位分为高4位与低4位) */ int a,b,c,d; a = 0x000f; b = 0x00f0; c = 0x0f00; d = 0xf000; int n = 0xB0A1; cout << "低四位 :"<< (n&a)<