Let's Go!

如何用java随机生成一个汉字?

上一篇 / 下一篇 2009-04-30 11:13:44 / 个人分类：JAVA学习&编程相关

思路：生成一个随机数----转换成16进制或其他码值------转换成汉字字符---显示

生成一个随机数，在0x5000到0x9000之间的都是汉字

我只讲原理，但具体到你使用什么编程工具是你自己的问题。

任何编程开发工具都有随机数这个概念，而我们的区位码正好是由四位数字组成的，区位输入法可以输入GB2312-80的全部汉字，因此只需要随机产生一个四位的数字，并把这个数字换成区位码就成输出一个汉字，至于区位码中的空数你自己去查一查，用一段假设语句把它们排除掉。

=============================================================

区码: 汉字内码高位 - 0xA0
位码: 汉字内码低位 - 0xa0

区号：01－87，汉字从16区开始,前15区为各种符号
位号：01－94
第一个汉字“啊”的区号为16，位号为01
续：
两字节内码：区号+0xA0 , 位号+0xa0
如：第一个汉字“啊”的区号为16，位号为01，则其内码为 0xb0,0xa1

======> 区号：16---87 位号：01---94

=========================================================

JAVA 区位码于汉字的互换

import java.io.UnsupportedEncodingException;

public class Test {
// 发代码之前先转段预备知识
//
// 计算机处理汉字信息的前提条件是对每个汉字进行编码，这些编码统称为汉字编码。汉字信息在系统内传送的过程就是汉字编码转换的过程。
// 汉字交换码：汉字信息处理系统之间或通信系统之间传输信息时，对每一个汉字所规定的统一编码，我国已指定汉字交换码的国家标准“信息交换用汉字编码字符集——基本集”，代号为GB
// 2312—80，又称为“国标码”。
// 国标码：所有汉字编码都应该遵循这一标准，汉字机内码的编码、汉字字库的设计、汉字输入码的转换、输出设备的汉字地址码等，都以此标准为基础。GB
// 2312—80就是国标码。该码规定：一个汉字用两个字节表示，每个字节只有7位，与ASCII码相似。
// 区位码：将GB
// 2312—80的全部字符集组成一个94×94的方阵，每一行称为一个“区”，编号为0l～94；每一列称为一个“位”，编号为0l～94，这样得到GB
// 2312—80的区位图，用区位图的位置来表示的汉字编码，称为区位码。
// 机内码：为了避免ASCII码和国标码同时使用时产生二义性问题，大部分汉字系统都采用将国标码每个字节高位置1作为汉字机内码。这样既解决了汉字机内码与西文机内码之间的二义性，又使汉字机内码与国标码具有极简单的对应关系。
// 汉字机内码、国标码和区位码三者之间的关系为：区位码（十进制）的两个字节分别转换为十六进制后加20H得到对应的国标码；机内码是汉字交换码（国标码）两个字节的最高位分别加1，即汉字交换码（国标码）的两个字节分别加80H得到对应的机内码；区位码（十进制）的两个字节分别转换为十六进制后加A0H得到对应的机内码。

public String bytes2HexString(byte b) {
return bytes2HexString(new byte[] { b });
}

// 汉字转换成区位码
public String bytes2HexString(byte[] b) {
String ret = "";
for (int i = 0; i < b.length; i++) {
String hex = Integer.toHexString(b[i] & 0xFF);
if (hex.length() == 1) {
hex = '0' + hex;
}
ret += hex.toUpperCase();
}
return ret;
}

// 汉字转换成区位码
public String getString(String chinese) {
byte[] bs;
String s = "";
try {
bs = chinese.getBytes("GB2312");

for (int i = 0; i < bs.length; i++) {
int a = Integer.parseInt(bytes2HexString(bs[i]), 16);
s += (a - 0x80 - 0x20) + "";
}
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
return s;
}

// 区位码转换成汉字
public String CodeToChinese(String code) {
String Chinese = "";
for (int i = 0; i < code.length(); i += 4) {
byte[] bytes = new byte[2];
String lowCode = code.substring(i, i + 2);
int tempLow = Integer.parseInt(lowCode);
tempLow += 160;
bytes[0] = (byte) tempLow;
String highCode = code.substring(i + 2, i + 4);
int tempHigh = Integer.parseInt(highCode);
tempHigh += 160;
bytes[1] = (byte) tempHigh;
String chara = new String(bytes);
Chinese += chara;
}
return Chinese;
}

// 测试
public static void main(String[] args) throws Exception {
String str = "创";
Test test = new Test();
String s = test.getString(str);
System.out.println(s);
String a = test.CodeToChinese(s);
System.out.println(a);
}

}

--------------------------------------------------------------

Excel2007生成随机姓名

在实际生活中，我们经常需要列出一系列随机的数据用以辅助说明问题。使用Excel2007的RAND函数，可以很方便地生成随机数字；可是，当需要用到人员姓名的时候则很头痛，使用张1、张2、张3之类的名字太难看了，而若想要生成看上去“真实”的随机姓名，笔者找遍百度也没有发现合适的，只好自己来实现了。
　　国人的姓名，是分别由姓和名两部分组成，因此我们只需要生成随机的姓，再生成随机的名，组合即可。
　　常用的姓氏比较好查，在百度（www.baidu.com）里搜索“百家姓”就可以找到。打开Excel2007新建一个工作簿，将工作表Sheet2更名为“常用姓氏表”，把这些常见的姓氏复制到其中，并整理为一列。笔者找到的常用姓氏占单元格A2:A158共计157个。（提示：可以使用“数据-数据工具-分列”菜单项方便将数据拆分）
　　用作名字的字词比较多，在百度里搜索“常用名”、“常用字”或“常用名字”等都找不倒合适的数据。最终搜索关键词“取名常用字”，找到了大量用在名字中的单字和词。同样的方法将其添加到的Sheet3中，整理为一列，并将工作表更名为“常用名表”。笔者找到的常用名字占单元格A2:A424共计423个。
　　将工作表Sheet1更名为“随机姓名”，在A2单元格输入公式“=INDEX(常用姓氏表!$A$2:$A$158,INT(RAND()*157+1))&INDEX(常用名表!$A$2:$A$424,INT(RAND()*423 +1))”，然后将此公式复制到表格的其他位置，即可生成批量随机姓名。
　　简单介绍一下公式各部分的含义：
　　1、RAND函数，可以得到一个介于0和1之间的随机小数。
　　2、INT函数，将得到数字的整数部分。
　　3、生成指定范围内随机整数通常采用如下公式“INT(RAND()*(上界-下界+1)+下界”。例如“INT(RAND()*157+1)”可以生成1～157之间（含）的随机整数。
　　4、INDEX函数可以得到指定范围内指定位置的数值。
　　5、“&”符号，可以将两段文字连接起来生成一段新的文字。
　　如此，把生成的随机姓名放到数据之中，数据也就显得正规多了。
参考：http://www.officeba.com.cn/article/htmldata/detail/2008/7/3/2285.html