`

[转]Pinyin4j入门教程

阅读更多
原文地址:http://blog.csdn.net/hfhwfw/article/details/6030816
pinyin4j是一个支持将简体和繁体中文转换到成拼音的Java开源类库,作者是Li Min (xmlerlimin@gmail.com)。以下是一些具体的介绍和使用方式。

1.       pinyin4j的官方下载地址http://sourceforge.net/projects/pinyin4j/files/,目前最新的版本是2.5.0
 

2.       下载解压后的目录结构及说明如下
  
(1)     doc : pinyin4j的api文档
(2)     lib : pinyin4j的jar包
(3)     src : pinyin4j的源代码
(4)     CHANGELOG.txt : pinyin4j的版本更新日志
(5)     COPYING.txt : LICENSE说明
(6)     README.txt : pinyin4j的概要介绍


3.       运行GUI demo
命令行执行cd ${pinyin-install-dir}/lib,进入到pinyin4j-2.5.0.jar所在的目录,敲入java -jar pinyin4j-2.5.0.jar执行,GUI界面如下:
 
   

上图是输入汉字“中”,执行Convert to Pinyin后的截图。Format后有三个下拉框,第一个下拉框有三个选项,用来控制生成的拼音声调的显示方式,三个方式及其效果如下(以汉字“中”,选中Formatted hanyu Pinyin选项卡测试):
WITH_TONE_NUMBER(以数字代替声调) :  zhong1  zhong4
WITHOUT_TONE (无声调) :                           zhong   zhong
WITH_TONE_MARK (有声调) :                      zhōng  zhòng
第二个下拉框是碰到unicode 的ü 、v 和 u时的显示方式,共有三个方式, 以下是以声调为WITH_TONE_NUMBER方式显示汉字“吕”示例:
WITH_U_AND_COLON : lu:3
WITH_V :            lv3
WITH_U_UNICODE :    lü3
第三个下拉框是控制生成的拼音是以大写方式显示还是以小写方式显示,以汉字“国”示例如下:
LOWERCASE :guó
UPPERCASE :GUÓ
上图的汉字转化成拼音后,有六种显示方式,这是因为pinyin4j支持将汉字转化成六种拼音表示法。其对应关系是:汉语拼音-Hanyu Pinyin,通用拼音-Tongyong Pinyin, 威妥玛拼音(威玛拼法)-Wade-Giles  Pinyin, 注音符号第二式-MPSII Pinyin, 耶鲁拼法-Yale Pinyin和国语罗马字-Gwoyeu Romatzyh。

4.  字符串转化成拼音Java代码示例
代码:

[java:nogutter] view plaincopyprint?
package testcase; 
 
import net.sourceforge.pinyin4j.PinyinHelper; 
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType; 
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat; 
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType; 
import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType; 
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination; 
 
public class PinYinUtil { 
     
    public static String getPinYin(String inputString) { 
         
        HanyuPinyinOutputFormat format = new HanyuPinyinOutputFormat(); 
        format.setCaseType(HanyuPinyinCaseType.LOWERCASE); 
        format.setToneType(HanyuPinyinToneType.WITH_TONE_MARK); 
        format.setVCharType(HanyuPinyinVCharType.WITH_U_UNICODE); 
 
        char[] input = inputString.trim().toCharArray(); 
        StringBuffer output = new StringBuffer(""); 
 
        try { 
            for (int i = 0; i < input.length; i++) { 
                if (Character.toString(input[i]).matches("[//u4E00-//u9FA5]+")) { 
                    String[] temp = PinyinHelper.toHanyuPinyinStringArray(input[i], format); 
                    output.append(temp[0]); 
                    output.append(" "); 
                } else 
                    output.append(Character.toString(input[i])); 
            } 
        } catch (BadHanyuPinyinOutputFormatCombination e) { 
            e.printStackTrace(); 
        } 
        return output.toString(); 
    } 
     
    public static void main(String[] args) { 
        String chs = "我是中国人! I'm Chinese!"; 
        System.out.println(chs); 
        System.out.println(getPinYin(chs)); 
    } 
     

运行结果:我是中国人! I'm Chinese!
           wŏ shì zhōng guó rén ! I'm Chinese!

附件:
1.各种拼音说明
Yale Pinyin是在第二次世界大战期间由美国军方发明的编码系统,主要为了让在中国地区作战的美军士兵能够快速地熟悉汉语发音,能够向当地人请求帮助,可以说这是一个速成教材,它的目的甚至不是用来互相交流而是使士兵在发音时不会被中国人听错就可以了。
Gwoyeu Romatzyh:即国语罗马字,它是由林语堂提议建立的,在1928年由国民政府大学堂颁布推行。在中国的台湾省这一编码体系得到了保留,但是它就像 Yale一样现在几乎很少有人使用,在1986年,国语罗马字被国语注音符号第二式(MPSII)所取代,在2002年,又被通用拼音(Tongyong Pinyin)取代,成为台湾今天正式的官方汉语音译编码体系。
威妥玛拼音,习惯称作威妥玛拼法或威玛式拼音、韦氏拼音、威翟式拼音,是一套用于拼写中文普通话的罗马拼音系统。19世纪中叶由英国人威妥玛(Thomas Francis Wade)发明,后由翟理斯(Herbert Allen Giles)完成修订,并编入其所撰写的汉英字典。

参考资料:
1.       pinyin4j的官方资料
2.       汉语言的罗马化
http://icookies.spaces.live.com/blog/cns!2CC37E2F87FB3864!170.entry
3.       Wiki: 威妥瑪拼音(维基百科)
http://wapedia.mobi/zh/威妥玛拼音
分享到:
评论

相关推荐

    pinyin4j.zip pinyin4j.jar

    Pinyin4j是一个功能强悍的汉语拼音工具包,是sourceforge.net上的一个开源项目。 包里面有 pinyin4j.zip pinyin4j.jar 两种

    pinyin4j-2.5.0-API文档-中文版.zip

    赠送jar包:pinyin4j-2.5.0.jar; 赠送原API文档:pinyin4j-2.5.0-javadoc.jar; 赠送源代码:pinyin4j-2.5.0-sources.jar; 赠送Maven依赖信息文件:pinyin4j-2.5.0.pom; 包含翻译后的API文档:pinyin4j-2.5.0-...

    pinyin4j-2.5.1.jar

    pinyin4j-2.5.1.jar、汉字转拼音 pinyin4j-2.5.1.jar、汉字转拼音 pinyin4j-2.5.1.jar、汉字转拼音

    Pinyin4j简单使用教程.docx

    Pinyin4j简单使用教程.docx,Pinyin4j简单使用教程.docx

    pinyin4j.jar中文转拼音及多音字配置文件

    Java pinyin4j.jar中文转拼音 详细可查看我的博客https://me.csdn.net/Extraordinarylife 中《Java pinyin4j.jar中文转拼音 》

    pinyin4j最新jar包,汉字转pinyin必备

    pinyin4j最新jar包,包含反编译过的jar包源码文件,使用说明必看.

    Pinyin4j简单使用教程

    Pinyin4j简单使用教程

    pinyin4j工具类和jar包

    Pinyin4j的基本用法 1. 简单介绍 有时候,需要将汉字编程对应的拼音,以方便数据的处理。比如在Android手机应用的开发上,要查询联系人的姓名,通常都是用拼音进行查询的。比如要查询“曹孟德”,就可以输入“cmd”...

    pinyin4j(解决多音字问题源码)

    pinyin4j(解决多音字问题源码),pinyin4j源码没有解决多音字的问题,这是一个解决能解决多音字的pinyin4j源码,但是里面的词库不是很全,你可以根据自己的需要进行添加。

    pinyin4j-2.5.0.jar

    里面包含pinyin4j-2.5.0.jar和使用示例PinyinUtils.java,可以帮助使用者快速理解并使用pinyin4j-2.5.0.jar实现java汉字转拼音或拼音首字母

    汉语转换成拼音的jar包pinyin4j-2.5.0版本

    Java中,汉语转换成拼音的jar包。放到项目下,直接引用pinyin4j-2.5.0.jar就行。或者直接放到maven本地资源文件下解压压缩包直接再项目配置文件中引用。

    汉字转拼音库pinyin4j

    java版本汉字转拼音库pinyin4j,以及pinyin4j中用到的sparta库,都是源码。

    PinYin4jUtils PinYin4j使用案例

    PinYin4jUtils PinYin4j使用案例

    pinyin4j-2.5.0.jar 下载 java汉字转拼音 jar包 附带超级简单小dome

    pinyin4j-2.5.0.jar用于将汉字转拼音,用于实际项目汉字排序、汉字分类等功能

    基于java的开发源码-中文转拼音库 pinyin4j.zip

    基于java的开发源码-中文转拼音库 pinyin4j.zip 基于java的开发源码-中文转拼音库 pinyin4j.zip 基于java的开发源码-中文转拼音库 pinyin4j.zip 基于java的开发源码-中文转拼音库 pinyin4j.zip 基于java的开发源码-...

    pinyin4j.zip

    pinyin4j 工具类的jar包,基于maven的配置 &lt;groupId&gt;net.sourceforge.pinyin4j&lt;/groupId&gt; &lt;artifactId&gt;pinyin4j &lt;version&gt;2.5.0 pinyin4j-2.5.0.jar pinyin4j-2.5.0.pom

    pinyin4j.jar

    pinyin4j-2.5.0.jar

    pinyin4j-2.5.0.rar

    Pinyin4j是一个流行的Java库,支持中文字符和拼音之间的转换,拼音输出格式可以定制,在项目中经常会遇到需求用户输入汉字后转换为拼音的场景,这时候Pinyin4j就可以派上用场

Global site tag (gtag.js) - Google Analytics