NLP的其他分词功能测试

发表于:2018-11-12 10:04

字体: | 上一篇 | 下一篇 | 我要投稿

 作者:香港胖仔    来源:博客园

  1、命名实体识别功能测试
@TestpublicvoidtestNer(){if(NER.create("ltp_data/ner.model")<0) {
            System.err.println("load failed");return;
        }
        List<String> words =newArrayList<String>();
        List<String> tags =newArrayList<String>();
        List<String> ners =newArrayList<String>();
        words.add("中国");
        tags.add("ns");
        words.add("国际");
        tags.add("n");
        words.add("广播");
        tags.add("n");
        words.add("电台");
        tags.add("n");
        words.add("创办");
        tags.add("v");
        words.add("于");
        tags.add("p");
        words.add("1941年");
        tags.add("m");
        words.add("12月");
        tags.add("m");
        words.add("3日");
        tags.add("m");
        words.add("。");
        tags.add("wp");
        NER.recognize(words, tags, ners);for(inti = 0; i < words.size(); i++) {
            System.out.println(ners.get(i));
        }
        NER.release();
    }
  结果如下所示
   
  2、句法分析功能测试
  
/*** 句法分析功能测试*/@TestpublicvoidtestParser(){if(Parser.create("ltp_data/parser.model") < 0) {
            System.err.println("loadfailed");return;
        }
        List<String> words =newArrayList<String>();
        List<String> tags =newArrayList<String>();
        words.add("一把手");
        tags.add("n");
        words.add("亲自");
        tags.add("d");
        words.add("过问");
        tags.add("v");
        words.add("。");
        tags.add("wp");
        List<Integer> heads =newArrayList<Integer>();
        List<String> deprels =newArrayList<String>();intsize =Parser.parse(words, tags, heads, deprels);for(inti = 0; i < size; i++) {
            System.out.print(heads.get(i)+ ":" +deprels.get(i));if(i == size - 1) {
                System.out.println();
            }else{
                System.out.print("        ");
            }
        }
        Parser.release();
    }
  结果:
   
  4、语义角色标注功能测试
  
@TestpublicvoidtestSrl(){
        SRL.create("ltp_data/srl");
        ArrayList<String> words =newArrayList<String>();
        words.add("一把手");
        words.add("亲自");
        words.add("过问");
        words.add("。");
        ArrayList<String> tags =newArrayList<String>();
        tags.add("n");
        tags.add("d");
        tags.add("v");
        tags.add("wp");
        ArrayList<String> ners =newArrayList<String>();
        ners.add("O");
        ners.add("O");
        ners.add("O");
        ners.add("O");
        ArrayList<Integer> heads =newArrayList<Integer>();
        heads.add(2);
        heads.add(2);
        heads.add(-1);
        heads.add(2);
        ArrayList<String> deprels =newArrayList<String>();
        deprels.add("SBV");
        deprels.add("ADV");
        deprels.add("HED");
        deprels.add("WP");
        List<Pair<Integer, List<Pair<String, Pair<Integer, Integer>>>>> srls =newArrayList<Pair<Integer, List<Pair<String, Pair<Integer, Integer>>>>>();
        SRL.srl(words, tags, ners, heads, deprels, srls);for(inti = 0; i < srls.size(); ++i) {
            System.out.println(srls.get(i).first+ ":");for(intj = 0; j < srls.get(i).second.size(); ++j) {
                System.out.println("   tpye = "
                        + srls.get(i).second.get(j).first + " beg = "
                        + srls.get(i).second.get(j).second.first + " end = "
                        +srls.get(i).second.get(j).second.second);
            }
        }
        SRL.release();
    }
  结果如下图所示:
   


上文内容不用于商业目的,如涉及知识产权问题,请权利人联系博为峰小编(021-64471599-8017),我们将立即处理。
《2023软件测试行业现状调查报告》独家发布~

关注51Testing

联系我们

快捷面板 站点地图 联系我们 广告服务 关于我们 站长统计 发展历程

法律顾问:上海兰迪律师事务所 项棋律师
版权所有 上海博为峰软件技术股份有限公司 Copyright©51testing.com 2003-2024
投诉及意见反馈:webmaster@51testing.com; 业务联系:service@51testing.com 021-64471599-8017

沪ICP备05003035号

沪公网安备 31010102002173号