首 页 中心简介 研究机构 新闻动态 课题项目 研究成果 工具资源 网站论坛 华语网站导航
研究热点
 全球华语词典
 全球华语研究
 全球华语语料库
 全球华文媒体调查
 全球华语用字用语研究
 全球华文教材研究
 全球留学生作文研究
   
资源推荐
 东南亚华语例句检索
 东南亚华语用字用语检索
 东南亚留学生作文检索
 华语语料库建设工具
 华语语料库字词统计工具
 华语语料库自动分词工具
 华语语料库自动标引工具
   
 
全球华语网:工具资源
面向华语语料库的文献情报自动标引
    为了更好地研究华语,特别是从语体角度入手研究华语的领域分类的语言学特征,中心开发了面向华语语料库的文献情报自动标引系统。
    基于自主研发的中文信息处理技术,以文本内容语义计算、文本内容自动标引为核心,“文献自动标引解决方案”集成文本分类、主题词标引和自动文摘三个子模块,将文献内容以精练准确的形式,如类目、主题词、摘要自动标引出来。
    集成类目标引(支持多层级、兼类)、主题词标引(可选叙词、自由词、关键词)和自动摘要(可自定义摘要参数)模块。类目体系可由用户自定义,支持动态增加删除;支持主题词词表用户管理;新分类体系可完全自动训练,无需人工干预;支持体系类目间的相似度计算。
    基本特点:
    ◆ 分类速度极快,批处理1000篇6千字文耗时约10秒。
    ◆ 正确率高,在3万篇开放测试集上,F值约93%。
    ◆ 用户可根据需要在分类体系中动态增加删除类目,系统自动训练。
    ◆ 支持自动训练,提供新分类体系和相对应文档,能够自动训练、分类。
    ◆ 交叉多层级立体分类,支持多级分类,可选兼类。
    ◆ 可显示类别间相似度,以分析了解分类体系是否设计合理。
    ◆ 分类方法支持领域知识、统计等多种方法。
    在线演示:面向华语语料库的文献情报自动标引
 
版权所有 2006 © 海外华语研究中心 全球华语网

地址:广州市广园东路暨南大学华文学院海外华语研究中心 邮编:510610
网址:http://huayu.jnu.edu.cn Email:liuhua0461@sina.com  管理员登陆