科技知识组织体系的协同工作系统和辅助工具开发
http://stkos.imicams.ac.cn/tcs
http://stkos.imicams.ac.cn/termbase
科技知识组织体系共享服务平台建设
课题建设了一系列的有自主知识产权的软件系统,如科技知识组织体系(STKOS)的发布服务系统、科技知识组织体系(STKOS)相关工具的集成服务系统、第三方信息服务系统中STKOS的检索应用示范系统,服务于我国知识组织体系建设的需要。
目前,课题建成的软件系统已经集成为“科技知识组织体系共享服务平台”,对公众提供STKOS的发布服务,并且可以通过接口规范,有效利用这一平台提供的查询、检索、推理、标引等服务,让STKOS可以服务于我国科技信息服务机构的知识组织、管理和揭示工作之中。另一方面,此平台提供的相关方法和工具,将满足我国科技信息服务机构的对知识组织工作开展所需的技术需求,有效提高我国科技信息服务机构的知识组织能力。
课题在第三方信息服务系统开展了应用示范。通过STKOS开放知识组织引擎的开放查询和语义推理接口,将STKOS有机嵌入到第三方信息服务系统之中,能够加强第三方信息服务系统的语义检索和知识推理能力,有效地提高第三方信息服务系统的语义检索能力。实现知识组织体系的应用模式和应用方法创新。
课题的许多相关成果在多个行业内有着巨大市场,可以在信息服务行业、知识处理行业、科学界、科技管理界得到充分的利用。对于一些简单的软件工具,可以通过产品化方式推出软件产品;而作为整体的“科技知识组织体系共享服务平台”,课题将形成一个服务品牌,将其建设成为我国知识组织和管理的一个重要的基础设施。
面向外文科技知识组织体系的大规模语义计算关键技术研究
本课题与国家“科技文献资源建设与共享服务”的建设结合密切,为其提供配套关键技术。“科技文献资源建设与共享服务”的建设为本课题大规模语义计算提供了基础数据内容和长期、稳定的数字化信息来源,而本项目的研究成果将直接应用于“国家科技图书文献中心”等科技文献资源建设与共享服务的重点服务机构和系统,有助于推动海量科技信息资源的深层次开发和利用。
目前,项目成果已经应用于与民生银行签订的考试主观题判卷项目,与湖南情报所的领域知识标注项目,与北京理工大学的专利与图书分类法映射项目当中。
所构建的标注语料库是国际上第一个面向科技文献的覆盖分词、词性标注、句法和语义信息的大规模语料库。
本课题的研究成果在自然语言处理和知识组织处理相关领域取得了研究的进展,所开发与集成的工具以独立的bundles的形式集成在一起,提供统一的平台服务,具有良好的实用价值及推广前景。
序号 | 成果名称 | 类型(应用/转让/预计应用/预计转让) | 效益 | 说明 |
1 | 句法和语义人工标注平台 | 应用 | 20.1万 | |
2 | 深层语义分析标注 | 应用 | 2万 | |
3 | 映射算法 | 应用 | 10万 |
信息资源自动处理、智能检索与STKOS应用服务集成
课题建设了一系列的拥有自主知识产权的软件系统和工具,如西文科技文献标注软件、个性化推荐系统、标准内容指标加工工具等,其核心技术融入智能检索系统,实现NSTL海量科技文献信息资源的有效组织、深度揭示和知识化关联,面向全国用户服务,不仅提升了NSTL科技信息资源的知识组织、知识管理和内容主题揭示能力,并且,通过接口规范将这种增强的服务能力开放到全社会,便于国内其他信息服务机构,科技信息情报服务机构的利用,在增强国家科技文献信息资源充分揭示和利用的同时,也不断加深NSTL对国内情报机构的服务深度和服务能力。
课题产出的标准内容指标系列工具成果已经投入运行,领域专家使用该工具进行石油天然气管道标准内容指标数据库的建设,目前,该数据库已经应用于中国石油管道局,为公司技术人员提供了深度服务,用户给予了较高的评价,取得了良好的服务效果。
课题的许多相关成果在多个行业内有着巨大市场,可以在信息服务行业、知识处理行业、科学界、科技管理界得到充分的利用。对于一些简单的软件工具,可以通过产品化方式推出软件产品;而作为整体的“NSTL智能检索平台”将与NSTL生产系统逐渐融合,提升NSTL对广大科技工作者和科技情报服务机构的服务深度和服务能力。
基于STKOS的知识服务应用示范
http://kos.aginfra.cn:8080/category/login.html
目前,课题研究部署的应用示范系统,已经面向“肿瘤”、“水稻”等领域开展了初步应用示范。课题组已经与北京协和医院,医科院基础所、儿研所、中科院植物所、中国农科院水稻所等组织机构的多类用户进行了需求调研、宣传推广、系统试用和交流反馈。例如:
试用用户普遍表示“基于STKOS的科技监测应用示范系统”揭示的热点和突发主题与当前研究领域内的实际情况基本吻合,系统基本可以满足用户的科研、临床需求,并与SCI、PubMed等数据库形成了有益的补充。在医学知识组织体系的应用方面,用户普遍表示有所了解,但均未在实际的临床、科研工作中使用和操作过,因此对医学知识组织体系在监测系统中的应用原理不关注,但是比较系统最终展示的结果,用户普遍认为应用了知识组织体系后,可以更方便的了解到相关研究领域的概貌,从宏观上把握相关研究领域的整体动态。基本达到了本系统的建设目的。
基于知识结构与知识演化分析示范系统,先后完成了hybrid rice, rice breeding, rice yield三个水稻子领域的知识结构与知识演化的案例分析,并生成分析报告及专家用户分析结果反馈调查问卷。分析结果表明:基于STKOS术语的分析结果中知识结构主题标识更规范化、重点领域的揭示更为突出; 知识演化路径中所揭示的各种演化现象同样与实际相符,且更能切合实际地解释科研热点问题的演变过程。
领域科研信息环境示范系统,与中国水稻所服务示范对接,用户需求搜集,水稻专业资源提供,用户服务开展。结合国家“十二五”重大专项,根据中国农业科学院学科建设与发展的实际,选取水稻领域,经过水稻领域专业资源采集与应用本体实例库建设、示范系统本地化部署等步骤,初步完成了水稻领域科研信息环境的搭建,为开展水稻领域的科研研究提供了更专业、深度的知识化服务。
通过本课题的研究,建立了基于STKOS的科技监测、知识结构与知识演化分析、学术关系网络、领域科研信息环境及科技资源多维关联的资源模型、分析模型和指标体系和各类型应用示范系统。
通过用户试用反馈得出,研制的各类应用示范系统对于科研用户在开展科学研究工作中可以起到较好的辅助作用,有助于系统揭示专家领域的研究热点和突发主题,分析专业领域知识的结构及变化过程,展示专业领域的学术关系网络图谱,更便捷地获取专业领域的各类信息资源和知识服务,具有广泛的应用前景。
课题研究过程中,由于尽量坚持并执行了规范化、标准化和模块化的设计思想和开发要求,因此,研究形成了一系列带有共性技术特点的示范系统和工具,可以在不同专业领域进行快速移植和应用推广。
在应用服务过程中,主要有两种方式:一种方式是可以直接访问已经构建的应用示范系统,并根据用户需要进行资源和功能的丰富完善。另一种方式是建立其他专业领域新的示范系统,重点需要开展新领域示范系统的本地化部署,并收集、整理和丰富示范领域多类型数据,深度加工处理与分析计算各类数据资源,以及开展示范系统的应用测试与功能完善。
序号 | 成果名称 | 类型(应用/转让/预计应用/预计转让) |
1 | STKOS在农业科技文摘数据检索系统示范 | 应用 |
2 | STKOS在中科院重要会议开放资源采集系统示范 | 应用 |
3 | STKOS在文献情报中心检索服务示范 | 应用 |
《汉语主题词表》(工程技术版)与英文超级科技词表的映射研究
本课题所完成的面向外文文献的超级科技词表和《汉表》的映射体系,实现了工程技术学科的中外文词表的映射,基本覆盖了工程技术的各个领域。该映射表的开放服务和推广使用,能够使专业用户直接利用或通过定制的方式形成专业映射表,应用于中外文文献资源的整合组织和跨语言检索,避免各领域各自为政、自编自用的重复劳动,极大地节省研究经费的投入。能够促进和加快中外文文献信息资源知识组织的整合,方便用户的跨语言检索和信息一站式获取,提高资源的使用率,降低国内外文献分散服务的成本,使科技文献资源发挥出更大的整体效益,提高国家科技文献经费投入的使用效果。提高科技文献信息服务系统和各类专业检索系统的建设水平,可以对我国科技信息事业的发展和科技信息机构的业务发展产生积极的社会效益。
超级科技词表和《汉表》映射体系的建设和开放使用,可以普遍适用于我国各大图书馆、专业信息机构、商业信息机构、各类信息和数据系统的跨语言信息组织和检索,相应的映射研究和映射技术也可普遍被各类信息服务机构利用和集成,具有广阔的应用前景。