当前位置:需求发布>正文

领域知识图谱构建及应用关键技术研究

发布时间:2020-07-06
信息来源:平台运行管理办公室

需求编号:8006111011    提交纸质方案截止时间:2020年8月31日

中关村第四届新兴领域专题赛需求表

(技术问题难题类)

单位名称全称

专题赛组委会

需求方所在领域

人工智能与大数据

需求情况说明

 

需求

题目

领域知识图谱构建及应用关键技术研究

需求

简述

垂直领域知识图谱的构建及应用面临若干典型技术难题:弱数据资源条件下的领域知识抽取、融合、推理,以及推荐系统和对话问答等应用开发等。本项目需针对上述问题,结合符号学、统计学、深度学习等技术,构建面向领域数据的典型应用示范。

功能

要求

面向专业试验报告、产品研制过程记录、学术文献等领域数据:

1、 构建基于无监督/半监督/迁移学习的知识抽取、知识融合模块

2、 构建基于图推理的异构数据(知识库+非结构化文本)知识推理模块 

3、 开发基于语法知识/上下文知识/元学习的多轮语义分析和智能问答模块

主要

指标

面向领域数据:

1、 知识抽取/融合任务:实体抽取F1值达到0.85以上,关系抽取F1值达到0.70以上,实体-关系抽取整体F1值达到0.80以上,实体对齐F1值达到0.80以上;

2、 知识推理任务:以常识问答测试的形式进行考核,准确率需达到75%以上,对挂接的知识库无限制;

3、 多轮语义分析和智能问答:以多轮复杂问答测试的形式进行考核,准确率需达到40%以上,对挂接的知识库无限制。

其他

要求

测试过程需采用封闭环境(类似于美国AI2研究所通过BEAKER平台提供的封闭测试环境,测试样本不公开,需上传模型,可反馈测试成绩供迭代优化),目前该平台正在开发中,测试样本主要是垂直领域非结构化数据,覆盖的专业方向如军事新闻百科、故障件信息记录、产品研发过程记录等。

实测

要求

参考主要指标。

产学研

现有基础情况

可在封闭环境提供少量领域数据样例用于模型调试,规模约一千万字

合作

意向

前三年名达到指标要求可进入采购必选流程  

 联合研发(基础研发  工程应用研发)

对优秀解决方案

悬赏奖励

比选方式

仅产品实测比拼 

备 注

1.专题赛详细信息可登陆专题赛官网(http://www.zgccmichallenges.cn)或搜索微信公众号“中关村新兴领域专题赛”查询。

2.需求可登陆专题赛官网(http://www.zgccmichallenges.cn)或搜索微信公众号“中关村新兴领域专题赛”下载。

3.需求细节沟通咨询和专家辅导点评请关注微信公众号“中关村新兴领域专题赛”,分别在“需求发布”和“提交方案”栏按提示操作。