以下文章来源于达观数据 ,作者哒哒
达观数据是一家专注于文本智能机器人的国家高新技术企业,利用自然语言处理、智能文档处理、光学字符识别、知识图谱等技术为大型企业和政府机构提供机器人流程自动化(RPA)、文档智能审阅、垂直搜索、智能推荐、客户意见洞察等智能产品。
2022 CCF BDCI暨第六届“达观杯”合作赛题:高端装备制造知识图谱自动化构建
CCF大数据与计算智能大赛(CCF Big Data & Computing Intelligence Contest,简称CCF BDCI)由中国计算机学会于2013年创办,是大数据与人工智能领域的算法、应用和系统大型挑战赛事。大赛面向重点行业和应用领域征集需求,以前沿技术与行业应用问题为导向,以促进行业发展及产业升级为目标,以众智、众包的方式,汇聚海内外产学研用多方智慧,为社会发现和培养了大量高质量数据人才。
大赛迄今已成功举办九届,累计吸引全球25个国家,1500余所高校、1800余家企事业单位及80余所科研机构的16万余人参与,已成为中国大数据与人工智能领域最具影响力的活动之一,是中国大数据综合赛事第一品牌。
作为国内领先的智能文本处理企业,达观以赛题合作方身份参与至2022年第十届CCF大数据与计算智能大赛中,同时联合有孚云为本次大赛选手提供免费算力,旨在创新聚力进一步扩大影响力,关注数字经济技术发展与人才培养,助力推动我国大数据技术及产业生态发展。
关于达观杯
“达观杯”系列算法大赛是由达观数据发起并主办的全球性人工智能算法竞赛。每年一届,大赛诚邀全国高校大学生、科技型企业和认知智能爱好者共同参与和研究实际业务场景下的人工智能技术问题。旨在通过开放真实数据,借助社会和学界的技术力量,为认知智能从业者搭建交流展示平台,推动国内知识图谱及NLP技术创新、拓展更多的应用场景,为客户和行业带去真正的价值,进步提升认知智能研究水平,为业界选拔和培养技术人才,共促中国人工智能发展。
作为2022年 CCF大数据与计算智能大赛合作赛题之一,第六届“达观杯”以“高端装备制造知识图谱自动化构建”为题,旨在进一步推动国内认知智能技术创新,拓展智能制造行业更多的应用场景。
赛题背景
命名实体识别和关系抽取是知识图谱构建中两项重要的基础任务,自动构建高端装备制造业故障知识图谱对于实现高端装备制造的智能化检修和诊断具有重大意义。各种高端装备领域的故障案例文本是由业务专家或者专业维修人员撰写的描述相关设备异常、以及故障排查步骤的记录,该记录包括故障现象、故障原因、解决方法以及排故过程等,这些故障案例知识的利用受到数据结构化程度的影响,因而识别数据中的部件单元、性能表征、故障状态、故障检测工具等核心实体及其之间的组成关系至关重要。
赛题任务
通过从大量故障案例文本抽取出部件单元、性能表征、故障状态、检测工具等实体及其关系,可以为后续高端装备制造业故障知识图谱构建和故障智能检修和实时诊断打下坚实基础。本任务需要从故障案例文本自动抽取4种类型的关系和4种类型的实体。关系类型为:部件单元的故障状态、性能表征的故障状态、部件单元和性能表征的检测工具、部件单元之间的组成关系。具体定义如下:
实体类型:
实体类型名称 | 说明 | 示例 |
部件单元 | 高端装备制造领域中的各种单元、零件、设备 | “燃油泵”、“换流变压器”、“分离器” |
性能表征 | 部件的特征或者性能描述 | “压力”、“转速”、“温度” |
故障状态 | 系统或部件的故障状态描述,多为故障类型 | “漏油”、“断裂”、“变形”、“卡滞” |
检测工具 | 用于检测某些故障的专用仪器 | “零序互感器”、“保护器”、“漏电测试仪” |
关系类型:
主体 | 客体 | 关系 | 示例 | 客体 |
主体 | ||||
部件单元 | 故障状态 | 部件故障 | 发动机盖 | 抖动 |
性能表征 | 故障状态 | 性能故障 | 液面 | 变低 |
故障状态 | 性能表征 | 检测工具 | 漏电测试仪 | 电流 |
部件单元 | 部件单元 | 组成 | 断路器 | 换流变压器 |
丰厚奖励
赛题奖项:
实体 | 说明 | 奖金 (税前) |
证书/奖杯 |
一等奖 | 本赛题 1支团队 |
RMB2万元/队 | CCF颁发的证书
& 大赛荣誉奖杯 |
二等奖 | 本赛题 1支团队 |
RMB1万元/队 | CCF颁发的证书
& 大赛荣誉奖杯 |
三等奖 | 本赛题 1支团队 |
RMB5千元/队 | CCF颁发的证书
& 大赛荣誉奖杯 |
优胜奖 | 本赛题 1支团队 |
RMB1千元/队 | 达观数据颁发的荣誉证书 |
奖项 |
示例 |
CCF 综合奖项 |
综合特等奖1支 (奖金人民币30,000元 & CCF颁发的权威证书)最佳算法能力奖1支 (奖金人民币10,000元 & CCF颁发的权威证书) 最佳商业价值奖1支
最佳创新探索奖1支 |
大赛亮点
- 算力支持:前400名登录有孚云领取算力的选手(注册并实名认证),每支队伍可免费领取100卡时,具体可登录赛事平台官网下载领取说明
- 双项奖金:本次大赛初赛达观设税前奖励共55000元,共包含10个获奖名额;CCF BDCI额外设置综合奖项税前奖励五万元,共包含四个获奖名额
- 专家评审:100余名院士、专家任大赛评委,达观携手CCF BDCI、科研所共同打磨赛题
- 岗位直通:BDCI十周年携手“达观杯”六周年,增设多元互动,优秀人才面试直通名额。
特色活动
- 线上直播:安排赛题直播分享答疑会,在线解答赛事,分享知识图谱构建相关技术研究与应用
- 周榜单激励:赛事设置周榜激励系统
- 赠送书籍:赛事期间,赠送首本基于知识图谱的认知智能理论与实战书籍《知识图谱:认知智能理论与实战》。
赛程安排
大赛采取线上比赛、线下颁奖的模式。选手于官方竞赛平台DataFountain报名、组队、提交作品测评。线上比赛结束,经作品审核后,排行榜前十名的获奖团队或个人将有机会亲临CCF BDICI决赛现场交流成果并参与颁奖典礼。
08/29:大赛启动
9/5-11/07:初赛A榜
11/09:复赛B榜(00:00-24:00)
11/10-11/20:B榜前十团队按照要求提交复现资料
12中旬:颁奖典礼(具体时间地址另行通知)
扫码报名
交流平台
算力提供:有孚云
有孚云依托有孚网络在北上广深的自有大型数据中心集群,建设了以专有云为核心,智算和超算集群为两翼的云算网融合服务能力平台。有孚云智算基于异构计算提供的超强的浮点计算能力服务,满足深度学习、科学计算、图形渲染、视频处理、语音识别等多应用场景。有孚云智算高效稳定、灵活租用、按需付费,用算力更省心。