陈玉博
教授 博士生导师 研究方向:自然语言处理、知识工程、大模型

个人简历:中央民族大学教授,博士生导师,曾任中国科学院自动化研究所副研究员,入选第五届中国科协青年人才托举工程、2022年全球华人AI 青年学者、2022年中国科学院青年创新促进会会员、2025年北京市科技新星,2023、2024、2025年连续入选美国斯坦福大学发布的全球前2%顶尖科学家榜单。研究方向为自然语言处理、知识图谱和大模型,在TNNLS、TALSP、ACL、NeurIPS、IJCAI、AAAI、COLING、ISWC 等国际重要会议和期刊发表高水平学术论文90余篇,Google Scholar引用量8000余次,其中一篇论文入选ESI高被引论文,两篇论文入选ACL、EMNLP最具影响力论文榜单(Paper Digest评选),获得国际语义网大会ISWC 2023(CCF B类会议)最佳张贴论文奖,国际计算语言学大会ACL 2025领域主席推荐奖(CCF A类会议),并多次获得最佳论文奖(NLP-NABD 2016、CCKS 2017、CCL 2020、CCKS 2020、CCKS-IJCKG 2024)。出版学术专著两部《知识图谱》、《知识图谱:算法与实践》,入选十三五国家重点图书出版规划教材。连续多年在中国科学院大学主讲《知识图谱》课程,获评2021年中国科学院大学优秀课程,中国科学院大学教育教学成果奖一等奖。主持国家自然科学基金面上项目两项、青年基金项目,作为核心骨干参与国家自然科学基金重点项目、2030新一代人工智能重大项目、重点研发计划课题、中国科学院先导专项课题。主持研发的信息抽取和知识图谱构建系统多次获得国际/国内学术评测冠亚军。担任中国中文信息学会青年工作委员会副主任、Data Intelligence编委、中国中文信息学会语言与知识计算专业委员会委员、中国中文信息学会大模型与生成专业委员、中国科学技术情报学会信息技术专业委员会等。曾获中国中文信息学会"钱伟长中文信息处理科学技术奖"一等奖,北京市科学技术进步奖一等奖。 (详细信息请访问:https://yubochen.github.io/index_cn.html

研究兴趣

自然语言处理方向:计算语言学、大模型时代的自然语言处理

知识工程方向:多元知识图谱构建(实体知识、关系知识、事件知识、过程知识、常识知识、情感知识),知识驱动的领域应用(医疗、金融、文化)

大模型方向:大模型中的知识分析与萃取、知识增强的大模型、面向大模型的数据工程、大模型的能力评测

联系方式:yubo.chen@muc.edu.cn

招生意向:希望对自然语言处理、知识工程和大模型方向感兴趣的同学加入我的课题组,同时希望你踏实认真,具有良好的自驱力和英文文献读写能力。优先代码基础好、对自己的未来有明确规划、有过竞赛获奖的同学。另:课题组常年招收实习生(本科、硕士、博士)。

工作经历:

2025.12  至今,中央民族大学信息工程学院,教授,博士生导师

2019.10 – 2025.11,中国科学院自动化研究所, 模式识别国家重点实验室/复杂系统认知与决策重点实验室,副研究员,硕士生导师

2017.07 – 2019.10,中国科学院自动化研究所, 模式识别国家重点实验室,助理研究员。

教育经历:

2012 - 2017,中国科学院自动化研究所,模式识别国家重点实验室,模式识别与智能系统,博士,导师:赵军研究员;

2008 - 2012,北京化工大学,信息科学与技术学院,计算机科学与技术,学士,导师:朱群雄教授。

纵向科研项目:

·项目负责人,国家自然科学基金面上项目:面向大语言模型的知识增强关键技术研究,50万,(2026.01-2029.12);

·项目负责人,国家自然科学基金面上项目:面向复杂应用场景的事件知识抽取关键技术研究,57万,(2022.01-2025.12);

·项目负责人,北京市科技新星项目,40万(2025.06-2028.07);

·项目负责人,国家自然科学基金青年基金项目:面向非结构化文本的大规模事件信息抽取关键技术研究,26万(2019.01-2021.12);

·项目负责人,中国科协青年人才托举工程项目,事件知识图谱,45万(2019.12-2021.12);

·项目负责人,中国科学院青年创新促进会会员项目,72万(2022.01-2025.12);

·项目负责人,中国科学院自动化研究所国家级重点实验室创新发展项目,100万(2025.01-2026.12);

·子课题负责人,新一代人工智能国家科技重大专项子课题,数据价值驱动的评估、追踪与治理体系,90万(20205.12-2028.11);

·子课题负责人,中国科学院自动化所2035创新团队项目,300万;

·核心骨干,科技创新2030-“新一代人工智能”重大项目:以自然语言为核心的语义理解研究,446万,(2020.11-2023.10);

·核心骨干,国家自然科学基金重点项目:大规模知识关联和文本语义计算方法及应用验证,336万,(2016.01-2020.12);

·核心骨干,中国科学院重点部署项目:面向抑郁症智能诊疗的可解释对话系统研究,340万,(2020.01-2022.12)。

企业科研项目:合作过的企业包括:腾讯、华为、百度、阿里巴巴、蚂蚁金服、美团、京东、云知声、中国大百科出版集团、上汽集团等。

论文获奖:2023、2024、2025年连续入选美国斯坦福大学发布的全球前2%顶尖科学家榜单,一篇论文(TNNLS 2023)入选ESI高被引论文,两篇论文入选ACL、EMNLP最具影响力论文榜单(各会议每年15篇),多次获得国际/国内最佳论文奖,具体如下:

·第22届国际语义网大会(ISWC 2023, CCF B类会议)“最佳张贴论文奖”;

·第63届国际计算语言学大会(ACL 2025,CCF A类会议)“领域主席推荐奖”;

·2024年全国知识图谱与语义计算大会暨知识图谱国际联合会议(CCKS-IJCKG 2024)“亮点英文论文奖”;

·2020年全国知识图谱与语义计算大会(CCKS 2020)“最佳英文论文奖”;

·第十九届中国计算语言学大会(CCL 2020)“最佳论文奖”;

·2017年全国知识图谱与语义计算大会(CCKS 2017)“最佳英文论文奖”;

·第十五届中国计算语言学会议暨第四届基于自然标注大数据的自然语言处理国际学术研讨会(CCL 2016 & NLP-NABD 2016)“最佳论文奖”。

教学/评测奖励:

·《知识图谱》课程获得中国科学院大学校级优秀课程(2021年)

·国际评测NAACL-2021-SMM4H 医疗文本知识抽取-自报告病人检测赛道冠军(2021年)

·国际评测 SemEval-2022-中文复杂和歧义命名实体识别赛道亚军(2022年)

·全国知识图谱与语义计算大会(CCKS 2020)面向中文电子病历的医疗命名实体识别冠军(2020年)

·全国中文健康信息处理大会(CHIP 2020)医疗术语标准化亚军(2020 年)

·智研杯大模型国防应用邀请赛应用潜能展示优胜奖(2023年)

·数字中国创新大赛大数据赛道二等奖(2021年)

·万创杯天池中医药说明书实体识别挑战赛亚军(2020年)

学术服务:

担任中国中文信息学会青年工作委员会副主任、语言与知识计算专业委员会委员、大模型与生成专业委员会委员,并多次担任国际/国内会议的程序委员会主席、出版主席、赞助主席、领域主席等,具体如下:

·中国中文信息学会青年工作委员会,副主任(2024-)

·中国中文信息学会青年工作委员会,秘书长(2022-2024)

·中国中文信息学会青年工作委员会,执行委员(2017-2024)

·第九届语言与智能高峰论坛,程序委员会主席

·自然语言处理青年学者研讨会(YSSNLP 2024),程序委员会主席

·全国计算语言学大会(CCL 2022、2023、2024),出版主席

·国际计算语言学大会(COLING 2022),领域主席

·全国知识图谱与语义计算大会(CCKS 2022),出版主席

·全国知识图谱与语义计算大会(CCKS 2020),赞助主席

·全国计算语言学大会(CCL 2019),信息抽取和知识图谱,领域主席

·全国知识图谱与语义计算大会(CCKS 2019),信息抽取和知识图谱,领域主席

专利情况:

·基于多语注意力机制的事件识别及分类方法及装置;陈玉博;刘康;赵军;刘健(已授权)

·基于自注意力机制的中文命名实体识别方法、系统及装置;陈玉博;刘康;赵军;曹鹏飞(已授权)

·基于对抗模仿学习的事件识别及分类方法、系统及装置; 陈玉博;刘康;赵军;刘健 (已授权)

·基于知识巩固的增量事件识别方法、系统、装置;陈玉博;赵军;刘康;曹鹏飞(已授权)

·事件抽取方法、装置、电子设备及存储介质;陈玉博;赵军;刘康;杨航(已授权)

·基于联邦学习的分布式语言关系识别方法、系统及装置;赵军;陈玉博;刘康;隋典伯(已授权)

·文本识别样本获取、文本识别方法、系统及装置;赵军;陈玉博;刘康;左新宇(已授权)

·基于噪声感知机制的命名实体识别方法及设备;刘康;赵军;陈玉博;黄修胜(已授权)

·基于屏蔽泛化机制的事件因果关系识别方法、系统及装置;赵军;刘康;陈玉博;刘健(已授权)