让机器读懂医疗 天衍实验室获CHIP2020评测两大奖项
在不久前结束的第六届中国健康信息处理大会(CHIP 2020)中文医学信息处理评测竞赛中,腾讯天衍实验室凭借其在医学领域的深厚技术积累和卓越的创新,表现出色,勇夺“中文医学文本命名实体识别”赛道冠军和“中文医学文本实体关系抽取”赛道亚军。
这一成绩的取得,得益于其在信息抽取(IE)技术方案的突破与升级。对于医学领域的自然语言文献,如医学教材、医学百科、临床病例等,文本中蕴含着丰富的医学专业知识和术语。腾讯天衍实验室成功将实体识别技术与医学专业领域结合,利用机器学习读取医学文本,显著提高了临床科研的效率和质量,为下游子任务提供了强有力的支持。
在信息抽取的核心环节,命名实体识别(NER)和关系抽取(RE)是两大关键任务。命名实体识别旨在从非结构化医学文本中找出医学实体,如疾病、症状等;而关系抽取则需要提取出这些实体之间的关系信息,形成实体关系三元组。
腾讯天衍实验室在两大评测任务中均有出色的表现。在命名实体识别任务中,他们采用的数据集由北京大学等院校及科研单位智慧医疗课题组联合构建。针对医疗领域对专业性和准确性的高标准要求,以及实体频次稀疏和实体长度偏长的问题,天衍实验室采用了一种指针解码的特殊方式,对单个实体的头尾位置进行解码。这种方法在较长实体中的表现得到了明显的提升。
天衍实验室还基于自身在医疗领域的经验,结合大量医疗文本训练出了领域自适应的新预训练模型,进一步提升了模型的表现。在评比测试集上,天衍实验室凭借多种不同策略的结合,以F1值68.35获得第一名。
这一成就不仅彰显了腾讯天衍实验室在医学信息处理领域的实力,也为医学自然语言处理领域的发展做出了重要贡献。随着技术的不断进步,我们期待天衍实验室在未来能够继续为医学领域带来更多的创新与突破,推动医疗科技的进步,为人类的健康事业做出更大的贡献。源自中文医学信息抽取数据集CMeIE的实体关系抽取评测任务,展示了医疗领域中的一项重要挑战。面对数据集中大量的实体重叠和关系重叠现象,天衍实验室采用了先进的层叠指针网络架构来应对。这一技术不仅能够通过两个二值分类器精准地识别头实体的首尾位置,还融入了Conditional Layer Normalization技术,确保头实体信息被有效融入,同时针对每一种关系预测相应的尾实体。
为了更深入地理解和应用医疗领域的专业词汇,天衍实验室在输入层特别融入了领域词向量。这一创新举措极大地提升了实体边界预测的准确率,使得模型在测试集上取得了引人注目的成绩单模型F1分数高达61.70,融合模型更是达到了63.87。
腾讯天衍实验室借助自身的NLP能力和科研成果,在信息抽取领域不断突破和创新。实验室不仅积累了丰富的场景应用经验与方法,还为医疗行业的科技进步提供了强有力的支持。随着技术的不断进步,AI正在逐渐“懂医”,这得益于技术创新所带来的巨大推动力。
在医疗领域,信息抽取技术发挥着至关重要的作用。电子病历和生物医疗文献中的非结构化文本,通过这一技术被结构化处理,其中的疾病、症状、部位等实体被有效提取,实体之间的关系也被准确判断。这些信息为构建医疗知识图谱提供了宝贵的数据基础,使AI能够更好地学习领域知识,并进一步提升导诊、辅诊、疾病预测等任务的性能。
具体来说,医生在诊断过程中需要了解的症状细节,如症状发生的时间、部位、变化情况等,都被AI技术所模拟和。天衍实验室的AI导诊和疾病预测功能就是基于这一技术,为用户提供更为精准的医疗服务。例如,在用户输入主诉后,AI导诊小程序能够利用关系抽取技术捕捉到不同症状的具体属性,从而更精准地进行疾病预测和科室推荐。这一技术不仅提高了医疗服务的效率,还为患者带来了更为个性化的诊疗体验。关系抽取演示图腾讯天衍实验室的医学智慧之旅
腾讯天衍实验室,一个致力于医学自然语言处理和知识图谱构建的尖端研究机构。这里的研究团队不断自然语言处理的基础理论,深化对语言理解的研究,致力于信息抽取的前沿,为构建大规模知识图谱不断突破技术壁垒。这些成果已经被运用到医疗领域,为数百家医院提供了辅诊、导诊、疾病辅助诊断以及智能用药等智能化解决方案,助力医保、医院、疾控中心以及其他医疗机构实现知识化转型,解决他们在智能化知识挖掘和管理方面的难题。
腾讯天衍实验室不仅在医疗领域AI算法研究上表现出色,还专注于将这些先进的算法技术落地应用。他们借助NLP、知识图谱、大数据以及医疗影像等技术系统,将算法能力成功输出到腾讯健康小程序、QQ浏览器、微信搜一搜等广大用户使用的终端应用。这不仅提升了用户体验,也推动了医疗科技的进步。
值得一提的是,腾讯天衍实验室还与众多顶尖医学机构和科研单位建立了紧密的合作关系。他们与钟南山院士领导的团队以及复旦肿瘤医院等医疗行业头部机构建立了联合实验室,进行的科研合作。他们也与牛津大学、佐治亚大学、天津大学等国际知名学府以及微众银行AI部门建立了长期科研合作关系。这些合作不仅为实验室提供了丰富的实践应用场景,也为其提供了广阔的研究视野和深入的技术交流机会。
腾讯天衍实验室的科研成果也备受国际学术界的高度认可。他们在NIPS、KDD等国际顶级学术会议上发表了多篇学术论文,展示了他们在医学自然语言处理领域的深厚实力和前沿技术。通过联合社会各界进行技术深入研究,腾讯天衍实验室正加速科研应用的落地,以更好地服务于临床应用,为医学领域的发展贡献自己的力量。
腾讯天衍实验室在医学自然语言处理领域的研究和应用上,已经取得了显著的成果。他们不仅为医疗行业提供了有力的技术支持,也为推动医疗科技的进步做出了重要贡献。期待未来他们能带来更多的突破和创新,为医学领域的发展注入更多的智慧力量。