AIConferenceinBeijing

重要通知:AIConference北京站早期优惠价格本周五(5月10日)即将结束!

点击阅读原文查看会议详情和报名通道!席位有限,抢票入场!

我们正处于自然语言处理(NLP)领域令人兴奋的十年。在阅读理解、语言翻译和创意写作等复杂任务上,计算机的表现将会和人类一样出色。语言理解受益于快速改进的“ABC”软件:A就是AI(免费的深度学习库,如PyText和如BERT这样的语言模型),B是大数据(Hadoop,Spark和SparkNLP),以及C,就是云计算(按需提供的GPU和来自所有主要云服务商的NLP即服务的功能)。

在医疗领域,一些应用已经从科幻小说变为现实。人工智能系统通过了中国和英国的医学执照考试,而且它们比普通医生考得更好。最新的系统比初级医生能更好地诊断出55种儿科疾病。但是,这些系统比第一批计算机视觉深度学习应用(例如研究一个图像)中的一些更难构建,因为它们需要具有更广泛常见的医学知识,要处理更多种类的输入,并且必须理解上下文。

过去七年来,我很幸运能够参与构建医疗领域的NLP系统。本文旨在分享我学到的重要经验,从而希望能帮助你更快更好地构建类似的系统。

先见识一下急诊室分诊记录的语言

包括我在内的许多人都错误地认为美国的临床记录是用英文写的。之所以会这样,是因为如果你问医生他们使用什么语言,医生便会回答说是英语。但是,请看以下三个从急诊室就诊记录中提取的已脱敏的分诊记录的例子:

TriageNotesstatesstartedlastnight,upperabd,tookalkaseltzerapprox,norelief.nauseanovomitingSinceyesterday10/10“constantTylenol1hrago.+nausea.diaphoretic.MidabdradiatestobackGeneralizedabdradiatingtolowerx3daysac

转载请注明原文网址:http://www.lbomw.com/kjscby/12289.html
------分隔线----------------------------