数据、数据,还是数据。在医学人工智能领域,无论是医学影像识别、智能机器人,还是辅助诊疗、药物研发,都离不开庞大的医疗样本大数据作为机器训练的基础。
仅靠“读书百遍、其义自见”就能培养“超级医生”吗?日前,国内首个专用于医学图像人工智能技术的研发平台“神农1号”(SINOSEEDS)超算中心诞生。这不禁让人思考:面对同样的医疗大数据进行学习,也有“聪明孩子”与“笨孩子”的区别。
“聪明孩子”更可能成“名医”
“如果说数据是‘矿山’,那么超算能力就是‘挖掘机’。”“神农1号”研发团队负责人、希氏异构公司董事吴韧说,人工智能应用技术研发的三大核心要素是算法、数据和算力。其中代表算力的计算平台,主要负责是通过学习进行医学人工智能训练,并根据训练成果识别疾病图像、辅助诊疗等。
6月在成都发布的“神农1号”,就是为医学人工智能训练、处理图像定制。它采用了64个英伟达最新的TeslaV100 GPU,拥有每秒8千万亿次的计算能力,每秒可学习5万张医疗图片,半小时内处理百亿级的图片。
“配合高速网络、独特的系统设计、独到的算法和软件的优化,整个系统能非常高效地完成各种医疗人工智能的训练任务。”吴韧说,AI超算中心不同于采用CPU处理器的超算中心,不是可以直接采购的商业化设备,需要由使用方面依靠自有技术搭建,决定其核心性能的要素,除了自身性能外,还包括搭建技术和并行计算的效能发挥等。“目前,它的并行计算效能高达90%以上,训练图片识别ImageNet模型仅需52分钟,而传统的服务器训练通常需要10天左右。”
自建“超算中心”是否必要
在医疗AI领域,算力的重要性过去容易被忽略——部分医疗AI企业选择用开源式的AI技术,在云端租用服务器实现计算。
“这首先考虑的是成本、数据量等‘性价比’的问题。”一家大数据企业首席技术官说,在医疗、金融这两个大数据应用最广泛的领域,数据量往往决定了是否需要独立、“高阶”的计算能力,可大部分企业并无足够“数据量”。而希氏异构去年与四川大学华西医院合作建立“华西—希氏医学人工智能研发中心”,使海量的医疗数据有了来源。
“用传统的云计算,海量数据如何传输?云端计算能力是否足够?数据安全是否能保障?”希氏异构创始人宋捷说,不同于“小样本”的初级AI医疗,“神农1号”未来服务的目标将是CT、超声、皮肤、心电等多疾病领域的AI应用技术研发。“举个简单的例子,机器学习后,会帮助医生判断图像中是息肉、肿瘤或者静脉曲张,而不是筛查单一疾病。”
此外,医疗行业的特殊性过去往往被AI企业忽略。“如同一座山从不同角度‘横看成岭侧成峰’,疾病的判断标准并非一成不变。”华西医院内镜中心主治医师黄志寅以双方合作研发的“AI消化内镜”为例,向记者解释,消化内镜识多为非标准化采图,影响因素多、图像差异大,为传统的AI识图带来难度,这就需要独立且强大的计算能力提升模型识别率。
“值得注意的是,医学仍在动态发展,疾病的判断标准并非固定,一旦医学理解发生改变,机器又要重头学习或补充新知识,那么拥有强大的计算能力显然会学得更快、更好。”黄志寅说。
中国互联网数据中心预测,到2020年全球医疗数据量将达到40万亿GB,大约是2010年的30倍之多。“随着人工智能产业不断进步,一旦数据不再是‘门槛’或‘壁垒’,计算能力将成为最关键的竞争力。”英伟达中国高性能计算与新兴业务总经理刘通表示,愈发强大的人工智能计算性能,将为医疗行业带来无限创新的可能。
来源: 科技日报