十四年磨一剑,恒扬数据推出软硬件一体的AI病理诊断机,辅助筛查乳腺癌和肺

发表时间:2017-11-22

  返回列表

2016年被大家称为人工智能的元年。如果说之前我们还在讨论“互联网+”给人类带来的改革创新,那么2016年之后,我们则进入了一个“AI+”的时代。在“AI+”时代里,“AI+医疗”一不小心成为了谷歌、微软、苹果、阿里等科技巨头的“第二战场”。

随着AI技术的逐渐成熟,医疗和无人汽车两大行业被认为是最早可以实现AI产业化的行业,其中人工智能医疗影像技术更被认为是造福人类,普惠大众的典范。因此,越来越多的企业投身到对智能B超、CT、核磁、病理等医疗影像的筛查与识别当中,深圳市恒扬数据股份有限公司(以下简称“恒扬数据”)便是其中的一位。恒扬数据成立于2003年,并在2017年初组建了机器学习实验室,开始涉足医疗。恒扬数据为何选择医疗作为AI的切入口?动脉网记者采访到了恒扬数据的联合创始人冯国军。

涉足医疗的动机是什么?

冯国军表示:“其实,去年人工智能刚开始火起来的时候,公司董事长陈龙森和几位创始人都非常看好这个方向。一直想着,能不能抢在人工智能爆发前夜,将我们现有的大数据业务与之结合起来。”几经思考后,他们决定在原有的业务里融入机器学习(人工智能)的概念。

想法有了,但是该怎么做、选什么方向却成了一个难题。在寻找细分行业的时候,他们发现人工智能的应用领域里面,最有可能实现工程落地的是图像识别、语音识别和人脸识别。其中图像识别在医疗行业的应用无疑是最有发展前景的。所以,最后他们把目标锁定在了医疗行业,而具体做什么产品,团队也做了大量的调研工作。

“要做机器学习,前提是要有大量的优质数据来训练机器。而医疗机构里面的病理切片数据不失为一个好的选择。首先它的数据量非常大,其次病理切片可以通过一些方式转化成优质的数据。而且医院的临床结果是最好的比较对象,可以用来论证机器学习的效率和准确率。”冯国军如是说。因此,他们选择了病理诊断这个方向,目标是为病理医生服务。

为了确定这个想法的可行性,2017年年初,团队走访了多家医院的病理科。在与病理专家的交流过程中他们发现,目前我国的病理医生非常短缺,全国范围内注册的病理医生只有1万余人。病理医生每天看片、诊断的工作量非常巨大,而基层医院又急需有经验的病理医生为患者提供服务。

基于此,恒扬数据确定将目标锁定在AI病理领域,旨在减轻医生的负荷,提高他们诊断的效率。2017年初,公司决定成立机器学习实验室,并有多位研发经验丰富的研究员参与进来。而研发工作的起点,恒扬数据选择参加了国际著名的CAMELYON17挑战赛。这项赛事由荷兰瑞德邦大学医学中心诊断影像分析组和病理学系组织,目的是评估现有的和新的算法。这些算法通过对完整图片的组织学淋巴结部分进行自动的检测和分类,以判断乳腺癌转移的程度。经过1个多月时间的努力,恒扬数据提交了第一份竞赛作业,在全球700多个参赛团队中,恒扬数据AI团队名列前茅,并受邀出席澳大利亚墨尔本ISBI 2017会议。

与此同时,恒扬数据与国内著名医疗机构的联合项目研发也在同步开展,并已取得了不少技术成果。

恒扬AI病理诊断系统是什么?

恒扬人工智能病理诊断系统,是一台采用深度学习CNN卷积神经网络算法,与强大的GPU运算加速器的软硬件结合的设备。它可以快速地分析、提取出数字病理切片中的病灶特征、进行位置标注和量化计数,协助病理医生高效地完成疑似病症的预判和诊断。

借助AI技术,恒扬人工智能病理诊断机能够让顶级病理医生最大限度地发挥专家能力,从简单重复性、机械性的繁重工作负荷中解脱出来,同时促使优质医疗资源快速下沉,让基层医生迅速提升诊疗水平,减少基层医院病理科误诊漏诊率。

目前,恒扬人工智能病理诊断系统主要针对乳腺癌淋巴结转移进行识别和定级,诊断内容包括:

根据乳腺淋巴结数字切片样本的细胞形态特异性,判断样本的阴/阳属性;标注病变部位的形态轮廓,辅助病理医生对病变部位快速定位,减少搜寻时间;通过测量病变部位的尺寸,对病变部位、病毒、细菌数量、有丝分裂癌细胞数量进行计数统计,量化计数结果,实现可视化数据统计。

据冯国军透露,除了乳腺癌淋巴结转移的诊断,恒扬数据目前正在开展多个病种的研发,如抗酸结核杆菌的识别与筛查。

抗酸结核杆菌的智能识别与筛查

结核病是继艾滋病之后人类第二大杀手,也是全球公共卫生的重大威胁。目前,结核病被列为我国重大传染病之一,也是我国重点控制疾病之一。我国是全球22个结核病高负担国之一,也是全球27个耐多药结核病流行严重的国家之一,据估算全国活动性肺结核病人450多万,每年新发传染性肺结核患者150多万,活动性肺结核病人数居世界第二,仅次于印度。目前,在组织病理学方面,通过抗酸染色进行检测结核杆菌筛查是临床应用最为有效的方法。抗酸染色(Acid-fast stain)又称为Ziehl-Neelsen 染色,由德国细菌学家Franz Ziehl (1859-1926)和病理学家Friedrich Neelsen(1854-1898)首创,用于显示具有抗酸性特点的微生物的一种特殊染色方法。

病理医生通过在显微镜下观察寻找呈红色、长度约4um的细杆状菌体确认患者是否感染结核病,这一工作劳动强度大、结果主观性强、严重依赖专家的知识和经验,并且漏检率高。

面对这样的现实,病理医生急需合适的工具将他们解放出来,由此专门针对酸结核杆菌的AI识别与筛查系统营运而生。据冯国军介绍,恒扬数据采用监督学习人工卷积神经网络的方式进行智能诊断筛查,神经元连接数超过100,000+,神经网络训练的样本集:结核杆菌阳性样本578,191份,阴性样本(无结核杆菌)2,510,307,共3088,498份样本用来训练卷积神经网络识别杆菌。目前,诊断的准确率已经超过了90%。

不走寻常路,AI辅助诊断也能软硬件结合

 与其他做AI影像诊断的公司不同,恒扬数据的病理诊断机采取了软硬件结合的方式,是一款有形的产品。在谈到为何会选择软硬件结合的方式时,冯国军表示:

“第一,我们希望实现产品的差异化。如果我们只做软件,那么我们的差异化是不明显的。”

“第二,我们希望发挥多年积累下来的技术优势。因为对一家公司而言,要沉淀软硬件技术,特别是硬件技术,实际上是需要花费相当长的一段研发时间的。而这一点上,恰恰是恒扬数据相对比较独特的地方,我们已经积累了十四年的软硬件技术,这是我们的优势。”

“而且,以我们多年在通讯行业的经验来看,采取软硬件结合的方式,然后重构出一个产品,在解决客户痛点上,更能创造出独特的价值。如果只是单纯的做一套软件,那它就需要嫁接到市场上已有的硬件中去,而这些已有的硬件与这套软件是否能以最佳的方式结合,这是一个值得所有AI创业公司思考的问题。”

恒扬数据做人工智能辅助诊断的优势?那么相比其他做影像诊断的AI创业公司,恒扬数据又有何优势呢?

冯国军表示,恒扬数据最大的优势就是多年的技术储备和资源积累。在过去的十四年间,恒扬数据一直致力于互联网大数据的采集、分析和应用。公司在软硬件技术方面有非常深厚的积累,拥有专利100多项。恒扬数据多年沉淀的这些技术,为其深入医疗领域提供了强有力的支持。例如,在机器学习的训练阶段需要处理海量的数据,特别是全片病理数据在切割成小图片之后,数据量相当大。在面对如此庞大的病理数据时,恒扬数据已有的经验,有助于新问题的解决。

而另外一个优势,便是团队的协作能力。冯国军表示,恒扬数据的核心团队在一起共事十多年,彼此之间早已形成了默契。“在开展一项新业务的时候,我们团队过去的技术、运营和管理经验,让我们更有信心能够把这件事做好。”

在与冯国军的此次交谈中,记者明显地感觉到他们想要在医疗领域有所作为的信心和决心。有以往的成功经验,动脉网相信,未来在医疗行业,恒扬数据也一定会做出好成绩。