科学家使用机器学习来确定沙门氏菌爆发的来源

由佐治亚州格里芬的佐治亚大学食品安全中心的研究人员领导的一组科学家开发了一种机器学习方法,可以更快地识别某些沙门氏菌爆发的动物来源。

在发表于2019年1月出版的《新发传染病》(EmergingInfectiousDiseases)上的研究中,邓翔宇和他的同事使用了超过一千个基因组来预测鼠伤寒沙门氏菌的动物来源,尤其是家畜。

该中心食品微生物学助理教授邓和该中心的博士后张绍康领导了该项目,该项目还包括美国疾病控制与预防中心(CDC)的专家。秒。食品和药物管理局(FDA)、明尼苏达州卫生部和转化基因组学研究所。

根据食源性疾病暴发监测系统,美国报告了近3,000起食源性疾病暴发。秒。从2009年到2015年。邓说,其中900(或30%)是由不同血清型的沙门氏菌引起的,包括鼠伤寒。

“我们在2018年至少爆发了3次鼠伤寒杆菌或其密切变种。这些爆发与鸡肉、鸡肉沙拉和干椰子有关”,他说。“沙门氏菌有2,600多种血清型,而鼠伤寒杆菌只是其中之一,但自1960年代以来,大约四分之一的沙门氏菌分离株与报告给美国的爆发有关。秒。国家监测是鼠伤寒”。

研究人员用超过1,300秒。已知来源的鼠伤寒杆菌基因组。经过训练,“机器”学会了如何预测某些S的动物来源。鼠伤寒基因组。

在这项研究中,科学家们使用了来自三个主要监测和监测项目的鼠伤寒沙门氏菌基因组;CDC的PulseNet网络、FDA在美国、欧洲、南美洲、亚洲和非洲的GenomeTrakr数据库以及来自国家抗微生物药物耐药性监测系统的FDA部门的零售肉类分离物。

“有这么多基因组,机器学习是处理所有这些数据的自然选择。

我们使用大量鼠伤寒杆菌基因组作为训练集来构建分类器”,邓说,他在2017年因其在该领域的工作而获得了UGA创意研究奖章。“分类器通过询问其基因组的数千个遗传特征来预测鼠伤寒分离株的来源”。

总体而言,该系统预测了S的动物来源。Typhimurium准确度为83%。分类器在预测家禽和猪来源方面表现最佳,其次是牛和野生鸟类来源。机器还会检测它的预测是准确的还是不准确的。邓说,当预测准确时,机器大约有92%的时间是准确的。

“我们回顾性分析了发生在美国的八次主要人畜共患病暴发。S。从1998年到2013年”,他说。“分类器将其中七个归因于正确的牲畜来源”。

“我将这种方法称为概念验证。随着来自各种来源的更多基因组可用,它会变得更好”,他说。

在有关该研究的推文中,FDA副主任FrankYiannas称全基因组序列的机器学习项目是“一个更智能的食品安全和流行病学新时代””。

对普通人来说,这个项目的成功意味着鼠伤寒沙门氏菌菌株可以更快地追溯到源头。确定导致食源性疾病爆发的原因是阻止它和预防进一步疾病的关键。

“使用我们的方法,调查人员可以更好地将同一爆发的病例联系起来,并更好地将来自食品或食品加工环境的隔离物与来自病人的隔离物相匹配”,他说。“这将使调查人员更有信心牵涉到疫情背后的特定来源”。

在UGA-Griffin校区,邓的实验室专注于基因组流行病学,利用基因组学、生物信息学和数据科学来研究食源性病原体的流行病学。他对沙门氏菌的兴趣始于邓在疾病预防控制中心担任美国微生物学会研究员时。

科学家使用机器学习来确定沙门氏菌爆发的来源
本文来自网络,不代表0731剧本杀立场,转载请注明出处:http://www.0731yc.com/qgjb/5339.html
返回顶部