您好,欢迎您

【AI】Nature新文:肿瘤研究人员人工智能指南

2024年05月18日

来源:王一树

前言:平日里不爱写前言,今天上午在一个肿瘤大会上,听Cell主编分享AI与文章撰写话题时,对他说的一句话很有感触:“ 你不会输给AI,但你会输给掌握了AI的你的同行 。”

分享刚刚发表于 Nature Reviews 上的一篇综述: A guide to artificial intelligence for cancer researchers,为我们在肿瘤学研究上AI的应用给予一些方向。


人工智能(AI)已被商品化。它已经从专业资源进化到肿瘤研究人员便于使用的工具。它已经可以提高日常工作流程中的研究生产力,但还有可以从现有数据中提取隐藏的信息,来实现新的科学发现。 对这些工具有基本的了解对每个肿瘤研究人员都会很有用


传统的生物科学研究人员通过现成的软件使用基于人工智能的工具,而那些更倾向于计算的人可以开发自己的基于人工智能的软件。这篇文章,为非计算性肿瘤研究人员提供了一个实用指南,以了解如何基于人工智能工具受益。 该篇分享了人工智能在图像分析、自然语言处理和药物发现方面应用的一般原理并进行了举例。


第一话题:人工智能从理论到实际应用

人工智能(AI)领域在很大程度上被认为是1956年Dartmouth学院会议上出现的。早期的工作重点在于符号人工智能 (symbolic AI),例如用于基于规则的下棋等任务系统。 到了20世纪60年代和70年代,尽管计算能力依然有限,但结合机器学习算法和简单的人工神经网络变得更加普遍。如今包括癌症研究在内的机器学习应用中,几乎所有先进的人工智能(advanced AI)都取代了符号人工智能。


20世纪80年代,反向传播算法(backpropagation algorithm)的发展提高了人工神经网络的训练效率。 尽管取得了这些进步,但在20世纪80年代末和90年代,由于一些计划未被实现随后的资金削减,人工智能研究的发展面临了一个冬天 。然后,重点转向机器学习技术,如支持向量机或决策树,这些技术 在各种应用中表现出具有统计学意义的性能。今天,我们称这些机器学习方法为“经典”机器学习。之后人工神经网络进一步发展,最终在2010年代初,深度神经网络在图像和语 音识别等领域表现出了显著的性能。神经网络的首批现实应用之一是在邮政服务中。在20世纪80年代,人工神经网络已经用于通过识别信封上的手写信件来自动对邮政邮件进行分类。


今天,深度学习变得普遍,通过图像分析、金融欺诈检测和自动驾驶汽车导航及帮助癌症诊断。人工智能已经从理论学科进化为实用工具,对各个行业具有变革性影响。无论是在适应我们的智能家居中,还是在预测我们偏好的推荐算法中, 人工智能在解决复杂问题方面的价值已被证明是巨大的,其影响力继续扩大。


癌症研究中的人工智能工作流程

a. 深度学习的应用将基础、转化和临床研究联系起来。 在基于人工智能(AI)的图像处理中,以下边三种方法为主(如b-d所示)。



b.标准图像分析任务,如细胞计数或细分兴趣区域(ROI),通常需要使用现成的工具快速解决方案。 有许多开源工具可用于完成这些任务。例如,ilastik很适合用于亚细胞分析,而QuPath和3D切片机通常分别用于组织水平和全身成像。Fiji、ImageJ和CellProfiler是多功能工具,可以处理不同规模的广泛图像分析任务。


c. 另一类图像分析任务涉及那些需要 对大量数据集进行训练和微调的迭代过程。这些工具通常是非常特定于任务的,并且是为解决一个特定问题而设计的。构建、培训和验证这些pipeline需要编程技能。


d. 图像分析的未来正趋向于基础模型,这些模型在广泛的异构数据集上进行训练,可以在许多任务上进行微调。在零样本学习中,模型直接应用于测试集,无需任何特定任务的培训,而在少量样本学习中,模型提供了少量带标签的示例,以适应特定任务。


第二话题: 通过深度学习提高生产力


除了直接研究应用外,深度学习正在通过优化日常任务来改变研究工作流程。 研究人员可以使用人工智能(AI)执行行政任务,例如作为起草标准电子邮件回复或创建视觉草图。


根据麦肯锡2023年题为《The Economic Potential of Generative AI: The Next Productivity Frontier1》的报告,生成性人工智能可能影响医疗保健和制药部门年收入提升2.6%至4.5%,并为全球提供600亿至1100亿美元的年度附加值。


同样,波士顿咨询集团最近的一项研究得出结论,人工智能通过在涉及生成文本170的日常任务中使用大型语言模型,使管理顾问的工作效率大大提高。虽然这些还只是预测,但可以推断个体研究人员,将可以通过将人工智能方法纳入日常工作流程来提高生产力。


这是一个从简单、专业、浅层模型发展到深度、多模态、通用的计算机视觉模型的过程。 我们可以看到一个从监督机器学习(在完全数据集上进行训练),到监督深度学习(完全注释的数据集),再到机器自我监督学习(初始培训没有注释)这样一个更加自主的进化过程。

在人工智能应用于肿瘤研究的初始阶段,需要从医学图像中精心挑选的模式作为分析的基础。随着时间的推移,人工特征选择不需要了,模型能够直接从数据中学习基本特征。

现在的重点是通过多模式模型整合各种数据源,这些模型结合了来自不同数据模式的信息,如放射图像、病理切片、基因组数据和临床记录。设想的未来还将包括基础模型,这会是一种大规模的、自我监督的模型,在多种模式的各种未标记数据集上进行预训练。可以用最少的特定于任务的训练数据对各种下游任务进行微调。

人工智能在肿瘤学应用的最终目标可能是一个通用的通才模型,一个具有分析、解释甚至有和医患互动能力的多用途工具 这种通才模型将整合多来源的数据,能够进行诊断和治疗建议,并以一种可预见的方式解释其决策。

第三话题:从多模态大语言模型(LLM)到医疗人工智能通才

大型语言模型(LLM)的初始以最简单的形式仅用于文本。自2022年以来,LLM发生了重大变化,产生了集成文本和图像处理的多模态LLM。这些模型可以设计为具有图像感知和文本感知能力的复杂实体,也可以设计将不同的图像处理和文本编码部分合并在一起。例如,流行的LLM chatGPT的当前版本接受图像和文本作为输入。这种多模态方法模糊了自然语言处理和计算机视觉之间的界限,提供了卓越的模式识别和分析技能。

在肿瘤研究中这些进步非常令人期待。多模态模型现在可以分析复杂的组织病理学图像并参与对话互动。最终,这些模型可以在不同的数据类型上进行自我培训,并为不同的任务提供统一的解决方案,例如解释显微镜和X射线图像,以及处理临床笔记。然而,尽管该技术存在并正在迅速发展,但一些实际和监管挑战仍然存在。

深度学习的最终目标是开发一个能够同时处理广泛任务的单一多模式、多任务模型。这样的模式将是真正的“通才”。 例如,而不是有三个单独的放射学模型 图像分析、病理图像分析和基因组数据分析,一个模型可以整合来自所有这些模式的信息,并产生单一的预测。这将减少研究工作流程中所需的模型数量,并通过利用数据类型之间的协同作用来提高其性能。

在过去的几年里,最初的概念验证研究表明,基因组数据和组织学、放射学和组织学、放射学和临床数据以及不同的组织学染色之间存在这种协同作用。最近的这些研究只是从单用途、单模式模型到多用途、多模式模型的更广泛趋势的开始。

扩展之后,通才深度学习模型可以实现LLM风格的用户交互,使模型预测更易于解释。通过整合NLP功能,通才模型可以为他们的预测提供直观的解释,类似于LLM如何生成人类可读的文本。更具体地说, 通才医学人工智能(GMAI)相对较新的概念有可能在未来几年影响肿瘤研究。GMAI熟练处理从成像到遗传信息的各种数据类型,可以显著增强肿瘤学的诊断和预后方法。从特定任务模型向更全面和综合方法的转变,可能标志着人工智能在癌症研究和肿瘤学中的应用发生重大转变。

基于文本的肿瘤研究人工智能工作流程假设如下图:


人工智能在肿瘤研究的新兴用途包括:
- 多模式数据融合

- 可视化大语言模型

- 基因组和蛋白质组学分析

- 药物研发及临床试验优化

下边是一些常见缩写:


原文:https://doi.org/10.1038/s41568-024-00694-7


扩展阅读:

【AI】ASCO post拥抱变化:人工智能在肿瘤治疗上的应用前景

【AI】趋势:人工智能在医疗的应用一些进展和思考

【读文献】AI在肿瘤的现状、挑战与未来

【AI】NCI的研究人员开发了AI工具,或可更精确匹配肿瘤药物与患者

责任编辑:肿瘤资讯-Yuno
排版编辑:肿瘤资讯-Yuno

评论
2024年05月19日
侯宪民
阳谷县人民医院 | 肿瘤内科
期待学习更多知识技能
2024年05月19日
崔艳东
叶县人民医院 | 肿瘤科
肿瘤研究人员人工智能指南
2024年05月18日
刘清霞
潍坊市市立医院 | 内科
不光是肿瘤领域,人工智能应用于各个学科领域