前三次工业革命的结果证明,赢家并不是那些发明蒸汽机等颠覆性技术的人,而是那些看到未来并且迅速利用行业潜在变革影响的公司。 “我已经公开说过,我们不相信人工智能是炒作。对我们而言,人工智能是一种变革性的力量,它正在加速物理世界和数字世界的融合。” 这是默克集团执行董事会主席兼首席执行官葛丽鹤(Belén Garijo)在“AI日”上表达的立场。在人们的印象中,欧洲对数字化和人工智能的态度始终处于不温不火的状态,当AI浪潮席卷而来,欧洲也没能拿出几个大模型或是“杀手”级应用。 然而,这家有着357年历史的家族企业,早已在技术更迭中嗅到了方向。2022年,看到ChatGPT的影响力之后,默克集团(以下简称“默克”)即刻行动,六个月后便向员工推出myGPT。 这家完整经历过三次工业革命的企业,早已预见由AI引领的第四次工业革命的影响。对于默克内生的韧性和远见,葛丽鹤这样评价:“前三次工业革命的结果证明,赢家并不是那些发明蒸汽机等颠覆性技术的人,而是那些看到未来并且迅速利用行业潜在变革影响的公司。” 01 赢家是那些识别关键问题的人 默克并没有把人工智能大模型当成一蹴而就的“万灵丹”。显然,当全球公司都在使用同样的开源或闭源基座大模型时,唯有各家掌握的数据,才是让模型效果分化的根源。“AI革命的燃料显然是数据。”葛丽鹤直言,“这场工业革命的赢家将是那些真正知道如何处理数据、掌握数据基础的人,他们将推动转型。” 默克首席数据与人工智能官兼数字伦理委员会主席瓦利德·梅汉纳(Walid Mehanna)认为,数据通常是一个副产品,在不同人的眼中,有时它是废品,有时是高质量的产品。AI的基石还在于坚实的数据基础。 向AI转型,除了需要具备数据基础,这还是一项系统工程。无论哪家企业投身其中,都将面临数据整理(AI-ready data)、业务场景选择、人才匹配与流程更新的挑战。 梅汉纳将AI战略称为“三位一体”,即人、工作方式和技术。“AI将改变员工的思维方式、工作方式,改变客户、用户、合作伙伴的协作方式,最终将改变行业的游戏规则。”梅汉纳说。 在组织中推动AI,好比攀登一座金字塔。梅汉纳说:“金字塔顶端是我们需要去往的地方,但是如果没有真正了解AI、拥抱AI的员工,即便拥有高质量的数据,也是无法达成AI变革目标的。” 2022年11月,OpenAI发布ChatGPT-3.5,标志着人工智能大模型时代的开启。面对这一转折性时刻,不同企业的反应截然不同。梅汉纳回忆道:“在ChatGPT推出的头几个月,当其他公司用防火墙将其封禁时,默克经过讨论,明确决定不这么做。我们希望员工能够试用ChatGPT,并从中学习。我们希望参与其中,成为先行者,并且保持开放。我们要尽可能快地确保人工智能使用的安全性、稳定性和合规性。” 仅仅六个月之后,默克便发布了面向员工的1.0版myGPT。2023年10月,默克与一家柏林创业公司Langdock合作开发myGPT套件新版本。2024年3月,默克将myGPT扩展为具有丰富协作功能的综合性套件。同年5月,myGPT通过分析和解释各种视觉资产,拥有了“看”的能力,包括图像、幻灯片、图表、技术图解和报告。myGPT套件中的智能助手能够浏览互联网,连接到公司系统,从而进一步扩大模型的知识和能力。 如今,myGPT成为默克的十大应用程序之一,每月拥有超过18000名活跃用户,每周节约3600个工时,有超过4700名AI助手无缝嵌入业务流程,超过1万名员工通过默克数据与数字学院加入“GenAI能力升级计划”。2024年,myGPT执行了超过400万个提示词。 用户数据表明,个人贡献者使用myGPT套件起草和创建内容,经理和高级领导人使用该工具的主要目的是为了头脑风暴、构思想法。myGPT所展示的成效让默克上下都看到了更好的商业成果,让员工专注于更高价值的任务。 02 数据为业务注入想象 默克首席科学技术官劳拉·马茨(Laura Matz)对AI的发展保持着热情与理性。她说:“有很多新闻在讨论人工智能是否带来了真正的价值。我们真正需要牢记的是,人工智能是解决商业问题的一种工具。默克正在扎实构建人工智能工具、数字工具以及相关能力的基础。数据与数字技术,再加上科技创新,将成为我们未来发展的催化剂。” 数据与数字驱动的创新,目标是实现自动化流程,分析大型数据集,从而获取可行的洞察,提升决策能力。在默克的蓝图中,由数据和数字化驱动的变革将体现在精准医疗、供应链、可持续发展以及生物融合领域,在智能制造、药物发现以及工业数据生态体系中发挥作用。 “我们的AI应用始于商业问题,思考需要哪些数据,牢记这一点非常重要。”马茨指出,“在一些应用案例中,我们可能没有掌握所有合适的数据,所以得先处理数据,做好数据整合,下一步才是思考如何利用各种人工智能技术和数字技术来有效地解决这些问题。” 默克有三大业务部门,全球拥有63000名员工。将AI应用在全部领域同时铺开并不现实,需要挑选几个重中之重的领域,全力以赴地加以实践。 默克三个业务部门均涉及化学和生物学。在生命科学和医药健康领域,药物研发是极其重要的一个环节。如何缩短早期分子发现的时间?将一种全新疗法推向市场并开展临床试验时,如何提高成功的概率?怎样才能知道疗法有效?这正是默克将人工智能技术融入药物研发的动因。 基于此,默克推出了两套对外共享的数据生态系统,一套是面向半导体行业公司的Athinia®,另一套是面向医药健康行业客户的Syntropy。马茨说:“在这些行业内将多个合作伙伴的数据整合在一起,实际上能够产生更大的影响,切实推动行业向前发展。” 03 效率革命还是颠覆式竞争 提升工作效率,是AI的基本配置,迈向颠覆式竞争,才是人们对AI真正的期待。myGPT的普及提升了工作效率,但默克不满足于此,在一些智能制造和药物研发的场景中,正在尝试用生成式模型重构既往的业务流程和研发方式。目前实践表明,药物研发中引入的生成式大模型,即将打破“十年制一药”的魔咒。 AI应用,究竟是从业务短板开始,还是找到易于实施且效果显著的业务场景?Athinia®平台便回答了这个问题。在半导体生产的业务场景中,默克着力构建的数据生态体系在流程优化和生产力提升上双双获益,具有低风险、易实施、成本可控的特点。 2021年,默克电子科技与一家芯片制造企业展开了智慧数据的合作。默克电子科技是全球第五大半导体公司,从事半导体材料生产有47年的历史,业务涉及光刻、沉积、平坦化、蚀刻、清洗、掺杂及封装。 在生产中,默克面临的挑战是质量控制参数呈指数级增长,管理数据犹如 “大海捞针”。如果继续沿用以往的质量管控方法,只会增加成本。借助新兴技术,默克尝试与芯片厂商一起,探索在半导体生态中建立智慧数据合作,从而改变质量管控的方法。 现实问题是,半导体产业链上的数据分散在生态体系的各个环节,晶圆厂、材料供应商、客户的数据都是独立且分散的。默克希望整合相关数据,有了数据底座之后,才能对生产环节进行更好的分析与管控,形成持续反馈闭环。然而,合作方最为担心的是数据隐私以及数据安全性,这一合作需要建立在一个高度信任的基础上。 在此背景和需求之下,Athinia®应运而生。这一平台旨在让半导体上下游企业通过安全地共享和分析数据来开展协作,帮助各方尽快发现问题、提高制造流程的效率。 数据汇总听起来微不足道,却是一件极为复杂的事。通常,企业的数据分布在多个不同的服务器、存储设备和数据库中,文件格式互不兼容,数据库结构也不同。Athinia®作为单一系统,可一站式访问不同来源的数据,实现文件和数据库格式的标准化。 生态建设的第一步是数据标准化。相关数据包括价值主张、数据流水线(采集、预处理、交换)、数据分析和模型以及科学论证。以价值主张的标准化为例,默克针对晶圆制造工厂和材料供应商,设立了三项标准,分别是质量基线、性能/良率以及经验迁移。 生态建设的第二步是规模化。规模化体现在三个维度,即产品深度拓展的规模化,跨产品拓展的规模化以及跨生态系统拓展的规模化。标准化是数据建设从0-1的过程,这些元数据是规模化的基础,通过规模化完成数据建设从1-N的过程。 规模化具体表现为,将产品的分析范围扩展至更多产品;在类似产品或流程之间做经验教训的迁移;通过复用相同的数据资产,在更多用例中纳入更多参与方,或者借助整合多方数据来增强预测能力与洞察深度。 自首批完整数据上传至Athinia®平台以来,三个月内,默克已针对4款产品开展分析工作。如今,排查根本原因的速度提升了10倍,还能并行探究多项假设。 一提起药物研发,人们便将其与耗时长、成本高、成功率低相关联。实际情况也是如此,一家制药企业通常要花12年时间研发一款新药,成功率却不到4%,有40%的时间都花在了非常早期的药物发现阶段。 研发人员迫切需要解决的问题是,缩短研发时间,提高成功概率,降低多次实验的成本。简言之,不再盲目尝试,而是让每一次尝试都更具价值。 默克药物研发人工智能与自动化负责人阿什维尼·戈加雷(Ashwini Ghogare)说:“科学家针对某类疾病开展研究时,首先会在设计环节决定研发什么药物,其次是解决如何研发。设计环节正是生成式模型发挥作用的地方,可以缩短研发周期。” 但人工智能模型经常会产生“幻觉”,或者得出不可信的结果。戈加雷指出,这是因为大模型从公共领域获得的数据大多是正面数据,没有负面数据。如果仅用正面数据训练模型,大模型就会产生误报,即“幻觉”,所以,引入负面数据作为模型训练的补充极其重要。“这就是我们构建AIDDISONTM生成式模型时的差异化所在。该模型基于我们过去30年内部实验数据进行训练,这些数据有成功案例,更重要的是也有失败案例。正是这些成功与失败数据的结合,才让AIDDISONTM的预测变得稳健且可靠。” AIDDISONTM是“基于人工智能的药物发现解决方案”(AI - powered Drug DIscovery SolutiON)的缩写。它是一个全新的基于人工智能的平台,融合了默克在生命科学与化学领域的专业知识,帮助研究人员从现实世界的制药研发数据中学习。戈加雷说:“AIDDISONTM如同瑞士军刀一般,将生成式人工智能与计算技术整合到一个平台上,这是实现更快速、更成功药物研发的制胜秘诀。” 人工智能助力药物研发中最引人入胜的一个方面,便是全新的分子设计。模型生成具有所需化学特性的一系列虚拟分子,依据新颖性、类药性(即对一种化合物成为药物的适宜程度进行定性评估)以及与目标化学结构的相似性来设计新分子。这些模型还会根据生成分子的可合成性进行打分,这是一项关键进展,能帮助研究人员在药物发现过程中更早知晓他们新设计的分子是否具备合成的可能性。 在某些情况下,研究人员可能已经有了感兴趣的目标分子,并且可能希望在现有化学数据库中探索类似的药效团(即勾勒出分子与特定生物靶点相互作用所需关键特征的蓝图)。AIDDISONTM让研究人员接触到超大型虚拟化学库的整合资源,这些库包含超过 640 亿个分子。 采用生成式人工智能设计新分子意味着什么?戈加雷打比方说:“设计一种新分子就像是玩一个魔方,魔方上的每一种颜色代表着一种试图优化的特性或参数,如红色代表毒性,绿色代表吸收性。你希望吃的止疼药效果显著,又不希望对身体产生毒副作用,怎样才能优化这些特性呢?这其实就是药物研发的过程。一个分子就如此复杂,想象一下,如果要设计成百上千个分子,这个挑战有多大。” 由AI驱动的药物发现软件AIDDISONTM以及合成路线预测软件 SYNTHIATM与科学家协同工作,高效地解决分子优化的难题。默克据此设计出数百个分子。起初,一些分子的属性中仍有不少红色标注(毒性),但随着时间推移,人工智能设计出的分子变得越来越好。戈加雷说:“这是一个反复提炼的过程,虽然不会得到一个全是绿色标注(表示优良)的化合物,却是根据需求所能得到的最佳分子。” 在实践中,默克的研发人员关注了肿瘤学靶点研究中一种极为重要的蛋白质。起初构想的分子并不理想,但随后研发出了性能优越得多的新分子。研究人员不仅仅依赖生成式人工智能找到合适的分子,还要观察分子中的每个原子如何与蛋白质相互作用,通过观察来验证想法。戈加雷说:“分子设计固然很棒,但最终的问题是,我们能把它制造出来吗?这就是向SYNTHIATM寻求答案的地方。” AIDDISONTM 通过与SYNTHIATM软件的 API(应用程序编程接口)连接,在药物研发的早期就融入了逆合成分析的见解,帮助研究人员逐步拆解虚拟分子,并检索超过 10万个由化学家编写的反应规则,以确定最有效的合成路径。SYNTHIATM还会返回合成该化合物所需的关键成分和试剂清单,让化合物合成所需的工具触手可及。在药物研发过程早期规划合成步骤,帮助研究人员更快确定实际可用的化合物,从而节省大量的时间和资源。 04 信任是人工智能生态的基石 默克在近几十年里构建起所需的数据文化,并因数据建设而获得额外的能力,提高了工作效率,这是一个持续发展的过程。评估人工智能对集团的影响,葛丽鹤用了以下几个关键词:改变工作方式,加速研发,提升发现效率。 “我们在生命科学、电子科技以及医药健康领域占据领先地位。这些领域都极有可能因人工智能和数据而发生重大变革。”葛丽鹤说,“默克能够成功地构建起数据生态体系,这是源于默克长期积累下来的无价的信任资本。”多年前,数字工具普及时,默克是第一家发布行为准则的公司,并在道德规范方面处于领先地位。与客户互动,并让客户使用默克的一些平台时,拥有信任并且善用信任至关重要,既能帮助客户解决所面临的各种问题,也能让工具的能力得到更好地发挥。 “如今,我们正处在一个独特的交叉点上,人工智能、人类智慧与物质智能在此相互融合。人工智能如同科学一样,将成为一股推动美好事物的强大力量。”葛丽鹤说,“人工智能已经深深地融入了我们‘点燃创新火花,提升人类福祉’ 的愿景之中。我们尚未走到终点。” 来源 | 《商学院》杂志2025年2&3月合刊
全部评论