LLM大模型意味着人工智能的质变时刻已经到来！

AI资讯1年前 (2023)发布 shuangyan

2 0 0

作者 | 王启隆、唐小引

出品 | CSDN（ID：CSDNnews）

【CSDN 编者按】在人工智能几经起落的发展史里，人工智能进化的里程碑式的演进中，我们总会看见百年企业 IBM 的身影。除了大家所熟知的 1997 年 IBM 的深蓝计算机在国际象棋比赛（和复赛）中击败国际象棋世界冠军 Garry Kasparov，还有上世纪的跳棋人机大战等诸多事件。而今天，在大模型的时代，IBM 带来了针对基础模型 watsonx 和生成式 AI 的全新平台 —— watsonx。

IBM 大中华区董事长、总经理陈旭东这样说道：“ChatGPT 的横空出世，证明了大语言模型是一条走得通、通往未来 AI 的道路，也意味着 AI 的发展经过几十年的算法、算力、数据方面的量变积累，‘质变时刻’已经到来。”

图源：作者摄于 IBM 北京

2011 年，IBM（国际商业机器公司）正式踏入了百年企业的行列，它是世界上最具影响力的科技公司之一，具有丰富的历史和卓越的技术传统。IBM 当时举办了一场纪念百年辉煌历程的盛大庆典，用一部短片将 IBM 的百年历史浓缩成了令人陶醉的几分钟，并全球各个角落提供了为时一整年的志愿者活动。

直到现在，我们仍然可以通过 IBM 100 网页穿越时空，回顾从机械制表机起，逐一浏览原子重排技术、Fortran、RISC、大型机、个人电脑、小型机、深蓝、Watson 的每一个创举。

2023 年，IBM 百年庆典后的第十二年，这是属于 AI 的一年。各行各业的公司纷纷加入这股智能潮流，研发各形各色的大模型，推出可以为我们规划假期的生成式聊天机器人、组织企业数据的 AI 智能助手以及可以创建图像和视频的 AI 服务。今年 8 月，IBM 也紧跟着这道热潮，宣布启动新一代 AI 与数据平台 IBM watsonx，为企业级基础模型和生成式 AI 提供动力。

这是继红帽 OpenShift 开放式混合云技术平台之后，IBM 落地大中华区市场的又一个具有里程碑意义的开放式 AI 技术平台。

“Watson ”是 IBM 创始人老沃森的名字，也是 IBM 文化奠基人托马斯·J·沃森（Thomas J. Watson Sr.）的名字。随着时间的推移，这个名字变得更加具有象征性，代表了 IBM 在人工智能领域的雄心壮志和创新。若要回溯这些历史，还得先从那些不起眼的象棋棋子开始。

始于棋局的 AI

自 20 世纪 40 年代末人工智能和第一台计算机出现以来，计算机象棋就与人工智能领域联系在一起。

这两个领域交织了许多知名人士，例如艾伦·图灵（Alan Turing），现代计算机科学的奠基人；约翰·麦卡锡 (John McCarthy) ，“人工智能”一词的创造者；布尔逻辑先驱克劳德·香农（Claude Shannon），他率先支持使用国际象棋作为智力发展的适当起点。

其中，图灵并没有被当时技术的缺乏和先例的确立所吓倒，而是寻求支持他的理论，并为世界上第一个国际象棋程序编写了算法。不幸的是，这个由图灵本人写在纸上并实施的程序，很快就被一名同事轻松地击败了。

从那以后，大量的程序员投入时间和精力来研究国际象棋，他们坚信这个游戏将会使人工智能领域取得突破性进展。这些研究人员在国际象棋的结构中看到了一个大规模问题解决的简化模型。而从人类比较的角度来看，世界各地已经存在的国际象棋选手的等级体系则为工程师提供了一个用来轻松而准确地衡量机器实力的标尺。

几十年的研究几乎没有取得进展，许多计算机都曾与众多国际象棋大师对弈，无一得胜。直到 1985 年，卡内基梅隆大学的研究生许峰雄（Feng-hsiung Hsu）开始着手他的论文项目：ChipTest，一台国际象棋机器。许峰雄的同学 Murray Campbell 也参与其中，并在 1989 年被聘为 IBM Research 的工作人员。他们加入了 IBM 的团队，并将该项目命名为“深蓝”（Deep Blue）。

凭借强大的硬件系统和创新的评测功能，深蓝一号在 1996 年以六局的赛制（six-game chess matches）发起了比赛，与当时的国际象棋世界冠军卡斯帕罗夫对决。令许多人惊讶的是，深蓝直接拿下了第一局，这也是机器首次战胜国际象棋世界冠军。然而，卡斯帕罗夫并没被早期失利吓倒，而是最终以四比二的比分赢得了整个比赛。

经过多次更新和提高其国际象棋知识以对抗上一场比赛中使用的策略，重建的深蓝在 1997 年的复赛中战胜了卡斯帕罗夫。

在比赛中，卡斯帕罗夫擅长的非传统开局、心理威吓和超时战术对机器没有任何影响，因为深蓝只会冷静地识别和分析棋局上的情况：人类玩家在棋盘上表现出的威胁和情感在机器对局势的评估中没有太大影响。

深蓝使用的架构并未局限于赛场，而是很快应用到金融建模、数据挖掘和分子动力学等方面。最终，深蓝被退役并存放在华盛顿特区的史密森尼博物馆，结束了风光的一生。在 AI 领域，IBM 也没有因此懈怠，而是投入到另一项重大挑战：打造一台能够在更复杂的游戏中击败人类冠军的计算机。

AI 能思考吗？

2011 年，IBM 的 Watson 计算机参加了电视智力竞赛节目《危险边缘》（Jeopardy!）的比赛，对抗该节目有史以来最杰出的两位冠军选手。Watson 计算机由 IBM 研究部门开发，可以运行一个名为 Deep QA 的软件。虽然这个项目的主要挑战是在《危险边缘》中获胜，但 Watson 的真实目标是创建一代新的技术，试图战胜标准搜索技术，更有效地从非结构化数据中找到答案。

耳熟吗？是否很像那个爆红的对话式人工智能——ChatGPT。对于 IBM 的科学家而言，这不是什么很难想到的创意，但它涌现出的奇迹却未能在 2011 年提前现世，而是需要沉淀 12 年的数据。

节目中，Watson 在理解复杂问题和找到最佳答案方面表现出色。IBM 的科学家也做出了解释，指出 Watson 实际上不会思考。

“我们的目标是构建一台计算机，能够更有效地理解和运用自然语言，但并不一定需要以与人类相同的方式思考，而不是模仿人脑，”曾在 IBM 研究部门工作了 15 年，专注于自然语言问题和在非结构化信息中找到答案的 David Ferrucci 说道。

《危险边缘》的问题充满了微妙之处、双关语和文字游戏，这些典型的脑筋急转弯问题充斥着计算机难以应对的元素。计算机从来都不擅长寻找答案。搜索引擎不会回答问题，它们只会提供与关键词匹配的成千上万个搜索结果。

长期以来，大学研究人员和公司工程师一直致力于创造一个完美的问答软件，但最优秀的软件也只能理解和回答简单直接的问题——哪怕是 2023 年的今天，问答大模型也经常会“胡诌”出一堆子虚乌有的事实来敷衍我们。

Watson 运行在一组 Power 750 计算机上，包括十个机架，90 个服务器，共计 2880 个处理器核心。它可以容纳大约相当于一百万本书的信息。IBM 耗费多年时间让 Watson 吸收了大量信息，包括商业来源的文本以及允许公开复制其内容的来源（如维基百科）。

主持人向 Watson 提出问题时，超过 100 个算法将以不同的方式分析问题，并同时找到许多不同的合理答案。另一组算法则会对答案进行排名并给出分数。对于每个可能的答案，Watson 会找到可能支持或反驳该答案的证据。然而，在《危险边缘》的比赛中，如果最高排名的可能答案评级不高到足以给 Watson 足够的信心，那么 Watson 会决定不按键，以避免答错而损失分数。

2010 年末，Watson 进行过一轮测试，在与前《危险边缘》冠军选手对战的比赛中赢得约 70％的比赛。然后，2011 年 2 月，迭代到最新版本的 Watson 战胜了《危险边缘》的人类巨星肯·詹宁斯（Ken Jennings）和布拉德·拉特（Brad Rutter）。

“Watson 之父”约翰·凯利表示：“我想创建一些可以引入到每个其他零售行业、交通运输行业等领域的东西，因为无论在哪里，时间都至关重要，需要将尖端信息提供给前线决策者。计算机需要从后勤变成提高人类决策智慧的工具。”

深蓝和 Watson 分别代表了 IBM 在 AI 领域的两个巅峰时刻。深蓝的胜利证明了机器在高度专业领域的潜力，而 Watson 则将 AI 引入了自然语言处理和商业应用的新领域。这两个里程碑都为 IBM 在 AI 领域的未来探索奠定了坚实基础。

拥抱基础模型与生成式 AI

上世纪 80 年代，IBM 犹如硅谷之巅的一尊巨兽，等待着挑战。微软和苹果虎视眈眈，而无数初创企业也跃跃欲试。几十年来，IBM 一直走在突破性人工智能科技的前沿。从深蓝到 Watson，再到云原生时代，在云计算的基础上构建了 AI 超级计算机。然而，AI 寒冬太过漫长，许多公司放弃了在人工智能领域的探索，投入资源更多地用于其他领域。

随着 ChatGPT 点燃了这场寒冬，企业对生成式 AI 和大语言模型的关注度激增，迫切希望应用 AI 领域的新技术来提升竞争力。今年 8 月的发布会上，IBM 将多年以来在企业级 AI 领域积累的技术和经验，结合最近五年在基础模型研究方面取得的进展，推出了新一代数据与 AI 平台 IBM watsonx。

watsonx 是 IBM 为解决企业在人工智能应用中的数据管理、模型开发、验证、部署和治理等方面的挑战而推出的综合平台。该平台包括 watsonx.ai、watsonx.data 和 watsonx.governance 三个关键组件，共同构成了一个完整的AI生命周期解决方案。

watsonx.ai 是平台的核心，专注于AI模型的训练、验证、微调和部署。它为企业提供了强大的计算资源，以处理大规模的模型训练任务。有了 watsonx.ai，AI 构建者就可以利用 IBM 的模型和 Hugging Face 的模型来完成一系列 AI 开发任务。

这些模型经过预训练，可支持一系列自然语言处理（NLP）类型的任务，包括问答、内容生成和摘要、文本分类和提取。watsonx.ai 允许企业选择适合其需求的模型架构，并根据模型性能的基准测试结果来评估和选择最佳模型。

在发布会的演讲中，IBM 大中华区首席技术官、研发中心总经理谢东也对 IBM 近期的 AI 研究作出了详细的介绍：「最近，很多人都问我一个问题：IBM 是否还在持续发展人工智能？我想告诉大家，IBM 一直都是混合云与 AI 领域的领导者。

IBM 多年来一直是多个重大体育赛事的技术赞助商，包括美国高尔夫球大师赛、英国温布尔登网球锦标赛和美国网球公开赛。

我之所以提到这些体育赛事，不仅因为我热爱体育，更重要的是要说明，用于这些大赛的基于 watsonx 的生成式人工智能的技术，也是我们用于赋能各行各业应用的 AI 技术——基于特定专业领域的数据（如网球、高尔夫球）和知识，提供更为准确的预测（如球员比赛的赢率）。

但有人可能会问，人工智能如此强大和有趣，是否很容易应用到各个领域呢？我要告诉大家，实际情况并非如此。虽然很多人熟悉 ChatGPT 等大语言模型，但实际应用 AI 需要考虑多个因素，包括模型的选择、数据的利用、开发环境和算力等等。

这就是许多企业目前面临的挑战。随着大语言模型的不断涌现，企业需要仔细思考选择哪个模型、如何充分利用自身数据、如何开发应用和部署等问题。而 IBM 正致力于解决这些问题，为企业提供完整的人工智能解决方案。」

IBM 大中华区首席技术官、研发中心总经理谢东

watsonx.data 是数据管理的关键部分，它帮助企业高效地准备、过滤和清洗数据以用于训练模型。数据的分类和词符化是数据准备过程中的重要步骤。watsonx.data 还允许企业使用自有数据或 IBM 数据堆来满足模型训练的需求，并提供了数据名片和版本控制，以便进行数据的可追溯治理。

数据——这个词汇一直萦绕在无数技术人的心中，更是 IBM 历史上重要的一页。IBM 在上世纪 70 年代对数据库领域产生了深远影响。1970 年，IBM 的科学家埃德加·科德（Edgar F. Codd）提出了关系型数据库的理论，这一理论后来演化成了 SQL（结构化查询语言），为关系型数据库管理系统（RDBMS）的发展奠定了基础。

到了上文提到的 IBM Watson 时代，Watson 利用大规模的数据库来构建知识图谱，帮助用户获取复杂问题的答案。Watson 还被用于医疗领域，可以通过分析数百万篇医学文献和病例数据库来辅助医生制定诊断和治疗方案。

如今，watson 之名还在延续。今年晚些时候，watsonx.data 将利用 watsonx.ai 的基础模型，来帮助简化和加速用户与数据的交互方式，使他们能够使用自然语言以对话式的用户体验来发现、增强、优化和可视化其数据与元数据。

watsonx.governance 关注企业级 AI 的合规性和治理。正如这场发布会的名称——“企业级 AI 的未来”。它确保模型和数据遵守法律法规和道德标准，特别是在处理敏感信息和隐私数据时。在演讲中，强调了治理的重要性，以确保企业可以信任其 AI 系统。watsonx.governance 还提供了事实表，用于记录模型和数据的详细信息，以便进行监控和更新。

跨世纪的 AI 探索者

深蓝和 Watson 都是早期的 AI 项目，笔者看过无数论坛网友和名人学者对它们的抨击，这些机器被批评“没有真正的智能”。

尽管深蓝在计算棋局和搜索可能着法方面非常强大，但它被批评为一种”硬编码”方法，即它不具备真正的智能或推理能力。深蓝的胜利主要依赖于其出色的计算速度和搜索算法，而不是对棋局的理解。

Watson 的批评主要涉及到它在回答问题时的不确定性管理和推理能力。尽管 Watson 可以处理大量的信息和文本数据，但它有时会给出不准确的答案，因为它不能真正理解问题的上下文，只是根据统计概率进行答案选择。

现在，大模型也正在受到一样的抨击。

它依旧不会推理、不会思考、不具备情感，但却和 IBM 的几次尝试一样有用，为全行业注入了新的活力。就像深蓝和 Watson 在投入使用后为 IBM 的专业领域带来了重大的贡献一样，大模型也滋润着各行各业。

人工智能领域仍在不断发展，无数企业和科学家们不懈努力，追求更优化的方法来处理认知任务和推理问题，以实现更高级别的智能。尽管面临挑战，AI 领域的前景仍然充满希望。