中关村机器人产业创新中心

2024大模型十大趋势：走进“机器外脑”时代

趋势1 算力底座：迈向十万卡集群量变，速度和效率双提升

生成式 AI 的迅猛演进，推动 AI 基础设施（AI Infra）加速发展，增长趋势将从大模型专业领域延伸至各行业领域，AI Infra“质量双螺旋”的发展模式将逐步形成，单集群从万卡“量变”至十万卡的同时，集成、互联和分布式将成为AI Infra“质变”破局的三板斧。

趋势2 推理分析：LLM带来推理能力跃迁，推动智力即服务

大型语言模型（LLM）为人工智能带来了所未有的推理能力，极大地扩展了机器的认知边界。它们不再仅仅是执行简单任务的工具，而是成为了人类的"智力外脑"，能够提供深入的分析、创造性的解决方案和复杂的决策支持。这种推理能力的跃迁得益于LLM 在理解和生成自然语言方面的巨大进步。它们能够解析复杂的文本，提取关键信息，进行逻辑推理，并生成连贯、有见地的回应。这使得LLM能够处理各种知识密集型任务，如法律分析、市场研究、科学发现等，为个人和企业提供了强大的智能支持。

趋势3 创意生成：AIGC应用爆发，降低专业创作门槛

在这个精神追求引领物质需求的时代，AI的进步与社会文化的演变紧密相连，专注音乐和视频生成的AI平台应运而生，为热爱创作的“斜杠青年”们提供了更低门槛的工具，创建了自我表达和创意释放的新社区。大模型的崛起并非仅仅是人工智能对人类能力的替代，更开启了人与AI协作的全新篇章。

趋势4 情绪智能：多模态大模型赋予机器情感价值，打开人机陪伴市场

兼具EQ与IQ的大模型将在未来2-3年内打开人机陪伴市场。基于最新的AI模型如GPT-4o和 Gemini 1.5 Pro，未来AI陪伴将通过流式语音识别、多模态AI和情感计算等技术极大地提升互动体验。在个性化方面，AI通过深度分析用户的情感和行为提供精准服务；在共创方面，AI能够实时理解和回应用户的意图，共同创造一个可交互的丰富世界；在平权方面，多语言支持和辅助技术使不同背景的用户无障碍交流。为实现情感交互和多样性表达，如何做好大模型的长期记忆和持久性是需要突破的核心技术难点，其中涉及两个环节：一是记忆系统的建立，另一个是“回忆策略”的设定。此外，数据隐私、算法偏见和心理依赖等伦理和隐私问题也需要得到充分关注和解决，以确保技术的公平性和安全性。预测未来人机陪伴市场将从以互动游戏、兴趣社区为主的年轻人市场，进一步破圈到包括各年龄层的更广泛用户群体，通过不同级别的情感理解、发散性、准确性、物理交互水平解决用户的多元化陪伴诉求。

趋势5 智能制造：多模态大模型技术升级，提升工业新质生产力

2024年被普遍认为是大模型应用落地的元年，而工业场景将会是大模型的重要战场。工业生产包含复杂的流程，为AI落地提供了丰富的场景。未来多模态大模型有望与当前普遍使用的专用小模型互补融合，并深度赋能工业制造的各个环节，从而推动生产制造的提质增效。例如在研发设计、生产和管理等环节的应用有助于提升生产效率、产品品质和任务处理能力。大模型与产业深入融合以及多模态的混合交互模式的出现，有望重构智能制造系统并推动工业智能化。另一方面，随着场景数据的整合和积累，多模态大模型的感知和理解能力将进一步升级，以满足生产制造中的个性化需求。如提升垂直场景中超微小目标感知及超细粒度语义理解，强化对复杂多模态Prompt的理解能力等。未来借助PEFT等技术的发展，大模型+小样本数据适配的模式将成为模型更新新范式，极大地降低了专属数据量需求。应用中“大模型+工业？”的落地模式将迎来爆发，从而推动工业产业变革，助力人类社会迈向更高层次智能化发展。

趋势6 游戏环境：大模型与游戏共振共生，打造Agent最佳训练场

大语言模型与游戏环境的相结合，正在为AI Agent训练打造最佳训练场。游戏不仅能为AI Agent训练提与现实世界类似的虚拟环境，还能为AI Agent训练提供清晰、可量化的评估规则，大幅提升技术迭代与测试效率。当前，包括OpenAI、DeepMind等在内的前沿研究团队都选取游戏作为AI Agent训练场景，致力于在不同类型的游戏场景中的打造通用AI Agent。大模型与游戏共振共生，不断加速技术迭代与应用创新。未来2-3年内，基于游戏环境训练通用AI Agent将成为行业趋势，游戏将成为AI Agent训练的重要试验场。在大模型和游戏环境的加持下，AI Agent将有望实现决策和泛化能力的突破。

趋势7 移动革新：端侧模型带来智能设备与应用入口变革

端侧生态已成为科技大厂竞争的焦点，端侧大模型结合AI芯片和操作系统，正在构建出一套完整的技术体系。目前，全球科技巨头如Google、苹果、微软以及国内终端厂商都在积极探索这一领域。智能终端在接下来几年，鉴于终端瓶颈、AI agent、端侧真需求等方面的考虑，端+云的混合模型可能更加符合未来长期的发展趋势，其中云端模型承担主要的计算和存储任务，而端侧模型则专注于满足用户的隐私保护和数据安全需求。在交互入口方面，SaaS正在全面推进AI化，AI功能已被集成到各种应用中，从而提升用户体验；随着AI原生OS的发展，操作系统可能会发展成API直接调用的模式，减少对传统图形用户界面的依赖，当前APP的交互服务形态将发生变化，回归本源，服务的深层价值决定着用户去留及时长。

趋势8 具身智能：人型机器人与大模型共同进化，为外脑提供“躯体”

人型机器人作为人工智能的终极载体之一，凭借其类人形态和全身自由度，能够适应未经特别改造的人类环境，从而在各种生产和生活场景中发挥作用。人形机器人的发展依靠两大技术支柱：运动控制与任务训练。机器人本体运动控制即从传统的液压系统向更高效、更精确的电机驱动系统的转变，使得机器人的物理动作更加细腻和人性化；其次，大模型的应用，即结合先进的机器学习技术，尤其是在任务训练方面，大模型的利用极大提高了机器人的学习效率和执行复杂任务的能力。这两种技术的融合不仅推动了人形机器人的技术革新，也为其在实际应用中的广泛部署打开了可能。

趋势9 开源共享：开源生态实现降本普惠，推进外脑共享和迭代

基于对国内外100多个开源大模型的分析，我们预计未来2-3年内，AI开源生态将迎来繁荣发展，随着开源大模型数据质量与多样性提升，大模型将实现规模缩减和质量提升，推进开源大模型从“可用”到“好用”的演变。开源社区的全球协作特性促使开发者共享资源，推动全球知识分享与技术协作。开源模型特别适合需求个性化、数据敏感的垂直行业应用，也为中小企业提供低成本、高效率的AI解决方案，助力更多商业场景的创新发展。此外，AI开源也为安全治理和人才培养提供了更好地条件。

趋势10 人机对齐：AI对齐是大模型产品的重要竞争力，也关乎通用人工智能的未来

在大模型时代，随着AI模型具有越来越多的类人能力、越来越像人，不再被视为纯粹的被动工具，如何让AI模型的能力和行为和人类的价值、目标、伦理道德、意图等追求相一致，这个被称为AI对齐的问题变得越来越重要。人机对齐由此成为了AI发展的重要理念和技术实践。在实践层面，人机对齐是大模型产品成功的关键，也是实现通用人工智能（AGI）的前提。通过人机对齐我们可以构建更加实用、真诚、安全、无害的AI系统，确保智能向善。

报告原文节选如下：