2024大模型十大趋势:走进“机器外脑”时代

发布时间:2024-07-09 来源:幻影视界

2024大模型十大趋势:走进“机器外脑”时代

 

        趋势1 算力底座:迈向十万卡集群量变, 速度和效率双提升

       生成式 AI 的迅猛演进,推动 AI 基础设施(AI Infra)加速 发展,增长趋势将从大模型专业领域延伸至各 行业领 域,AI Infra“质量双螺旋”的发展模式将逐步形成,单集 群从万卡“量变”至十万卡的同时,集成、互联和分布式 将成为AI Infra“质变”破局的三板斧。

       趋势2 推理分析:LLM带来推理能力跃迁,推动智力即服务 

       大型语言模型(LLM)为人工智能带来了所未有的推理能力,极大地扩展了机器的认知 边界。它们不再仅仅是执行简单任务的工具,而是成为了人类的"智力外脑",能够提供 深入的分析、创造性的解决方案和复杂的决策支持。这种推理能力的跃迁得益于LLM 在理解和生成自然语言方面的巨大进步。它们能够解析复杂的文本,提取关键信息,进 行逻辑推理,并生成连贯、有见地的回应。这使得LLM能够处理各种知识密集型任务, 如法律分析、市场研究、科学发现等,为个人和企业提供了强大的智能支持。 

       趋势3 创意生成:AIGC应用爆发, 降低专业创作门槛

       在这个精神追求引领物质需求的时代,AI的进步与社会文化的演变紧密相连,专注音乐 和视频生成的AI平台应运而生,为热爱创作的“斜杠青年”们提供了更低门槛的工具, 创建了自我表达和创意释放的新社区。大模型的崛起并非仅仅是人工智能对人类能力 的替代,更开启了人与AI协作的全新篇章。 

       趋势4 情绪智能:多模态大模型赋予机器情感价值,打开人机陪伴市场

       兼具EQ与IQ的大模型将在未来2-3年内打开人机陪伴市场。基于最新的AI模型如GPT-4o和 Gemini 1.5 Pro,未来AI陪伴将通过流式语音识别、多模态AI和情感计算等技术极大地提升互 动体验。在个性化方面,AI通过深度分析用户的情感和行为提供精准服务;在共创方面,AI能够 实时理解和回应用户的意图,共同创造一个可交互的丰富世界;在平权方面,多语言支持和辅 助技术使不同背景的用户无障碍交流。为实现情感交互和多样性表达,如何做好大模型的长期 记忆和持久性是需要突破的核心技术难点,其中涉及两个环节:一是记忆系统的建立,另一个 是“回忆策略”的设定。此外,数据隐私、算法偏见和心理依赖等伦理和隐私问题也需要得到 充分关注和解决,以确保技术的公平性和安全性。预测未来人机陪伴市场将从以互动游戏、兴 趣社区为主的年轻人市场,进一步破圈到包括各年龄层的更广泛用户群体,通过不同级别的情 感理解、发散性、准确性、物理交互水平解决用户的多元化陪伴诉求。 

       趋势5 智能制造:多模态大模型技术升级,提升工业新质生产力

       2024年被普遍认为是大模型应用落地的元年,而工业场景将会是大模型的重要战场。工业生 产包含复杂的流程,为AI落地提供了丰富的场景。未来多模态大模型有望与当前普遍使用的专 用小模型互补融合,并深度赋能工业制造的各个环节,从而推动生产制造的提质增效。例如在 研发设计、生产和管理等环节的应用有助于提升生产效率、产品品质和任务处理能力。大模型 与产业深入融合以及多模态的混合交互模式的出现,有望重构智能制造系统并推动工业智能 化。另一方面,随着场景数据的整合和积累,多模态大模型的感知和理解能力将进一步升级, 以满足生产制造中的个性化需求。如提升垂直场景中超微小目标感知及超细粒度语义理解,强 化对复杂多模态Prompt的理解能力等。未来借助PEFT等技术的发展,大模型+小样本数据适 配的模式将成为模型更新新范式,极大地降低了专属数据量需求。应用中“大模型+工业?”的 落地模式将迎来爆发,从而推动工业产业变革,助力人类社会迈向更高层次智能化发展。 

       趋势6 游戏环境:大模型与游戏共振共生,打造Agent最佳训练场

       大语言模型与游戏环境的相结合,正在为AI Agent训练打造最佳训练场。游戏不仅能 为AI Agent训练提与现实世界类似的虚拟环境,还能为AI Agent训练提供清晰、可量化 的评估规则,大幅提升技术迭代与测试效率。当前,包括OpenAI、DeepMind等在内的 前沿研究团队都选取游戏作为AI Agent训练场景,致力于在不同类型的游戏场景中的 打造通用AI Agent。大模型与游戏共振共生,不断加速技术迭代与应用创新。未来2-3年内,基于游戏环境 训练通用AI Agent将成为行业趋势,游戏将成为AI Agent训练的重要试验场。在大模型 和游戏环境的加持下,AI Agent将有望实现决策和泛化能力的突破。 

       趋势7 移动革新:端侧模型带来智能设备与应用入口变革

       端侧生态已成为科技大厂竞争的焦点,端侧大模型结合AI芯片和操作系统,正在构建 出一套完整的技术体系。目前,全球科技巨头如Google、苹果、微软以及国内终端厂商 都在积极探索这一领域。智能终端在接下来几年,鉴于终端瓶颈、AI agent、端侧真需 求等方面的考虑,端+云的混合模型可能更加符合未来长期的发展趋势,其中云端模型 承担主要的计算和存储任务,而端侧模型则专注于满足用户的隐私保护和数据安全需 求。在交互入口方面,SaaS正在全面推进AI化,AI功能已被集成到各种应用中,从而提 升用户体验;随着AI原生OS的发展,操作系统可能会发展成API直接调用的模式,减少 对传统图形用户界面的依赖,当前APP的交互服务形态将发生变化,回归本源,服务的 深层价值决定着用户去留及时长。 

       趋势8 具身智能:人型机器人与大模型共同进化,为外脑提供“躯体”

       人型机器人作为人工智能的终极载体之一,凭借其类人形态和全身自由度,能够适应 未经特别改造的人类环境,从而在各种生产和生活场景中发挥作用。人形机器人的发 展依靠两大技术支柱:运动控制与任务训练。机器人本体运动控制即从传统的液压系 统向更高效、更精确的电机驱动系统的转变,使得机器人的物理动作更加细腻和人性 化;其次,大模型的应用,即结合先进的机器学习技术,尤其是在任务训练方面,大模 型的利用极大提高了机器人的学习效率和执行复杂任务的能力。这两种技术的融合不 仅推动了人形机器人的技术革新,也为其在实际应用中的广泛部署打开了可能。 

       趋势9 开源共享:开源生态实现降本普惠,推进外脑共享和迭代

       基于对国内外100多个开源大模型的分析,我们预计未来2-3年内,AI开源生态将迎来 繁荣发展,随着开源大模型数据质量与多样性提升,大模型将实现规模缩减和质量提 升,推进开源大模型从“可用”到“好用”的演变。开源社区的全球协作特性促使开发者 共享资源,推动全球知识分享与技术协作。开源模型特别适合需求个性化、数据敏感 的垂直行业应用,也为中小企业提供低成本、高效率的AI解决方案,助力更多商业场景 的创新发展。此外,AI开源也为安全治理和人才培养提供了更好地条件。 

       趋势10 人机对齐:AI对齐是大模型产品的重要竞争力,也关乎通用人工 智能的未来

       在大模型时代,随着AI模型具有越来越多的类人能力、越来越像人,不再被视为纯粹 的被动工具,如何让AI模型的能力和行为和人类的价值、目标、伦理道德、意图等追求 相一致,这个被称为AI对齐的问题变得越来越重要。人机对齐由此成为了AI发展的重要 理念和技术实践。在实践层面,人机对齐是大模型产品成功的关键,也是实现通用人工 智能(AGI)的前提。通过人机对齐我们可以构建更加实用、真诚、安全、无害的AI系 统,确保智能向善。 

       报告原文节选如下: