"前不久Gartner(国际咨询机构)发布的调研显示,超过60%的中国企业计划在未来12至24个月内部署生成式AI,可以看到企业对应用大模型技术的迫切感。那么如何将想法变为现实,帮助企业打破大模型技术落地障碍?在过去一年和广大客户的共创中,我们发现:要让企业用上大模型,用好大模型,还需要解决三大挑战。"
在5月17日腾讯云生成式AI产业应用峰会上,腾讯云副总裁、腾讯云智能负责人吴运声如是说。
吴运声表示,随着大模型技术的快速发展,人工智能已成为企业数字化转型的核心动力。在加速大模型产业创新,推动企业应用大模型技术的过程中,我们需面对降低使用门槛、提高平台适配性、保障安全合规三大挑战。这就需要打造一套大模型时代的原生工具链,助力企业更高效、简单地将大模型能力应用于生产、销售和服务等场景。
观察者网 摄
针对这些挑战,腾讯云正式发布三大AI引擎,助力企业在知识服务、图像和视频创作上提质提效。在当天的发布会上,腾讯还公布了混元大模型的最新进展,并宣布多个模型将开源。据悉,本月底,腾讯还将推出基于混元大模型打造的C端助手App"腾讯元宝"。
"5分钟打造一款知识服务应用",腾讯云发布三大AI大模型引擎
如何找准场景、快速部署,缩短从基础模型到产业应用的距离。这是一个各界长期探讨的问题。
过去一年来,各行各业对模型的需求在不断变化:大模型不仅仅要处理单纯的文字,还需要处理图片、视频等多种信息。大模型的能力竞争,已经从单一文生文,拓展到文生图、文生视频、图生图、图生视频等多模态能力的竞争;与此同时,在降本增效的大环境下,企业对"性价比"的要求也会更高。
降低使用门槛、提高平台适配性,就成为了国内大模型产业落地首当其冲的挑战。
吴运声认为,只有进一步降低工具使用门槛,减少对技术人才及专业技术能力依赖,让一线生产、经营人员也能"零门槛"用上大模型,才能加速生产经验与模型技术的融合,用技术为企业解决实际问题。未来,企业生产场景都将建基于AI能力,企业的产品设计、运营流程、管理形式都可能围绕AI重构。企业选择的大模型工具,既要能匹配、适应不断迭代的大模型技术,也需要满足不断扩大的场景需求,满足可持续的投入产出比。
吴运声补充道,生成式AI具有强大的归纳、生成、推理能力,但也面临全新的安全挑战。只有保障生成结果的安全、准确,才能满足企业对稳定性的需求,让企业管理者放心加大投入建设--为了更好地解决这些需求,腾讯云发布了三款PaaS产品--"大模型知识引擎"、"大模型图像创作引擎"和"大模型视频创作引擎"。
例如,在过去的客服等知识服务场景中,大模型应用往往受制于复杂文档解析难、复杂任务规划难,以及专属行业适配度不高。腾讯最新推出的大模型知识引擎,集成了腾讯混元大模型和行业大模型的优势,用户只需要输入模型选择、角色设定、知识库管理等基本信息,"三步5分钟"就可以搭建出一款知识应用,使用门槛大大降低。
从问答效果来看,知识引擎以RAG(检索增强生成)技术架构为基础, 整合了OCR文档解析、向量检索、大语言模型、多模态大模型等多项技术。用户上载专属知识库与行业专业文档后,模型会先通过向量数据库,生成大量问答。当用户提问时,系统先匹配相关文档片段,再由大模型基于提取内容来推理,这样会生成准确率远超通用大模型的回答。此外,知识引擎还支持图文混排、说明书、数据图标等复杂文档识别解析,大大提高用户体验。
此外,针对图像、视频素材等生成场景,腾讯推出了"图像创作引擎"、"视频创作引擎"两款大模型PaaS工具。图像创作引擎,基于腾讯混元的自研图像创作底层模型,具备领先的文生图、图生图能力,为企业客户提供AI写真、线稿生图等图像创作能力;"视频创作引擎",则基于多模态算法技术,实现视频转译、视频风格化、画布拓展等多种功能,助力企业客户快速、高性价比输出各类视频内容,用于不同群体、不同平台的广告投放。
"大模型的打造只是起点,把技术落地到产业场景,创造价值才是目标"。腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示,腾讯始终以"产业实用"作为发展大模型的核心战略,通过打造高性能的模型、高效率的工具平台、高敏捷的场景应用、高可用的算力基础设施,以及强安全的模型环境,构建"离产业最近的AI"。
混元大模型部分中文能力已追平GPT-4,腾讯还将推出助手类APP
除了大模型的产业落地,腾讯混元大模型的最新进展,也是当天峰会的一大焦点。
自2023年9月首次亮相以来,腾讯混元大模型不断探索最新技术,已拓展至万亿规模,并在国内率先采用混合专家模型(MoE)结构,这带来了模型总体性能的升级。腾讯集团副总裁蒋杰在峰会上表示,腾讯混元大模型经过持续迭代,目前整体性能居国内第一梯队,部分中文能力追平GPT-4。
此外,腾讯还研发了1B、3B、7B、13B等不同参数量下的Dense和MoE模型,围绕中小型模型进行了积极部署。资料显示,混元大模型提供万亿参数hunyuan-pro、千亿参数hunyuan-standard以及百亿参数的hunyuan-lite等多种尺寸的模型服务,其中hunyuan-standard模型具备256k的超长上下文理解能力,单次处理字符数超过38万个。
观察者网 摄
在多模态能力方面,混元大模型进展颇多。大会透露,在图片生成领域,腾讯混元文生图基础架构已全面升级至sora同款的DiT架构,支持中英文双语输入及理解,具备多轮绘图能力,测评结果国内领先;在视频生成领域,腾讯混元支持文生视频、图生视频、图文生视频、视频生视频等多种视频生成能力,视频生成长度可达16秒;在生3D层面,腾讯混元已布局文/图生3D,单图仅需30秒即可生成3D模型。
在大会上,蒋杰宣布腾讯混元大模型将坚定拥抱开源,为技术社区生态繁荣贡献力量。据了解,目前,腾讯混元文生图大模型已全面开源,开源3天内就在Github上获得超千位开发者关注。未来,多种尺寸的腾讯混元MoE模型也将对外开源,可分别支持手机端、PC端、云/数据中心等多样化的部署场景。
值得补充的是,在当天的峰会现场,腾讯还官宣了几则与产品"上新"有关的消息。
蒋杰宣布,腾讯混元将上线一站式AI智能体创作与分发平台"腾讯元器",开启智能体生态。在平台上,用户不仅可以在创建专属AI智能体,使用腾讯官方的插件和知识库,还能将这些智能体一键分发到QQ、微信客服、腾讯云上;此外,为更好地为用户提供服务,基于混元大模型打造的C端助手App"腾讯元宝",也将于5月30号发布。