阿里云推出企业级大模型RAG解决方案,“最强外挂”可大幅提升语言模型表现

电科技辛雯01-31 16:19

1月30日,在国际 AI 大数据峰会上,阿里云推出了备受业界关注的企业级大模型检索增强生成(RAG)解决方案,可以给大模型装上“最强知识外挂”,企业仅需几次点击即可连接PB级规模数据,让大模型成为洞悉行业和企业知识的专家,大幅提升回答表现。 

“检索增强生成”简称RAG(Retrieval-augmented Generation),是当下最热门的大模型前沿技术之一。如果将“微调(finetune)”理解成大模型内化吸收知识的过程,那么RAG就相当于给大模型装上了“知识外挂”,基础大模型不用再训练即可随时调用特定领域知识。

阿里云副总裁、计算平台事业部负责人汪军华介绍,通过RAG技术,大语言模型在回答问题时,可以从企业知识库中检索最新的相关信息来生成内容,从而提高回答的准确性、关联性和新鲜度,并解决幻觉问题。同时,RAG技术外挂的私有数据不参与大模型训练,保证了企业的数据安全。

图片4.png

RAG技术显著提升了大模型表现,并减少了企业开发时间,但因涉及数据检索、信息增强、AI生成等过程,工程复杂度很高。阿里云本次推出的一站式企业级大模型检索增强生成RAG解决方案,将极大降低用户自主搭建专属企业RAG的门槛和成本。

图片5.png

阿里云魔搭社区提供近3000个高性能模型,用户可在魔搭上下载基础大模型进行快速开发。同时,阿里云RAG解决方案可调用阿里云上的云产品和向量引擎,用户可快速将基础模型与PB级数据源连接,打造专属的智能问答系统。

在检索环节,阿里云大数据引擎可提供超低时延、超高并发的海量检索计算,并按需匹配集群资源,节省10%-30%计算成本。在模型服务环节,PAI-EAS推理平台一站式提供模型部署及推理加速的全链路服务,新发布的serverless计价模式更可将用户使用成本降低50%

可将非结构化的文本及多模态数据转化为精准矢量数据的向量技术,也是RAG解决方案的关键能力,很大程度决定了RAG检索精度和效率。汪军华介绍,阿里云RAG解决方案配备了丰富的向量化工具,可自动进行矢量转换和检索。同时,除向量检索外,阿里云还提供全文检索和外部搜索api等多种检索增强方式。 

据了解,RAG技术在开放域回答、对话系统、文本生成、搜索增强、LLM交互式应用等领域应用前景广阔。海外知名消费健康公司赫力昂(Haleon)已与阿里云达成合作,利用阿里云研发的通义千问大模型及RAG技术为中国消费者打造了一款“AI营养师”产品。结合赫力昂内部沉淀的营养知识库,该产品可以准确理解用户提问,并给出个性化的营养建议。

近一年多来,在“AI驱动”新战略下,阿里云所有计算产品正面向AI需求升级,让企业和开发者“做AI、用AI,就上阿里云”。阿里云目前已在IaaS+PaaS层形成完善的AI基础设施,通义、百川智能、智谱AI、零一万物、昆仑万维等国内一半大模型公司跑在阿里云上。同时,阿里云作为MaaS理念提出者,打造了丰富的模型服务,魔搭是国内规模最大的AI模型社区,通义千问实现全尺寸、全模态开源。

 

电科技()是一家专注于全球TMT行业的领先资讯媒体。

作为今日头条青云计划、百家号百+计划获得者,2019百度数码年度作者、百家号科技领域最具人气作者、2019搜狗科技文化作者、2021百家号季度影响力创作者,曾荣获2013搜狐最佳行业媒体人、2015中国新媒体创业大赛北京赛季军、 2015年度光芒体验大奖、2015中国新媒体创业大赛总决赛季军、2018百度动态年度实力红人等诸多大奖。

投稿、商务合作请联络微信公众号

声明:本站原创文章文字版权归电科技所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表电科技立场,图文版权归原作者所有。如有侵权,请联系我们删除。

//59087780b049bbb54ef4ba547ea51910