登上CMMLU性能评测榜单第一 四大维度解码夸克自研大模型

电科技辛雯11-15 12:56

11月14日,拥有千亿参数的夸克自研大模型正式发布,立刻占据CMMLU榜单第一名。夸克大模型将应用于通用搜索、医疗健康、教育学习、职场办公等多个场景。性能方面,其整体水平已经超过GPT-3.5,其中在写作、考试等部分场景中可以超过GPT-4,成为国产大模型中名副其实的“学霸”。

图片1.png 

评测成绩显示,夸克大模型在发布后一举登顶CMMLU榜单,平均分达到77.08分,在社会科学和其他两个类别中分别斩获第一。在国内专业考试测试中,夸克大模型取得高考满分的成绩,还通过了临床执业医师资格考试。一系列优异成绩的背后,是夸克在大模型技术研发方面的战略定力与持续投入。经过多年发展,夸克积累的四方面优势,才是培养出这位“新学霸”的原动力。

首先,夸克大模型拥有的海量数据优势,基于智能化的搜索能力和自然语言处理技术,夸克拥有最完整的中文数据库,在每天数以亿计的信息处理后,能更好地理解、评估、提炼中文知识体系,了解不同用户对工作、学习、生活上的真实需求。这些搜索请求和大数据也组成了夸克大模型的第一层优势。

第二,夸克在教育、医疗、文档等垂直领域上的优势可以继续在大模型领域发挥作用。目前,夸克自建及拥有各类题库、知识点、医疗知识图谱、书籍及出版物等资料,沉淀了非常丰富的数据及用户场景,无论是考试资料还是硬核知识,夸克都构建了一套完整的知识内容体系,在大模型原生应用落地的过程中,将进一步提升用户效率。

第三,夸克通过技术能力可以更好地识别知识正确性。尤其在通用知识、图文知识、专业知识、推理知识、写作增强等方面,夸克建立了从内容、搜索再到推理的一套可辨别知识真伪的技术体系,让大模型提供的内容更具有准确性和专业性。

第四,就是夸克的平台优势。据悉,为了实现全栈自研的技术路线,夸克搭建数百人规模的独立产研团队,每天处理过亿级别的实时数据。同时,在搜索、教育医疗垂直业务,有行业团队会根据用户需求的变化,进行大模型的预训练与精调,以帮助用户解决生活中面临的实际问题。

在国内大模型赛道持续火爆的当下,夸克为什么能做出千亿级参数的自研大模型?夸克技术负责人表示,坚持自研大模型的研发路线是服务于夸克的业务战略,也是持续推动夸克App在产品体验创新和迈向新一代搜索的技术底座。 

作为近年来成长速度最快的互联网产品之一,夸克App在跨场景应用上引领行业风向。根据QuestMobile发布的《2023年轻人群智能效率应用研究》报告显示,夸克App在泛学生人群和新生代职场人群的用户占比最高,年轻用户使用时长位列行业第一。

去年底ChatGPT掀起新一轮人工智能热潮以来,业内就有观点认为,以搜索为代表的信息服务场景是大模型开发及应用的最佳平台。大模型产品仍在跑马圈地,夸克大模型依托四大优势,发布千亿级参数的大模型,或将开启AIGC信息服务新风向,更精准、高效地满足用户解决实际问题的需求。

 

电科技()是一家专注于全球TMT行业的领先资讯媒体。

作为今日头条青云计划、百家号百+计划获得者,2019百度数码年度作者、百家号科技领域最具人气作者、2019搜狗科技文化作者、2021百家号季度影响力创作者,曾荣获2013搜狐最佳行业媒体人、2015中国新媒体创业大赛北京赛季军、 2015年度光芒体验大奖、2015中国新媒体创业大赛总决赛季军、2018百度动态年度实力红人等诸多大奖。

投稿、商务合作请联络微信公众号

声明:本站原创文章文字版权归电科技所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表电科技立场,图文版权归原作者所有。如有侵权,请联系我们删除。

//59087780b049bbb54ef4ba547ea51910