:凯迪拉克ct5多少钱-阿里凌晨开源新模型:性能对标DeepSeek-R1,参数仅为其1/20

admin4天前商业3

3月6日凌晨3点,阿里巴巴发布并开源全新的推理模型通义千问QwQ-32B。阿里巴巴称,这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美,但二者在参数量上相差将近20倍。

据悉,QwQ-32B 在一系列基准测试中进行了评估,测试了数学推理、编程能力和通用能力,并与OpenAI的o1-mini以及DeepSeek满血版及蒸馏版进行了比较。

在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench 中,千问 QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1蒸馏模型。

在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜”LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek- R1。

官方介绍称,这一成果突显了将强化学习应用于经过大规模预训练的强大基础模型的有效性。此外,阿里团队还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。

除了性能上的大幅提升,QwQ-32B的另外一个亮点是大幅降低了部署使用成本,开发者和企业可以在消费级硬件上轻松将其部署到本地设备中。

资料显示,从2023年至今,阿里通义团队已开源200多款模型,包含大语言模型千问Qwen及视觉生成模型万相Wan等两大基模系列,覆盖从0.5B到110B等参数,实现了全模态、全尺寸大模型的开源。

开源社区Hugging Face此前的榜单显示,开源仅6天的阿里万相大模型已反超DeepSeek-R1,登顶模型热榜、模型空间榜两大榜单,成为近期全球开源社区最受欢迎的大模型。根据最新数据,万相2.1(Wan2.1)在Hugging Face及魔搭社区的总下载量已超百万,在Github的Star数超6k。

在通义千问最新推理模型发布并开源后,阿里巴巴股价应声大涨。隔夜美股收盘涨8.61%,报收141.03美元。截至发稿,阿里巴巴港股涨超7%。今年以来,阿里巴巴股价累计涨幅已近70%。

本站非盈利性质,内容来源于互联网。

相关文章

全国人大代表、格力电器董事长董明珠现身人大广东团驻地

3月3日,全国人大代表、格力电器董事长董明珠现身人大广东团驻地,并对记者表示今年关注网络建设问题。董明珠说,时代逐步向数字化方向发展,AI对我们来说非常重要。...

:10万元左右新能源纯电动汽车-法国医生25年间性侵299名病人,多数受害者当时是儿童

:10万元左右新能源纯电动汽车-法国医生25年间性侵299名病人,多数受害者当时是儿童

据法国当地媒体报道,当地时间2月24日,法国西部城市瓦讷的刑事法庭于迎来一场震动全国的审判,今年74岁的退休外科医生斯科阿涅克(Joël Le Scouarnec)被控在25年间对299名患者实施性...

分摊递延收益的计算方法应如何完善?这种完善方式有哪些作用?

分摊递延收益的计算方法应如何完善?这种完善方式有哪些作用?

在财经领域中,分摊递延收益的计算方法至关重要,其完善不仅能够提高财务数据的准确性,还对企业的决策和运营产生深远影响。首先,我们来了解一下当前常见的分摊递延收益计算方法及其存在的问题。通常,分摊递延收益...

:奥迪a7图片大全-中国证券行业早期重要开拓者之一、原华夏证券董事长邵淳逝世

:奥迪a7图片大全-中国证券行业早期重要开拓者之一、原华夏证券董事长邵淳逝世

界面新闻记者 | 陈靖 3月7日,原华夏证券董事长邵淳去世的消息在证券业内流传,其中央财经大学校友、在其手下任职过的金融机构高管纷纷发文追悼。 公开资料显示,邵淳出生于1944年12月2...

特朗普政府不确定性升温 美国银行客户交易活动放缓

  美国银行看到自年初以来投资者活动放缓,因客户对美国总统唐纳德·特朗普政府所采取行动的走向越来越不确定。   该公司全球市场部门负责人Jim DeMare警告称,随着市场试图评估新政府的初步行动、尤...

:大众桑塔纳最新款报价及图片-深入推进党风廉政建设和反腐败斗争,以全面从严治党新成效为推进中国式现代化提供坚强保障——在中国共产党第二十届中央纪律检查委员会第四次全体会议上的工作报告

深入推进党风廉政建设和反腐败斗争以全面从严治党新成效为推进中国式现代化提供坚强保障——在中国共产党第二十届中央纪律检查委员会第四次全体会议上的工作报告(2025年1月6日)李希我代表二十届中央纪律检查...