腾讯,深夜放大招!腾讯发布自研混元T1正式版

admin2周前教育8

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

腾讯,深夜放大招!腾讯发布自研混元T1正式版

  【导读】腾讯混元T1正式版发布:创新混合Mamba架构,能秒回、吐字快、擅长超长文推理

  中国基金报 记者 张燕北

  腾讯最近在大模型领域动作频频。

  继2月底推出新一代快思考模型混元Turbo S后,3月21日深夜,腾讯宣布推出自研深度思考模型混元T1正式版,并同步在腾讯云官网上线。

  腾讯发布自研混元T1正式版

  腾讯混元T1正式版如期发布。

  之所以称之为“如期发布”,是因为前不久腾讯混元自研的快思考模型混元Turbo S正式发布时,腾讯就曾表示,正式版的腾讯混元T1模型API也将很快上线,对外提供接入服务。

  据知情人士介绍,腾讯混元T1正式版以混元Turbo S为基座打造,亮点在于其是能够秒回、吐字快、擅长超长文处理的强推理模型,性能保持业界领先。

  “混元T1正式版沿用了混元Turbo S的创新架构,采用Hybrid-Mamba-Transformer融合模式。这是工业界首次将混合Mamba架构无损应用于超大型推理模型。”上述知情人士说,这一架构显著降低了训练和推理成本,让混元T1实现首字秒出,吐字速度达到最快80 tokens/s。

  混元T1在超长文本推理领域也展现出独特优势,能够有效解决长文推理中常见的上下文丢失和长距离信息依赖问题。同时,混合Mamba架构针对长序列处理进行了专项优化,提升了解码速度。

  通过大规模强化学习,并结合数学、逻辑推理、科学和代码等理科难题的专项优化,混元T1正式版进一步提升了推理能力。与此前已上线腾讯元宝的混元T1-preview模型相比,综合效果明显提升。

  腾讯方面提供的数据显示,在体现推理模型基础能力的常见Benchmark上,以及在中英文知识及竞赛级数学、逻辑推理的公开基准测试中,混元T1的成绩也达到业界领先推理模型的水平。此外,T1还在多项对齐任务、指令跟随任务和工具利用任务中展现出了非常强的适应性。

  值得一提的是,目前,混元T1已在腾讯云官网上线。定价方面,输入价格为每百万tokens 1元,输出价格为每百万tokens 4元。

  腾讯混元大模型持续快速迭代

  今年以来,腾讯混元大模型持续快速迭代,AI似乎已成为腾讯内部最大的驱动力。

  其推出了深度思考模型T1 Preview和快思考模型Turbo S,并已广泛应用于腾讯元宝、ima、腾讯文档、微信读书、搜狗输入法、QQ浏览器等多款内部产品。腾讯混元积极拥抱开源,其开源模型全面覆盖文本、图像、视频和3D生成等多个模态。

  业内认为,这一战略选择的背后,一方面基于腾讯长期以来坚持技术普惠的理念,另一方面也得益于腾讯在用户与产业多端的场景与生态优势,为AI技术的落地提供了广阔空间。

  在日前公布的2024年财报中,腾讯年研发投入707亿元创下纪录。对于业务侧,AI技术对微信新芽业务的提振效应,推动了腾讯营销服务板块的快速增长。其2024年第四季度在AI领域的资本开支超390亿元,2025年将持续加码,AI战略已进入重投入期。

  腾讯董事会主席兼首席执行官马化腾表示,“受益于AI赋能的广告平台升级、视频号用户参与度提升以及长青游戏的增长,我们2024年第4季取得双位数的收入增长,并持续提升运营效率。数月前,我们重组了AI团队以聚焦于快速的产品创新及深度的模型研发,增加了AI相关的资本开支,并加大了我们对原生AI产品的研发和营销力度。”他表示。

  巨头竞逐AI

  我国AIGC应用或已进入加速期

  随着2025年我国进入科技突破大年,各大互联网巨头持续加大AI领域的投入。

  近期,字节跳动豆包大模型团队官宣开源一项针对MoE(混合专家模型)架构的关键优化技术,可将大模型训练效率提升1.7倍,成本节省40%。

  据悉,该技术叫COMET,已实际应用于字节的万卡集群训练,累计帮助节省了数百万 GPU 小时训练算力。

  阿里巴巴近日宣布推出AI旗舰应用——新夸克,将“深度思考”能力融入AI搜索。据介绍,用户在“AI超级框”中输入指令后,夸克智能中枢可以自动识别意图,规划梳理后调动各种不同模型和智能体(Agent)模块,帮助用户完成任务。

  百度日前连发两款免费新模型,分别是文心大模型4.5和文心大模型X1。据百度相关负责人介绍,文心大模型4.5在多模态理解能力方面显著提升。文心大模型X1为深度思考模型,在性能上对标DeepSeek-R1,具备“长思维链”,擅长中文知识问答、文学创作、逻辑推理等,而且大幅降低推理成本。

  值得关注的是,国产大模型开源步伐持续加速。阿里巴巴在基础模型和原生应用方面持续发力,近期相继发布了Qwen2.5-VL、Qwen2.5-Max、通义万相2.1、千问QWQ-32B等性能领先的开源模型。百度方面则表示,将在6月30日正式将文心大模型开源,并在今年下半年发布文心大模型5.0。

  业内分析认为,在技术创新与商业应用的双轮驱动下,AI有望在互联网等数字原生领域率先形成规模化落地。

  华富人工智能ETF基金经理郜哲表示,结合腾讯财报和近期互联网巨头竞逐AI的情况来看,我国AIGC应用或已进入加速期。随着AI在各行业深入渗透,有望诞生更多AI创新模式与高质量产品,进一步推动人工智能产业链向更加现实、业绩可落地的方向发展。

本站非盈利性质,内容来源于互联网。

相关文章

“All in”机器人的基金经理,两月收益近70%!科技股下周还能涨吗?

“All in”机器人的基金经理,两月收益近70%!科技股下周还能涨吗?

登录新浪财经APP 搜索【信披】查看更多考评等级   每经记者 肖芮冬    每经编辑 赵云       刚过去的交易周(2.17~2.21),在A股震荡走强的同时,科技线也进一步确立了主线地位。...

液冷服务器概念演绎涨停潮:挖掘潜力概念股

液冷服务器概念演绎涨停潮:挖掘潜力概念股

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   来源:财富投资网   摘要:本周五AI算力基建产业链全线大爆发,领涨主线液冷服务器概念股上演疯狂涨停潮,相关上市公司迎...

卖翻新婴儿拉拉裤公司回应:不方便回应,有问题找负责此业务的人

专题:共筑满意消费——聚焦2025 “315晚会” 被各种商家营销套路侵害权益?买到的商品出故障投诉无门? 黑猫投诉平台全天候帮您解决消费难题【消费遇纠纷,就上黑猫投诉】   来源:九派新闻   【#...

:开雷诺车一般是什么人-叶国富领衔的改革领导小组遭遇反对票,永辉张氏兄弟或存分歧

:开雷诺车一般是什么人-叶国富领衔的改革领导小组遭遇反对票,永辉张氏兄弟或存分歧

3月17日晚间,永辉超市(601933.SH)发布第六届董事会第一次会议决议公告。公告显示,经全体董事审议和表决,同意拟选举张轩松为公司第六届董事会董事长。本次董事会暂未聘任公司CEO,虚位以待,将...

中办、国办:在房地产市场、互联网、人力资源市场、能源中长期合同领域增设严重失信主体名单

  中共中央办公厅、国务院办公厅发布《关于健全社会信用体系的意见》。其中提出,依法依规开展失信惩戒。规范设定失信惩戒措施,依法依规合理确定惩戒范围和力度。设定失信惩戒措施、确定严重失信主体名单的设列领...

股海导航 3月21日沪深股市公告与交易提示

专题:交易提示   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   【热点】   百亚股份:公司未曾参与315报道中所述违规业务。   稳健医疗:公司未参与315晚会报道...