分类分类
关注+2025-01-30作者:不详
昨晚,杭州大模型又双叒不睡,给大伙儿 拜 年 啦~
就在春晚直播进行时,阿里通义Qwen发布新春节礼第三弹:
Qwen2.5-Max来袭,多个基准测试中超越当红炸子鸡DeepSeek V3。
fmt=png&from=appmsg" data-type="png" data-w="1080" data-original-="" data-index="1" src="https://pic.chinaz.com/2025/0130/2025013010335990450.jpg" _width="677px" alt="图片" data-fail="0" style="margin: 0px auto; padding: 0px; box-sizing: border-box; outline: 0px; border: 1px solid rgb(238, 238, 238); --tw-shadow: 0 0 #0000; --tw-ring-inset: var(--tw-empty, ); --tw-ring-offset-width: 0px; --tw-ring-offset-color: #fff; --tw-ring-color: rgba(41, 110, 228, 0.5); --tw-ring-offset-shadow: 0 0 #0000; --tw-ring-shadow: 0 0 #0000; max-width: 700px; background: url("../img/bglogo2.svg") center center no-repeat rgb(247, 248, 249); box-shadow: rgba(27, 95, 160, 0.1) 0px 1px 3px; display: inline-block;"/>
Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond等基准统统拿下,Qwen2.5-Max整体表现优于DeepSeek V3、Llama-3.1-405B以及闭源模型GPT-4o,和Claude-3.5-Sonnet也能比一比。
FMt=png&from=appmsg" data-type="png" data-w="1080" data-original-="" data-index="2" src="https://pic.chinaz.com/2025/0130/2025013010335990451.jpg" _width="677px" alt="图片" data-fail="0" style="margin: 0px auto; padding: 0px; box-sizing: border-box; outline: 0px; border: 1px solid rgb(238, 238, 238); --tw-shadow: 0 0 #0000; --tw-ring-inset: var(--tw-empty, ); --tw-ring-offset-width: 0px; --tw-ring-offset-color: #fff; --tw-ring-color: rgba(41, 110, 228, 0.5); --tw-ring-offset-shadow: 0 0 #0000; --tw-ring-shadow: 0 0 #0000; max-width: 700px; background: url("../img/bglogo2.svg") center center no-repeat rgb(247, 248, 249); box-shadow: rgba(27, 95, 160, 0.1) 0px 1px 3px; display: inline-block;"/>
基座模型对比中,Qwen2.5-Max同样超越DeepSeek V3、Llama-3.1-405B,在针对模型知识理解和推理能力的MMLU-Pro等基准上均表现不凡。
更令AI社区关注的是,Qwen2.5-Max同DeepSeek V3一样是超大规模的MoE模型,经超20万亿token的预训练数据及精心设计SFT+RLHF后训练方案训练而成。
Qwen2.5-Max这份春节礼包被网友们齐刷刷收入囊中。前有DeepSeek,还有阿里通义Qwen,网友们不忘艾特奥特曼:
emoji", "Segoe UI Emoji", "Segoe UI Symbol", "Noto Color Emoji"; font-size: 16px; text-wrap-mode: wrap;">祝大家新年快乐,特别祝Sam。
阿里研究员在模型发布后也都还不睡,纷纷当起了自个儿的自来水。
阿里高级算法专家林俊旸开麦:
Qwen2.5-Max在基准测试中表现良好,希望大家可以试试看,新年快乐!
之前曾自曝阿里大模型员工996作息表的Binyuan Hui也再次现身:
外面的烟花照亮了天空,我却坐在电脑跟前。
下面是Qwen2.5-Max在四个使用场景上的演示。
首先是联网搜索功能,输出的每句话来源出处都有标注,整体运行也很丝滑。
代码能力上,Qwen2.5-Max能够帮助用户完成各种可视化创作,一句话就能做出下面这样旋转的球体:
有网友改造了一下,让球体内部有三个弹跳的黄色小球。
结果只尝试了一次就成功了,而且三个小球始终在大球内部运动,能正确处理碰撞:
Qwen2.5-Max也有Artifacts功能,同样一句话,能开发各种小应用、小游戏。
比如制作一个扫雷小游戏,秒秒钟“啪”一下直接就能玩:
另外Qwen2.5-Max数单词中的特定字母数量也不在话下。
现在,Qwen2.5-Max已在Qwen Chat中上线。
此外也有Hugging Face的Demo可玩,还上线了Any Chat,并且可通过阿里云服务使用API。
感兴趣的童鞋赶紧试试吧~
相关文章
更多+相同厂商
热门推荐
点击查看更多
点击查看更多
点击查看更多
说两句网友评论