推广 热搜: 公司  快速  上海  中国  企业    未来  政策  系统  公司2 

【华鑫计算机|行业周报】百度举办百度世界大会,通义千问开源Qwen2.5-Coder 全系列

   日期:2024-11-26     作者:xinet    caijiyuan   评论:0    移动:http://www78564.xrbh.cn/mobile/news/28082.html
核心提示:(来源:华鑫研究)▌AI应用1:百度举办百度世界大会,亮相四款产品新形态11月12日上午,百度世界大会如期举办,李彦宏在现场发

(来源:华鑫研究)

【华鑫计算机|行业周报】百度举办百度世界大会,通义千问开源Qwen2.5-Coder 全系列

▌AI应用1:百度举办百度世界大会,亮相四款产品新形态

11月12日上午,百度世界大会如期举办,李彦宏在现场发布了基于百度文心大模型的100大产业应用,涵盖了制造、能源、交通、政务、金融、汽车、教育、互联网等众多行业。会上,百度重点推出了四款产品新形态:

1) 检索增强的文生图技术iRAG。其将百度搜索的亿级图片资源跟强大的基础模型能力相结合,可以生成各种超真实的图片,整体效果远远超过文生图原生系统,去掉了机器味。该技术由百度多模态可控生图大模型支撑,通过多模态注意力机制、图文交错编码等技术结合扩散模型,提升了整体注意力计算的高精确性,让检索增强的文生图过程可以自动分析、理解、规划和泛化。

2) 无代码工具“秒哒”。秒哒具备无代码编程、多智能体协作和多工具调用三大特性,李彦宏对其寄予了厚望,称之为“迄今为止人类历史上最复杂的多智能体协作工具”。作为一个不需要写代码就能够实现任意想法的工具,秒哒让每个人都具备程序员的能力,会说话就能做出应用。

3) “自由画布”。该产品由百度文库和百度网盘联合开发,让用户可以在一块类似“画布”的界面上自由拖拽文档、音视频等富媒体素材,迅速生成多模态内容。自由画布是一个由文心多模态大模型加持的万能白板,可以帮助用户完成从找资料,到编辑、生成和分享的全部任务。

4) 百度首款AI眼镜。作为全球首款搭载中文大模型的原生AI眼镜,实现了佩戴舒适性与功能全面性的融合。李莹表示,AI眼镜作为人类的第一视角设备,其捕捉视觉、声音、位置等信息的能力,将给人们带来前所未有的感官延伸,也一定会成为更高效、便捷的人机交互入口,带给人们全新的视角和更细致的感受,重新定义人与世界的互动方式。

▌AI应用2:通义千问开源Qwen2.5-Coder 全系列,致力于推动 Open Code LLMs 发展

阿里云通义大模型团队正式开源通义千问代码模型全系列,共6款Qwen2.5-Coder模型。其中32B尺寸的旗舰代码模型在十余项基准评测中均取得开源最佳成绩,成为全球最强开源代码模型,在多项关键能力上超越闭源模型GPT-4o。

"Qwen2.5-Coder基于Qwen2.5基础大模型进行初始化,是“强大”、“多样”、“实用”的开源模型。该系列模型使用源代码、文本代码混合数据、合成数据等5.5T tokens的数据持续训练,实现了代码生成、代码推理、代码修复等核心任务性能的显著提升。

1)强大:Qwen2.5-Coder-32B-Instruct 成为目前 SOTA 的开源代码模型,代码能力追平 GPT-4o,展现出强大且全面的代码能力,同时具备良好的通用和数学能力。

2)多样:此前开源了 1.5B、7B 两个尺寸,本次开源又带来 0.5B、3B、14B、32B 四个尺寸,截至目前, Qwen2.5-Coder 已经覆盖了主流的六个模型尺寸,以满足不同开发者的需要。

3)实用:探索了 Qwen2.5-Coder 在代码助手和 Artifacts 两种场景下的实用性,并用一些样例来展示 Qwen2.5-Coder 在实际场景中的应用潜力。

这次Qwen2.5-Coder上新,开源0.5B/1.5B/3B/7B/14B/32B共6个尺寸的全系列模型,每种尺寸都取得同规模下SOTA。而且大部分版本都是采用非常宽松的Apache 2.0许可。每个尺寸都开源了base 和 Instruct 模型。其中,base模型可供开发者微调,Instruct模型则是开箱即用的官方对齐模型,所有Qwen2.5-Coder模型在同等尺寸下均取得了模型效果最佳(SOTA)表现。

截至目前,Qwen2.5已开源100多个大语言模型、多模态模型、数学模型和代码模型,几乎所有模型都实现了同等尺寸下的最佳性能。全球基于Qwen系列二次开发的衍生模型数量9月底突破7.43万,超越Llama系列衍生模型的7.28万,通义千问已成为全球最大的生成式语言模型族群。

▌AI融资动向:星海图/点莘技术分别获2亿元/近亿元人民币融资

本期AI初创公司的融资中,星海图/点莘技术融资额排名前二,分别获2亿元/近亿元人民币融资。星海图创始人兼CEO高继扬及其联合创始人团队均拥有深厚的学术背景及丰富的行业经验,为公司的快速发展奠定了坚实基础。星海图专注于“智能定义本体”和“一脑多形”的发展思路,致力于打造功能多样、智能化程度高的。这些机器人不仅具备视觉、听觉等感知能力,还能够在动态环境中灵活应对复杂任务,显示出其在具身智能领域的技术优势。其中,矢量控制底盘X1和准直驱电机超轻型机械臂产品A1的推出,为现代智能制造提供了可靠的硬件支持。此外,他们全尺寸轮足双臂仿人形机器人R1的设计,展示了对机器人多样性和适应性的全新理解。这些技术进步不仅为工业应用提供了新的选择,也为其他场景的智能化打下了基础。点莘技术是一家半导体行业AI工程化解决方案提供商,致力于chiplet 及 microLED显示的二维、三维尺寸量测及缺陷检测,用人工智能、先进光学、精密机械以及系统工程,为客户提供良率监测设备及管理算法,通过AI量检测助力先进封装良率提升。点莘技术融合精密光机系统、图像处理及 AI 算法、高性能计算等先进技术要素,开发了MicroLED 新型显示及Chiplet 先进封装量测设备。基于对MicroLED 巨量转移新兴工艺的前瞻性理解,点莘技术率先开发的无基准位置度量测检测设备,已经服务于市场主流MicroLED客户。基于对 Chiplet 先进封装技术路线的理解,点莘技术开发了面向 fine RDL 及 micro bump 2D/3D 量测检测设备,量测精度达到行业领先水平。

▌投资建议

AI Agent迎来密集催化,AI现象级应用有望出现。海外方面,微软开源了AI工具OmniParser,专为解析和识别屏幕上可交互图标的AI工具,可帮助用户创建个性化智能体;OpenAI内部或已具备AI智能体雏形,能够操控计算机完成在线订餐、自动查询解决编程难题等任务,有望在明年1月首次向公众亮相Agent雏形;谷歌有望于今年12月发布基于Gemini2.0的AI Agent Javis。国内方面,华为诺亚方舟实验室和伦敦大学学院汪军团队提出了一个手机控制架构:Lightweight Multi-modal App Control,即轻量级多模态应用控制,简称 LiMAC,可基于手机屏幕的 UI 元素等视觉信息来实现AI 操控手机;荣耀正式推出了 MagicOS 9,通过 AI 智能体开启了“自动驾驶”手机的新模式;智谱发布端侧AutoGLM展现手机端Agent场景。综上所述,AI Agent的爆发不仅仅是技术层面的进步,更是产业变革的信号,有望掀开AI现象级应用出现的序幕。

建议关注以AI为核心的龙头厂商(002230.SZ)、有望迎来需求爆发的AI应用(603918.SH)、高速通信连接器业务或显著受益于 GB200 放量的(688668.SH)。

▌ 风险提示

 1)AI 底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI 应用落地效果不及预期。4)推荐公司业绩不及预期风险。

【华鑫计算机|行业周报】百度举办百度世界大会,通义千问开源Qwen2.5-Coder 全系列

算力动态:算力租赁价格平稳

1.1

数据跟踪:算力租赁价格平稳

本周恒源云13核+128G价格环比上周持平。具体来看,显卡配置为A100-40G中,腾讯云16核+96G价格为28.64元/时,阿里云12核+94GiB价格为31.58元/时;显卡配置为A100-80G中,恒源云13核+128G价格为8.50元/时;阿里云16核+125GiB价格为34.74元/时;显卡配置为A800-80G中,恒源云16+256G价格为9.00元/时。

【华鑫计算机|行业周报】百度举办百度世界大会,通义千问开源Qwen2.5-Coder 全系列

AI应用动态:文心一言搜索访问量环比+4.80%,百度举办百度世界大会

2.1

流量跟踪:文心一言搜索访问量环比+4.80% 

本期(2024.11.11-2024.11.15)AI相关网站流量数据:访问量前三位分别为ChatGPT(892.9M)、Bing(422.1M)和Canva(186.0M);访问量环比增速前三位分别为文心一言(4.80%)、Canva(3.62%)和Deepl(2.57%);平均停留时长前三位分别为Character.AI(00:12:50)、Discord(00:12:28)和Deepl(00:08:57);平均停留时长环比增速前三位分别为Character.AI(0.92%)、Kimi(0.51%)和Gemini(0.35%)。

【华鑫计算机|行业周报】百度举办百度世界大会,通义千问开源Qwen2.5-Coder 全系列

2.2

产业动态1:百度举办百度世界大会,亮相四款产品

新形态

11月12日上午,百度世界大会如期举办,李彦宏在现场发布了基于百度文心大模型的100大产业应用,涵盖了制造、能源、交通、政务、金融、汽车、教育、互联网等众多行业。会上,百度重点推出了四款产品新形态:

1) 检索增强的文生图技术iRAG。其将百度搜索的亿级图片资源跟强大的基础模型能力相结合,可以生成各种超真实的图片,整体效果远远超过文生图原生系统,去掉了机器味。该技术由百度多模态可控生图大模型支撑,通过多模态注意力机制、图文交错编码等技术结合扩散模型,提升了整体注意力计算的高精确性,让检索增强的文生图过程可以自动分析、理解、规划和泛化。

2) 无代码工具“秒哒”。秒哒具备无代码编程、多智能体协作和多工具调用三大特性,李彦宏对其寄予了厚望,称之为“迄今为止人类历史上最复杂的多智能体协作工具”。作为一个不需要写代码就能够实现任意想法的工具,秒哒让每个人都具备程序员的能力,会说话就能做出应用。

3) “自由画布”。该产品由百度文库和百度网盘联合开发,让用户可以在一块类似“画布”的界面上自由拖拽文档、音视频等富媒体素材,迅速生成多模态内容。自由画布是一个由文心多模态大模型加持的万能白板,可以帮助用户完成从找资料,到编辑、生成和分享的全部任务。

4) 百度首款AI眼镜。作为全球首款搭载中文大模型的原生AI眼镜,实现了佩戴舒适性与功能全面性的融合。李莹表示,AI眼镜作为人类的第一视角设备,其捕捉视觉、声音、位置等信息的能力,将给人们带来前所未有的感官延伸,也一定会成为更高效、便捷的人机交互入口,带给人们全新的视角和更细致的感受,重新定义人与世界的互动方式。

【华鑫计算机|行业周报】百度举办百度世界大会,通义千问开源Qwen2.5-Coder 全系列

2.3

产业动态2:通义千问开源Qwen2.5-Coder 全系列,致

力于推动 Open Code LLMs 发展

阿里云通义大模型团队正式开源通义千问代码模型全系列,共6款Qwen2.5-Coder模型。其中32B尺寸的旗舰代码模型在十余项基准评测中均取得开源最佳成绩,成为全球最强开源代码模型,在多项关键能力上超越闭源模型GPT-4o。

Qwen2.5-Coder基于Qwen2.5基础大模型进行初始化,是“强大”、“多样”、“实用”的开源模型。该系列模型使用源代码、文本代码混合数据、合成数据等5.5T tokens的数据持续训练,实现了代码生成、代码推理、代码修复等核心任务性能的显著提升。

1)强大:Qwen2.5-Coder-32B-Instruct 成为目前 SOTA 的开源代码模型,代码能力追平 GPT-4o,展现出强大且全面的代码能力,同时具备良好的通用和数学能力。

2)多样:此前开源了 1.5B、7B 两个尺寸,本次开源又带来 0.5B、3B、14B、32B 四个尺寸,截至目前, Qwen2.5-Coder 已经覆盖了主流的六个模型尺寸,以满足不同开发者的需要。

3)实用:探索了 Qwen2.5-Coder 在代码助手和 Artifacts 两种场景下的实用性,并用一些样例来展示 Qwen2.5-Coder 在实际场景中的应用潜力。

这次Qwen2.5-Coder上新,共开源0.5B/1.5B/3B/7B/14B/32B共6个尺寸的全系列模型,每种尺寸都取得同规模下SOTA。而且大部分版本都是采用非常宽松的Apache 2.0许可。

【华鑫计算机|行业周报】百度举办百度世界大会,通义千问开源Qwen2.5-Coder 全系列

每个尺寸都开源了base 和 Instruct 模型。base模型可供开发者微调,Instruct模型则是开箱即用的官方对齐模型,所有Qwen2.5-Coder模型在同等尺寸下均取得了模型效果最佳(SOTA)表现。其中,Qwen2.5-Coder-32B-Instruct是本次开源的旗舰模型。在编程大模型主要关注的5个方面上,它都实现了对GPT-4o的超越:

1)代码生成能力。Qwen2.5-Coder-32B-Instruct在多个流行的代码生成基准上都取得了开源SOTA。而且在Humaneval、Mceval、Spider、evalPlus、BigCodeBench等基准上,都超越了闭源的GPT-4o和Claude 3.5 Sonnet。

【华鑫计算机|行业周报】百度举办百度世界大会,通义千问开源Qwen2.5-Coder 全系列

2)代码修复能力。在主流基准Aider上,Qwen2.5-Coder-32B-Instruct略胜GPT-4o。

3)代码推理能力。在CRUXeval基准上,32B版本较7B版本有了明显提升,甚至达到了和GPT-4o、Claude 3 Opus相当的水平。

【华鑫计算机|行业周报】百度举办百度世界大会,通义千问开源Qwen2.5-Coder 全系列

4)对多编程语言的掌握能力。Qwen2.5-Coder支持92种编程语言。Qwen2.5-Coder-32B-Instruct在其中40多种语言上表现出色。在Haskell、Racket等语言上表现格外突出,打败4o等闭源模型同时取得了超高分数。通过在预训练阶段进行独特数据清洗和配比,它在Mceval上取得65.9分。多编程语言的代码修复基准Mdeval。同样表现突出,取得75.2分,位列所有开源模型第一。

5)人类偏好上的对齐表现。通义千问团队还构建了一个来自内部标注的代码偏好评估基准Code Arena,可以理解为编程大模型竞技场。这一部分,Qwen2.5-Coder-32B-Instruct和闭源模型正面PK,通过让两个模型在同样问题下PK,计算最终胜负比,以此来评判模型表现。实验结果显示,Claude 3.5 Sonnet战绩最好,Qwen2.5-Coder-32B-Instruct和GPT-4o水平相当,胜率为68.9%。

【华鑫计算机|行业周报】百度举办百度世界大会,通义千问开源Qwen2.5-Coder 全系列

总的来看,Qwen2.5-Coder-32B-Instruct是开源最佳,并且真正拉平甚至部分超出了有最强代码能力的闭源模型。在实际应用上,通义千问团队演示了基于Qwen2.5-Coder打造的智能代码助手,并上线了一个Artifacts应用。目前智能代码助手领域主要以闭源模型为主,Qwen2.5-Coder为开发者提供了开源选择。它在几个可以评估模型辅助编程的基准上(CrossCodeeval、CrossCodeeval、CrossCodeLongeval、Repoeval、SAFIM)都取得了SOTA。

Qwen2.5-Coder全系列开源,可适配更多应用场景,无论在端侧还是云上,都可以让AI大模型更好地协助开发者完成编程开发,即便是编程“小白”,也可基于内置Qwen2.5-Coder的代码助手和可视化工具,用自然语言对话生成网站、数据图表、简历和游戏等各类应用。

截至目前,Qwen2.5已开源100多个大语言模型、多模态模型、数学模型和代码模型,几乎所有模型都实现了同等尺寸下的最佳性能。全球基于Qwen系列二次开发的衍生模型数量9月底突破7.43万,超越Llama系列衍生模型的7.28万,通义千问已成为全球最大的生成式语言模型族群。

AI融资动向:星海图/点莘技术分别获2亿元/近亿元人民币融资

本期AI初创公司的融资中,星海图/点莘技术融资额排名前二,分别获2亿元/近亿元人民币融资。星海图创始人兼CEO高继扬及其联合创始人团队均拥有深厚的学术背景及丰富的行业经验,为公司的快速发展奠定了坚实基础。星海图专注于“智能定义本体”和“一脑多形”的发展思路,致力于打造功能多样、智能化程度高的机器人。这些机器人不仅具备视觉、听觉等感知能力,还能够在动态环境中灵活应对复杂任务,显示出其在具身智能领域的技术优势。其中,矢量控制底盘X1和准直驱电机超轻型机械臂产品A1的推出,为现代智能制造提供了可靠的硬件支持。此外,他们全尺寸轮足双臂仿人形机器人R1的设计,展示了对机器人多样性和适应性的全新理解。这些技术进步不仅为工业应用提供了新的选择,也为其他场景的智能化打下了基础。点莘技术是一家半导体行业AI工程化解决方案提供商,致力于chiplet 及 microLED显示的二维、三维尺寸量测及缺陷检测,用人工智能、先进光学、精密机械以及系统工程,为客户提供良率监测设备及管理算法,通过AI量检测助力先进封装良率提升。点莘技术融合精密光机系统、图像处理及 AI 算法、高性能计算等先进技术要素,开发了MicroLED 新型显示及Chiplet 先进封装量测设备。基于对MicroLED 巨量转移新兴工艺的前瞻性理解,点莘技术率先开发的无基准位置度量测检测设备,已经服务于市场主流MicroLED客户。基于对 Chiplet 先进封装技术路线的理解,点莘技术开发了面向 fine RDL 及 micro bump 2D/3D 量测检测设备,量测精度达到行业领先水平。   

【华鑫计算机|行业周报】百度举办百度世界大会,通义千问开源Qwen2.5-Coder 全系列

行情复盘

本周,AI算力指数/AI应用指数/万得全A/中证红利日涨幅最大值分别为4.77%/4.42%/1.44%/0.40%,日跌幅最大值分别为-3.19%/-3.22%/-2.43%/-1.29%。AI算力指数内部,以+35.81%录得本周最大涨幅,以-18.24%录得本周最大跌幅。AI应用指数内部,以+47.60%得本周最大涨幅,赛为智能以-18.24%录得本周最大跌幅。

【华鑫计算机|行业周报】百度举办百度世界大会,通义千问开源Qwen2.5-Coder 全系列
【华鑫计算机|行业周报】百度举办百度世界大会,通义千问开源Qwen2.5-Coder 全系列

投资建议

AI Agent迎来密集催化,AI现象级应用有望出现。海外方面,微软开源了AI工具OmniParser,专为解析和识别屏幕上可交互图标的AI工具,可帮助用户创建个性化智能体;OpenAI内部或已具备AI智能体雏形,能够操控计算机完成在线订餐、自动查询解决编程难题等任务,有望在明年1月首次向公众亮相Agent雏形;谷歌有望于今年12月发布基于Gemini2.0的AI Agent Javis。国内方面,华为诺亚方舟实验室和伦敦大学学院汪军团队提出了一个手机控制架构:Lightweight Multi-modal App Control,即轻量级多模态应用控制,简称 LiMAC,可基于手机屏幕的 UI 元素等视觉信息来实现AI 操控手机;荣耀正式推出了 MagicOS 9,通过 AI 智能体开启了“自动驾驶”手机的新模式;智谱发布端侧AutoGLM展现手机端Agent场景。综上所述,AI Agent的爆发不仅仅是技术层面的进步,更是产业变革的信号,有望掀开AI现象级应用出现的序幕。

我们继续看好AI软硬件机会,建议关注以AI为核心的龙头厂商科大讯飞(002230.SZ)、有望迎来需求爆发的AI应用金桥信息(603918.SH)、高速通信连接器业务或显著受益于 GB200 放量的鼎通科技(688668.SH)。

【华鑫计算机|行业周报】百度举办百度世界大会,通义千问开源Qwen2.5-Coder 全系列

1)AI 底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI 应用落地效果不及预期。4)推荐公司业绩不及预期风险。

证券研究报告:《百度举办百度世界大会,通义千问开源Qwen2.5-Coder 全系列 —计算机行业周报》

对外发布时间:2024年11月17日

发布机构:华鑫证券

本报告分析师:

宝幼琛  SAC编号:S1050521110002

计算机&中小盘组介绍

宝幼琛:本硕毕业于上海交通大学,多次新财富、水晶球最佳分析师团队成员,7年证券从业经验,2021年11月加盟华鑫证券研究所,目前主要负责计算机与中小盘行业上市公司研究。擅长领域包括:云计算、网络安全、人工智能、区块链等。

任春阳:华东师范大学经济学硕士,6年证券行业经验,2021年11月加盟华鑫证券研究所,从事计算机与中小盘行业上市公司研究

周文龙:澳大利亚莫纳什大学金融硕士

陶欣怡:毕业于上海交通大学,于2023年10月加入团队。

本报告署名分析师具有中国证券业协会授予的证券投资咨询执业资格并注册为证券分析师,以勤勉的职业态度,独立、客观地出具本报告。本报告清晰准确地反映了本人的研究观点。本人不曾因,不因,也将不会因本报告中的具体推荐意见或观点而直接或间接收到任何形式的补偿。

【华鑫计算机|行业周报】百度举办百度世界大会,通义千问开源Qwen2.5-Coder 全系列

法律声明

本文地址:http://www78564.xrbh.cn/news/28082.html    迅博思语 http://www78564.xrbh.cn/ , 查看更多

特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。

 
 
更多>同类最新资讯
0相关评论

文章列表
相关文章
最新动态
推荐图文
最新资讯
点击排行
网站首页  |  二维码  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  粤ICP备2023022329号