ChatGPT与大模型：AI行业探讨

您的位置：
门户
>> 文章精选
>> 业务知识
>> 数据分析与AI
>> 查看资讯

发表于：2023-6-28 09:57

字体：大中小 | 上一篇 | 下一篇 | 我要投稿

作者：沙砾君来源：沙砾评论

ChatGPT

人工智能

大模型

　　2023年5月30日，沙砾团队召开“线上策略分享会·2023年夏季会议”，围绕“人工智能”话题，从投资者、开发者和应用者视角与来宾进行了专业分享，现将会议精彩内容与读者分享。

　　大模型如何影响AI行业

　　随着ChatGPT爆火以后，人工智能再次成为全球瞩目的行业焦点。过往AI公司特征可以简单分为两类：一是以四小龙为首，这些公司营收规模大、人才密度高、算法能力强、覆盖行业广、但商业模式不易持续，被诟病长期烧钱。另一类是商业模式初步跑通，可以自我造血的“小而美”型AI公司，往往深耕某一类细分AI技术+小场景，产品复用水平高，但营收规模、行业长期增量不足，发展天花板较低。

　　在ChatGPT出现以后，AI领域第一次为全行业带来可以解决未知任务的“通用型”AI的曙光，拥有大模型加持的“超级AI底座”+细分场景经验赋能千百行业的预期成为可能。在未来，AI行业的人才要求、开发门槛、边际交付成本都有望逐步降低，一个新的AI商业模式生态正在快速孕育。

　　参考半导体、移动互联网等超级赛道过往10-20年的发展演变格局，未来中国AI大模型生态大概率是寡头竞争下若干个少量通用的大模型，叠加多个垂类模型的格局。而下一阶段的AI投资策略需要关注的重要方向是垂类经验+数据壁垒的领域。此外，随着大模型向人类生活生产领域全方位的渗透，在边缘侧AI需求、算力进口替代等需求等方面同样是值得深耕的细分领域。作为投资机构，对于未来AI产业链各个环节的格局，应该大胆假设、理性推演，保持开放心态去判断即将涌现的投资机会。

　　问答Q&A：

　　Q：如何理解大小模型？

　　A：大小指的是参数的大小，通常在1亿以上为大模型，以下为小模型。此次大模型爆火的原因是发现堆积大量数据后，模型解决问题的效果出现指数式提升，而且出现了令人意外的“思维链涌现” 能力。

　　Q：算力卡脖子的问题是否难以突破？

　　A：英伟达在上游优势明显，其不仅是产品优势，还具备生态优势，护城河极深。但AMD以及全球各类互联网巨头也都在新一轮AI浪潮下推动自研加速计算产品，未来英伟达将面临更激烈的竞争环境，同时国内的GPU的研发也在进步，国家下决心推动国产替代的情况下，国产替代也有较大发展机会。

　　Q：这一波ChatGPT热潮和元宇宙有什么不同？

　　A：元宇宙没有产生可落地的场景，停留在炒概念的阶段。但ChatGPT展现了AI解决未知问题的能力，带来了明确的生产力预期，并在全球普通用户之中实现了出圈，每个人都能理解和掌握ChatGPT的玩法，商业化能力更强。

　　大模型的原理、方向、应用前景

　　AI大模型指具有巨量参数，在超大规模数据集上训练，在多个小任务无需训练或只需要极小的成本微调就能拥有优秀的性能。巨大的模型复杂度和海量的训练数据，能让大模型具备强大的泛化能力，使之在外界看来具有某种推理能力，并可以同时处理图像、文字或语音等不同类型的数据。背后的算法原理transformer（一种算法名称，即ChatGPT中的T）在几年前已被谷歌提出，本次突破靠的是堆叠参数至一定数量产生的量变到质变的过程。

　　当前大模型面临的挑战是技术门槛高、模型算力设备贵，能负担大模型训练任务的公司不多，在个人PC或手机端部署模型更不可能。未来可能的解决方法是模型压缩技术，主要分为三类。一是量化，底层逻辑是降低参数表示的位数；二是模型剪枝，去除为0或不重要的参数；三是模型蒸馏，设计一个远小于大模型的小模型，让大模型指导小模型训练出相似的结果（让小模型去拟合大模型）。

　　问答Q&A：

　　Q：模型蒸馏是不是将大模型轻量化的应用到垂直细分领域？放弃领域外的泛化，从而实现轻量化？

　　A：应用到垂类无需讨论泛化的问题，只需把特定的能力提取复制到小模型，并加入提示。蒸馏需要训练，剪枝和量化可以不依赖训练。

　　Q：中短期AI能替代掉很多人的工作吗？人类的智慧还有哪些核心竞争力不可被替代？

　　A：替代风险主要以记忆类、设计类的职业。其他大部分职业在短期很难被替代。且ChatGPT需要硬件的支持，当机器人行业或嵌入式系统行业有了突破，很多职业才会面临被替代的风险。

　　Q：人在开发人工智能时，是否因带入自己的价值观而产生偏差？

　　A：存在这种可能，ChatGPT的数据中，中文语料占比低，且中西语法不同，对政治问题的回答可能带有一定意识形态倾向。

　　AI在行业中的实际应用

　　以量化投资为例，量化投资指用编程和模型来代替基金经理的主观判断，通过研究大数据来预测股票市场的运行规律。投资流程当中最为核心和灵魂的两个步骤分别是因子挖掘和机器学习因子组合。其中因子挖掘就是找到影响股票市场的一些因素，如量价数据因子、基本面数据因子、另类数据因子等。机器学习因子组合指给每个因子分配最优权重，从而更好地预测价格走势。根据《朝阳永续量化白皮书》，目前近90%量化机构已将人工智能应用在量化投资中，未来应用程度会越来越大。其中两个应用较多的模型是树模型和集成学习模型。树模型较多的运用于策略优化和收益预测，集成学习模型较多的用于特征提取和组合构建。

　　现阶段量化投资对于ChatGPT的态度相对较冷，原因是量化投资本质是寻找数据间内在逻辑，而ChatGPT本质是识别和处理文本信息。但长期来看，ChatGPT未来在量化领域可能应用于文本挖掘、策略代码编写、批量调参、信息搜索等。

　　问答Q&A：

　　Q：人工智能作基金经理和人作基金经理的业绩对比？

　　A：2019年以来只有2020年主观基金经理业绩战胜了量化。量化通过分散的持仓，获得稳定的超额收益；基金经理的持仓依赖过往经验和投资框架，稳定性略逊量化。当市场流动性强时，量化更容易获得超额收益。

　　Q：量化投资的因子如何选择？

　　A：如果因子数量量级较大，选择神经网络（一种模仿动物神经网络行为特征，进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度，通过调整内部大量节点之间相互连接的关系，从而达到处理信息的目的）做数据训练的效果可能更好，如果因子数量较少，树模型与比较复杂的神经网络模型相比，可以减少过拟合现象的发生。同时，市场流动性也影响模型的选择。

　　Q：量化策略在大陆市场的收益与在港股和美股的收益效果相比如何？

　　A：前几年在大陆市场超额收益明显。近几年随着量化机构数量增加，资金量扩大，Alpha收益（指投资组合的额外收益，这些收益不能被市场收益解释，它是由投资组合管理人员通过超额收益或选择性投资策略获得的）逐渐减小。

　　本文内容不用于商业目的，如涉及知识产权问题，请权利人联系51Testing小编(021-64471599-8017)，我们将立即处理

《2023软件测试行业现状调查报告》独家发布~

搜索风云榜

送祝福，领好礼

2023测试行业调查报告

挣点稿费

AI与软件测试

文章资料精选