拳打谷歌ChatGPT火出圈！投资人称更需警惕投资泡沫化跟风

网络编辑财经 2022-12-07 18:26:36 0 模型用户目前

所谓ChatGPT，是在今年11月30日，由人工智能实验室OpenAI上线的新模型，其网页应用允许用户免费使用，目前用户与ChatGPT之间的对话互动包括了普通聊天、信息咨询、撰写诗词作文、修改代码等，甚至令用户产生ChatGPT能否取代谷歌等搜索引擎的疑虑。

一位技术领域人士认为，让ChatGPT 类平台、以及短视频平台或购物社交平台来取代搜索引擎，容易让知识来源单一化，这是危险的。东吴证券团队也认为，ChatGPT模型仍无法很好解决虚假信息的问题，甚至过度猜测用户意图导致回答偏差较大，因此其本质仍偏向AIGC内容生产工具，而非搜索引擎。

此外，ChatGPT火速出圈，但对话过程中也经常会发生因语料积累不足而产生的“事故”。多位AI界行业人士对第一财经记者表示，无需因ChatGPT的智能而对AI产生恐惧，ChatGPT的出圈本质是算力与样本量提升后得到的自然结果，更需警惕的是将ChatGPT归属于AIGC赛道后引发的创业与投资泡沫。

“上瘾”的聊天AI

据官网介绍，计算模型GPT-3.5支持的通用聊天机器人ChatGPT，能回答连续性的问题、承认自己的错误、质疑不正确的假设，甚至拒绝不合理的需求。从写剧本、写诗、设计游戏，到给程序找bug，乃至制定一份“毁灭人类”的计划，这个AI能做的事情超乎想象。

美国企业家马斯克询问了ChatGPT如何设计Twitter，AI回答称：“为了使用户更容易查看线程互联网对话并与之交互，你可以将线性一维界面转换为二维无限网格。”

有人认为，ChatGPT的出现堪比AlphaGo打败李世石。12月5日，OpenAI创始人兼CEO阿尔特曼(Sam Altman)发布推文表示，ChatGPT用户数已突破了100万。在这条推特下，马斯克询问“每次聊天的平均费用是多少”，阿尔特曼回复表示，“用户平均每次聊天所花费的可能是个位数美分。”

目前ChatGPT仍处于免费测试阶段，不限量向公众开放，基于其破百万的用户数，平台所花费的成本不算小。不过，在使用过程中，用户提供的反馈对OpenAI也是最有价值的信息，可以不断训练语言模型，修正错误答案。

第一财经记者注册并体验了一下ChatGPT对话。虽然目前ChatGPT并没有开放给中国地区的用户，但界面仍可使用中文。记者首先让AI自我介绍，其回复，“我是Assistant，一个由 OpenAI 训练的大型语言模型。我的工作是帮助人们回答各种问题，尽可能提供准确和详细的信息。我可以回答各种问题，无论是关于历史、科学、人文还是其他话题。”

计算机领域从业人士高毅对第一财经表示，试用ChatGPT的体验很奇妙，一个聊天AI 能写代码，能用“意念”分析代码，甚至能用“意念”分析一个超时程序的运行结果，“一开始以为他打开了个gcc 或者 python 之类的外部进程辅助分析，但试下来感觉并不是这样，而是他真的像人一样在试图理解这些代码。”

高毅故意提供了一些有问题的输入程序，使其根本无法正确执行，还故意给了个有生之年无法运行结束的程序，而ChatGPT像人而非机器一样，无视了上述这些不重要的问题，转而专注于问题的核心点，并在有限时间内给出了解答，“虽然他回答有小的错误，但能够做到这一步真的已经非常厉害了。”

东吴证券研报分析认为，ChatGPT的模型经历从GPT到GPT3的升级，优化主要来自算力增加。GPT、GPT-2和GPT-3在算法模型并没有太大改变，但参数量从1.17亿增加到1750亿，预训练数据量从5GB增加到45TB，其中GPT-3训练一次的费用是460万美元，总训练成本达1200万美元。虽然训练数据量和算力大幅增加使GPT-3有显著优化，但高额投入也使其只能走B端变现。

此次ChatGPT出圈，其技术模型最大变化出现在2022年推出的GPT3.5，技术迭代成优化来源于1月发布的InstructGPT模型中增加了人类对模型输出结果的演示，并在对结果进行排序的基础上训练，加上指令调整的帮助，虽然其只有13亿个参数，但回答准确率、道德表现却好于GPT-3。

ChatGPT虽然强大，仍然有其局限性，比如偶尔会犯错误，有一定的误导性；作为一个AI，它也不能提供对人或事件的判断和评价。但基于其反馈强化学习系统，ChatGPT也在不断学习完善。有用户表示，前几天问ChatGPT的时候提供的错误答案，过了一天之后就已经被修正，或许是很多用户的反馈帮助ChatGPT对正确的答案进行了排序。

日常对ChatGPT进行调戏逗乐仅是娱乐项目，一旦作为严肃工作内容，则需要严谨对待。据了解，程序员交友网站Stack Overflow上已出现大量通过ChatGPT自动生成的内容，给Stack Overflow的质量管理造成影响。Stack Overflow方面发布公告称，由于从ChatGPT中获得正确答案的平台比率太低，发布由ChatGPT创建的答案对网站和询问者以及寻找正确答案的用户都有很大危害。“禁止用ChatGPT直接生成垃圾答案，否则封号。这是一个临时性规定，目的是应对目前论坛上ChatGPT生成内容的泛滥之势。”

对此，ChatGPT回应称，“因为AI生成的答案不总是准确或相关的，可能会导致Stack Overflow上混淆错误答案，误导在寻求帮助的用户。”“Stack Overflow禁止用AI生成答案是合理的。”阿尔特曼也表示，正试图阻止ChatGPT随机编造，现阶段让其与当前技术保持平衡是很棘手的。随着时间的推移，会根据用户反馈来改进。

对AI无需过分恐慌

开发出ChatGPT的公司是何来头？公开信息显示，ChatGPT由人工智能公司OpenAI开发，成立至今已经七年，坊间传言其最新估值已达到两百亿美元。

OpenAI最初是由马斯克、阿尔特曼等六人在2015年联合创办，最初为非营利性机构。2018年马斯克宣布退出，2019年，OpenAI宣布重组为一家“有限营利(capped-profit)企业”，并接受了微软10亿美元的投资，双方表示将合作替Azure云端平台服务开发人工智能技术。此次推出的ChatGPT也是在微软Azure AI服务器上完成的训练。

阿尔特曼在12月6日发布的推文中感谢微软和Azure，他表示，微软和Azure做了大量的工作，构建了迄今为止最好的AI 基础设施，但目前并没有因为OpenAI 推出的东西而获得足够的荣誉。

此次ChatGPT的火热出圈也引发外界对AI是否即将战胜人类的恐慌。但多位AI界面人士对记者称，目前ChatGPT更多是算力与语料调教后的正常结果。

据国盛证券研报，ChatGPT的背后离不开大模型、大数据、大算力，其技术底座使用的是微调后的GPT-3.5系列模型，有着多达1750亿个模型参数，OpenAI主要使用的公共爬虫数据集有着超过万亿单词的人类语言数据集。GPT-3.5在微软Azure AI超算基础设施上进行训练，总算力消耗约3640PF-days(即每秒一千万亿次计算，运行3640个整日)。

针对外界认为ChatGPT可以取代搜索引擎的观点，前Google总部科学家、出门问问创始人李志飞认为，相对于语音助手和搜索引擎，ChatGPT目前还有很多不能干或干不好的实情，如不能查询附近的川菜馆，不能进行打电话、定日历、播放歌曲等手机本地操作。此外，ChatGPT大概率不能回答训练时它没有看到的最新网页知识，不一定能正确回答一个五年前政治人物今年的年龄，大概率不能做对简单的逻辑题和加减乘除题。

总结来说，李志飞认为，ChatGPT的“认知”建立在虚拟训练文本上，没有跟实时的数据库或信息连接，也没有显式的逻辑推理，仍有些“空中楼阁”的味道，所以特别适合插科打诨。

虽有不少声音将ChatGPT与谷歌等搜索引擎对比，但东吴证券团队认为，由于ChatGPT模型仍无法很好解决虚假信息的问题，甚至过度猜测用户意图导致回答偏差较大，因此其本质仍偏向AIGC内容生产工具。搜索引擎核心是海量信息集合，而非信息创造；但在“存在标准答案”的编码、数学计算等领域，ChatGPT或将对搜索引擎产生一定冲击。其次，相比更多面向B端客户的GPT-3，C端学习和使用成本低、产出效果好的ChatGPT有望助力AIGC破圈，并在接收海量用户反馈的过程中继续迭代，推动AIGC文字内容生产走向全民化。

不少游戏人士和插画人士也开始关注ChatGPT，但不少用户在使用之后反馈表示ChatGPT并没有想象中那么智能。有一位游戏行业人士发现，ChatGPT对于2021年之后发生的事情似乎了解得并不多，“问它《原神》，它不知道稻妻(原神的一个地名)是哪里。”该用户说。另有用户向ChatGPT提问“《原神》的开发公司是哪家”，得到的回应不是米哈游而是腾讯。

对此，另一位用户表示，目前ChatGPT的学习的数据样本只截止到2021年，等到训练的人数增加了，反馈内容的质量便会有所提升。此外，部分用户向记者反馈认为，ChatGPT在不同语种的识别和解读上存在差异，使用中文和同样内容转译成的英文输入得到的反馈结果并不相同。

尽管目前ChatGPT仅能实现文字应答，但是不少插画人士也开始利用ChatGPT工作。一位插画师告诉记者，对于目前市面上流行的AI绘画软件stablediffusion，插画师常苦于反复修改提示语但仍无法得到理想的结果。不过ChatGPT提供了一个新的思路：用于生成指导AI作画的提示语模板，即利用AI告诉AI如何作画。“相当于把ChatGPT当成一个人类惯用语和ai绘画能理解的语言中间的翻译器，只需要在它生成的模板中填写几个关键词然后粘贴到stablediffusion就好了，经过ChatGPT转换后的指令成的图比原先手动输入的内容相比要好很多。”

相较而言，人工智能研究专家、创新工场人工智能工程院执行院长王咏刚持有更谨慎的态度，他表示，其一，AI创作目前在知识教育领域争议很大，例如王咏刚杜撰了一个学术概念“镜像等离子规范场”，但ChatGPT竟然真的一本正经地进行了解读。

王咏刚称，ChatGPT的模仿能力和文笔越好，这个未来风险就越值得重视且需要提前应对。今天的AI生成理论，还没办法保证生成内容的逻辑正确与合理；建立人类领域专家参与的AI训练过程，发展与正确性相关的增强学习算法可能会是未来的一个AI科研热点。

其二的担忧点在于AI/CS专业人需保持冷静，王咏刚认为，面对大幅提升多轮对话能力的ChatGPT，越是AI/CS的从业者越是不能一味地顶礼膜拜；最起码，应该有测试和验证的精神，不断探索新模型的能力上限，甄别模型生成答案时真正的“记忆认知”和基于特征相似性的“模仿游戏”。

警惕盲目跟风

ChatGPT的火爆让国内创投圈再次热议AIGC的投资价值，AIGC 全称AI-Generated Content，指利用AI技术寻找数据规律并泛化生成的内容。

国泰君安研发分析称，AI绘画是AIGC的一大重要分支，目前处于由简单的降本增效向创造额外价值升级的阶段，跨文字和图像的多模态内容成为关键的发展节点。2022年8月，Stable Diffusion、Midjourney等AI绘画应用因《太空歌剧院》作品的获奖而在海外迅速出圈，此后热度蔓延至国内，无界版图AI、意间AI等应用于9月底相继上线，其中意间AI用户数在42天内突破百万。此次ChatGPT仅用5天便实现百万用户数，AI问答及其他分支应用的热度有望持续攀升。

就技术层面而言，国泰君安称，模型效率、素材库丰富度是AIGC应用的核心竞争力。以AI绘画为例，此前流行的GAN模型存在一定局限性，包括从噪声/条件到最终结果的一步到位式生成方式难度较高，面对复杂数据时容易训练失败，跨模态生成效果较差等。但2022年出现的Diffusion模型在这三方面均有改善，模型迭代驱动多个AI绘画应用出圈。

并且此次OpenAI发布的ChatGPT模型较前代而言有较大进步，如减少不真实回答、避免有害回答、挑战用户问题前提等，同时还具备连续对话的记忆能力，人机交互体验更为逼真。丰富的内容素材库保障模型得到充分训练，并最终生成高质量内容，是AIGC应用的另一核心竞争力。

因此，浙商证券研报认为，ChatGPT模型的出现对于文字模态的AIGC应用具有重要意义。从下游相关受益应用来看，包括但不限于代码机器人、小说衍生器、对话类搜索引擎、语伴、语音工作助手、对话虚拟人等。从上游增加需求来看，包括算力、数据标注、自然语言处理(NLP)等。

至于ChatGPT加入后对行业造成的“威胁”，高毅表示，ChatGPT不一定能完全替代所有人，但可能是相对基础的那部分，“具体到软件行业，今天能离谱地生成和分析代码，那明天很有可能 PRD 文档都能直接生成软件产品，仅需少量资深产品研发测试等人力介入。作为从业者，平时还是得多想想，哪些技能是更深的、不那么容易被替代的。”

就目前ChatGPT存在的问题而言，主要是来自于训练过程和数据集的局限性，此次面向用户免费开放能够进一步强化训练，从而完善模型质量。国盛证券研究所发现，目前OpenAI等巨头已着手自建计算集群来满足AIGC的要求，这种集中式的训练对GPU、存储、机房、供电等基础设施均有巨大需求。国内部分创业团队目前基于公有云训练，随着需求的增加，也有望转向自建集群。

今年以来，我国“东数西算”战略自上而下快速推进，作为数字经济的基础，“算力即权力”，其重要性不言而喻，此前国内厂商的更多互联网应用聚焦于“存”而非“算”，随着AIGC技术在全球的兴起，“东数西算”的算力需求将越来越显著。

未来随着深度学习模型不断完善、开源模式的推动、大模型探索商业化的可能，AIGC有望加速发展。但针对此次ChatGPT再次点燃创投圈内AIGC赛道的火热，王咏刚持有谨慎态度。2022年11月，王咏刚前往硅谷，拜访了多家投资公司、科技公司、创业团队，他发现科技圈里几乎人人都在谈论AIGC，似乎没有AIGC包装的创业项目就不是好项目，没有AIGC概念的科研就发不出好论文。

但实情的确如此吗？在后续与OpenAI两位联合创始人的交流中，王咏刚发现，对方会通过非常技术化、务实的心态谈论其工作计划与技术思考，但他们并不知道AIGC到底是什么意思，这令王咏刚非常诧异，思考之后王咏刚认为，“从科技上开创AIGC这个新领域的OpenAI创始人，其实并不需要知道类似AIGC之类纯粹用来包装科技概念的新名词。他们要研究的是大模型结构、并行训练加速、神经网络优化等等具体科学与技术。这样的人才是真正的创建者和领航者。”

目前国内AIGC一片火热，在王咏刚看来，其中一部分创业者、投资者、或将AIGC快速包装成应用产品的大多数，其实只是并无能力决定科技大方向的跟风者。“期望跟风者在AIGC这个大舞台上，不要过于头脑发热，还是要多判断一下，自己构建的所谓‘产品’，到底是有益于人类进步的，还是向已经碎片化的内容世界继续灌水或倾倒垃圾的。”王咏刚表示。【编辑:彭婧如】