大院网-山西大院资讯网

 

 

0

 

拳打谷歌ChatGPT火出圈!投资人称更需警惕投资泡沫化跟风

网络编辑 财经 2022-12-07 18:26:36 0 模型 用户 目前

所谓ChatGPT,是在今年11月30日,由人工智能实验室OpenAI上线的新模型,其网页应用允许用户免费使用,目前用户与ChatGPT之间的对话互动包括了普通聊天、信息咨询、撰写诗词作文、修改代码等,甚至令用户产生ChatGPT能否取代谷歌等搜索引擎的疑虑。

一位技术领域人士认为,让ChatGPT 类平台、以及短视频平台或购物社交平台来取代搜索引擎,容易让知识来源单一化,这是危险的。东吴证券团队也认为,ChatGPT模型仍无法很好解决虚假信息的问题,甚至过度猜测用户意图导致回答偏差较大,因此其本质仍偏向AIGC内容生产工具,而非搜索引擎。

此外,ChatGPT火速出圈,但对话过程中也经常会发生因语料积累不足而产生的“事故”。多位AI界行业人士对第一财经记者表示,无需因ChatGPT的智能而对AI产生恐惧,ChatGPT的出圈本质是算力与样本量提升后得到的自然结果,更需警惕的是将ChatGPT归属于AIGC赛道后引发的创业与投资泡沫。

“上瘾”的聊天AI

据官网介绍,计算模型GPT-3.5支持的通用聊天机器人ChatGPT,能回答连续性的问题、承认自己的错误、质疑不正确的假设,甚至拒绝不合理的需求。从写剧本、写诗、设计游戏,到给程序找bug,乃至制定一份“毁灭人类”的计划,这个AI能做的事情超乎想象。

美国企业家马斯克询问了ChatGPT如何设计Twitter,AI回答称:“为了使用户更容易查看线程互联网对话并与之交互,你可以将线性一维界面转换为二维无限网格。”

有人认为,ChatGPT的出现堪比AlphaGo打败李世石。12月5日,OpenAI创始人兼CEO阿尔特曼(Sam Altman)发布推文表示,ChatGPT用户数已突破了100万。在这条推特下,马斯克询问“每次聊天的平均费用是多少”, 阿尔特曼回复表示,“用户平均每次聊天所花费的可能是个位数美分。”

目前ChatGPT仍处于免费测试阶段,不限量向公众开放,基于其破百万的用户数,平台所花费的成本不算小。不过,在使用过程中,用户提供的反馈对OpenAI也是最有价值的信息,可以不断训练语言模型,修正错误答案。

第一财经记者注册并体验了一下ChatGPT对话。虽然目前ChatGPT并没有开放给中国地区的用户,但界面仍可使用中文。记者首先让AI自我介绍,其回复,“我是Assistant,一个由 OpenAI 训练的大型语言模型。我的工作是帮助人们回答各种问题,尽可能提供准确和详细的信息。我可以回答各种问题,无论是关于历史、科学、人文还是其他话题。”

计算机领域从业人士高毅对第一财经表示,试用ChatGPT的体验很奇妙,一个聊天AI 能写代码,能用“意念”分析代码,甚至能用“意念”分析一个超时程序的运行结果,“一开始以为他打开了个gcc 或者 python 之类的外部进程辅助分析,但试下来感觉并不是这样,而是他真的像人一样在试图理解这些代码。”

高毅故意提供了一些有问题的输入程序,使其根本无法正确执行,还故意给了个有生之年无法运行结束的程序,而ChatGPT像人而非机器一样,无视了上述这些不重要的问题,转而专注于问题的核心点,并在有限时间内给出了解答,“虽然他回答有小的错误,但能够做到这一步真的已经非常厉害了。”

东吴证券研报分析认为,ChatGPT的模型经历从GPT到GPT3的升级,优化主要来自算力增加。GPT、GPT-2和GPT-3在算法模型并没有太大改变,但参数量从1.17亿增加到1750亿,预训练数据量从5GB增加到45TB,其中GPT-3训练一次的费用是460万美元,总训练成本达1200万美元。虽然训练数据量和算力大幅增加使GPT-3有显著优化,但高额投入也使其只能走B端变现。

此次ChatGPT出圈,其技术模型最大变化出现在2022年推出的GPT3.5,技术迭代成优化来源于1月发布的InstructGPT模型中增加了人类对模型输出结果的演示,并在对结果进行排序的基础上训练,加上指令调整的帮助,虽然其只有13亿个参数,但回答准确率、道德表现却好于GPT-3。

ChatGPT虽然强大,仍然有其局限性,比如偶尔会犯错误,有一定的误导性;作为一个AI,它也不能提供对人或事件的判断和评价。但基于其反馈强化学习系统,ChatGPT也在不断学习完善。有用户表示,前几天问ChatGPT的时候提供的错误答案,过了一天之后就已经被修正,或许是很多用户的反馈帮助ChatGPT对正确的答案进行了排序。

日常对ChatGPT进行调戏逗乐仅是娱乐项目,一旦作为严肃工作内容,则需要严谨对待。据了解,程序员交友网站Stack Overflow上已出现大量通过ChatGPT自动生成的内容,给Stack Overflow的质量管理造成影响。Stack Overflow方面发布公告称,由于从ChatGPT中获得正确答案的平台比率太低,发布由ChatGPT创建的答案对网站和询问者以及寻找正确答案的用户都有很大危害。“禁止用ChatGPT直接生成垃圾答案,否则封号。这是一个临时性规定,目的是应对目前论坛上ChatGPT生成内容的泛滥之势。”

对此,ChatGPT回应称,“因为AI生成的答案不总是准确或相关的,可能会导致Stack Overflow上混淆错误答案,误导在寻求帮助的用户。”“Stack Overflow禁止用AI生成答案是合理的。”阿尔特曼也表示,正试图阻止ChatGPT随机编造,现阶段让其与当前技术保持平衡是很棘手的。随着时间的推移,会根据用户反馈来改进。

对AI无需过分恐慌

开发出ChatGPT的公司是何来头?公开信息显示,ChatGPT由人工智能公司OpenAI开发,成立至今已经七年,坊间传言其最新估值已达到两百亿美元。

OpenAI最初是由马斯克、阿尔特曼等六人在2015年联合创办,最初为非营利性机构。2018年马斯克宣布退出,2019年,OpenAI宣布重组为一家“有限营利(capped-profit)企业”,并接受了微软10亿美元的投资,双方表示将合作替Azure云端平台服务开发人工智能技术。此次推出的ChatGPT也是在微软Azure AI服务器上完成的训练。

阿尔特曼在12月6日发布的推文中感谢微软和Azure,他表示,微软和Azure做了大量的工作,构建了迄今为止最好的AI 基础设施,但目前并没有因为OpenAI 推出的东西而获得足够的荣誉。

此次ChatGPT的火热出圈也引发外界对AI是否即将战胜人类的恐慌。但多位AI界面人士对记者称,目前ChatGPT更多是算力与语料调教后的正常结果。

据国盛证券研报,ChatGPT的背后离不开大模型、大数据、大算力,其技术底座使用的是微调后的GPT-3.5系列模型,有着多达1750亿个模型参数,OpenAI主要使用的公共爬虫数据集有着超过万亿单词的人类语言数据集。GPT-3.5在微软Azure AI超算基础设施上进行训练,总算力消耗约3640PF-days(即每秒一千万亿次计算,运行3640个整日)。

针对外界认为ChatGPT可以取代搜索引擎的观点,前Google总部科学家、出门问问创始人李志飞认为,相对于语音助手和搜索引擎,ChatGPT目前还有很多不能干或干不好的实情,如不能查询附近的川菜馆,不能进行打电话、定日历、播放歌曲等手机本地操作。此外,ChatGPT大概率不能回答训练时它没有看到的最新网页知识,不一定能正确回答一个五年前政治人物今年的年龄,大概率不能做对简单的逻辑题和加减乘除题。

总结来说,李志飞认为,ChatGPT的“认知”建立在虚拟训练文本上,没有跟实时的数据库或信息连接,也没有显式的逻辑推理,仍有些“空中楼阁”的味道,所以特别适合插科打诨。

虽有不少声音将ChatGPT与谷歌等搜索引擎对比,但东吴证券团队认为,由于ChatGPT模型仍无法很好解决虚假信息的问题,甚至过度猜测用户意图导致回答偏差较大,因此其本质仍偏向AIGC内容生产工具。搜索引擎核心是海量信息集合,而非信息创造;但在“存在标准答案”的编码、数学计算等领域,ChatGPT或将对搜索引擎产生一定冲击。其次,相比更多面向B端客户的GPT-3,C端学习和使用成本低、产出效果好的ChatGPT有望助力AIGC破圈,并在接收海量用户反馈的过程中继续迭代,推动AIGC文字内容生产走向全民化。

不少游戏人士和插画人士也开始关注ChatGPT,但不少用户在使用之后反馈表示ChatGPT并没有想象中那么智能。有一位游戏行业人士发现,ChatGPT对于2021年之后发生的事情似乎了解得并不多,“问它《原神》,它不知道稻妻(原神的一个地名)是哪里。”该用户说。另有用户向ChatGPT提问“《原神》的开发公司是哪家”,得到的回应不是米哈游而是腾讯。

对此,另一位用户表示,目前ChatGPT的学习的数据样本只截止到2021年,等到训练的人数增加了,反馈内容的质量便会有所提升。此外,部分用户向记者反馈认为,ChatGPT在不同语种的识别和解读上存在差异,使用中文和同样内容转译成的英文输入得到的反馈结果并不相同。

尽管目前ChatGPT仅能实现文字应答,但是不少插画人士也开始利用ChatGPT工作。一位插画师告诉记者,对于目前市面上流行的AI绘画软件stablediffusion,插画师常苦于反复修改提示语但仍无法得到理想的结果。不过ChatGPT提供了一个新的思路:用于生成指导AI作画的提示语模板,即利用AI告诉AI如何作画。“相当于把ChatGPT当成一个人类惯用语和ai绘画能理解的语言中间的翻译器,只需要在它生成的模板中填写几个关键词然后粘贴到stablediffusion就好了,经过ChatGPT转换后的指令成的图比原先手动输入的内容相比要好很多。”

相较而言,人工智能研究专家、创新工场人工智能工程院执行院长王咏刚持有更谨慎的态度,他表示,其一,AI创作目前在知识教育领域争议很大,例如王咏刚杜撰了一个学术概念“镜像等离子规范场”,但ChatGPT竟然真的一本正经地进行了解读。

王咏刚称,ChatGPT的模仿能力和文笔越好,这个未来风险就越值得重视且需要提前应对。今天的AI生成理论,还没办法保证生成内容的逻辑正确与合理;建立人类领域专家参与的AI训练过程,发展与正确性相关的增强学习算法可能会是未来的一个AI科研热点。

其二的担忧点在于AI/CS专业人需保持冷静,王咏刚认为,面对大幅提升多轮对话能力的ChatGPT,越是AI/CS的从业者越是不能一味地顶礼膜拜;最起码,应该有测试和验证的精神,不断探索新模型的能力上限,甄别模型生成答案时真正的“记忆认知”和基于特征相似性的“模仿游戏”。

警惕盲目跟风

ChatGPT的火爆让国内创投圈再次热议AIGC的投资价值,AIGC 全称AI-Generated Content,指利用AI技术寻找数据规律并泛化生成的内容。

国泰君安研发分析称,AI绘画是AIGC的一大重要分支,目前处于由简单的降本增效向创造额外价值升级的阶段,跨文字和图像的多模态内容成为关键的发展节点。2022年8月,Stable Diffusion、Midjourney等AI绘画应用因《太空歌剧院》作品的获奖而在海外迅速出圈,此后热度蔓延至国内,无界版图AI、意间AI等应用于9月底相继上线,其中意间AI用户数在42天内突破百万。此次ChatGPT仅用5天便实现百万用户数,AI问答及其他分支应用的热度有望持续攀升。

就技术层面而言,国泰君安称,模型效率、素材库丰富度是AIGC应用的核心竞争力。以AI绘画为例,此前流行的GAN模型存在一定局限性,包括从噪声/条件到最终结果的一步到位式生成方式难度较高,面对复杂数据时容易训练失败,跨模态生成效果较差等。但2022年出现的Diffusion模型在这三方面均有改善,模型迭代驱动多个AI绘画应用出圈。

并且此次OpenAI发布的ChatGPT模型较前代而言有较大进步,如减少不真实回答、避免有害回答、挑战用户问题前提等,同时还具备连续对话的记忆能力,人机交互体验更为逼真。丰富的内容素材库保障模型得到充分训练,并最终生成高质量内容,是AIGC应用的另一核心竞争力。

因此,浙商证券研报认为,ChatGPT模型的出现对于文字模态的AIGC应用具有重要意义。从下游相关受益应用来看,包括但不限于代码机器人、小说衍生器、对话类搜索引擎、语伴、语音工作助手、对话虚拟人等。从上游增加需求来看,包括算力、数据标注、自然语言处理(NLP)等。

至于ChatGPT加入后对行业造成的“威胁”,高毅表示,ChatGPT不一定能完全替代所有人,但可能是相对基础的那部分,“具体到软件行业,今天能离谱地生成和分析代码,那明天很有可能 PRD 文档都能直接生成软件产品,仅需少量资深产品研发测试等人力介入。作为从业者,平时还是得多想想,哪些技能是更深的、不那么容易被替代的。”

就目前ChatGPT存在的问题而言,主要是来自于训练过程和数据集的局限性,此次面向用户免费开放能够进一步强化训练,从而完善模型质量。国盛证券研究所发现,目前OpenAI等巨头已着手自建计算集群来满足AIGC的要求,这种集中式的训练对GPU、存储、机房、供电等基础设施均有巨大需求。国内部分创业团队目前基于公有云训练,随着需求的增加,也有望转向自建集群。

今年以来,我国“东数西算”战略自上而下快速推进,作为数字经济的基础,“算力即权力”,其重要性不言而喻,此前国内厂商的更多互联网应用聚焦于“存”而非“算”,随着AIGC技术在全球的兴起,“东数西算”的算力需求将越来越显著。

未来随着深度学习模型不断完善、开源模式的推动、大模型探索商业化的可能,AIGC有望加速发展。但针对此次ChatGPT再次点燃创投圈内AIGC赛道的火热,王咏刚持有谨慎态度。2022年11月,王咏刚前往硅谷,拜访了多家投资公司、科技公司、创业团队,他发现科技圈里几乎人人都在谈论AIGC,似乎没有AIGC包装的创业项目就不是好项目,没有AIGC概念的科研就发不出好论文。

但实情的确如此吗?在后续与OpenAI两位联合创始人的交流中,王咏刚发现,对方会通过非常技术化、务实的心态谈论其工作计划与技术思考,但他们并不知道AIGC到底是什么意思,这令王咏刚非常诧异,思考之后王咏刚认为,“从科技上开创AIGC这个新领域的OpenAI创始人,其实并不需要知道类似AIGC之类纯粹用来包装科技概念的新名词。他们要研究的是大模型结构、并行训练加速、神经网络优化等等具体科学与技术。这样的人才是真正的创建者和领航者。”

目前国内AIGC一片火热,在王咏刚看来,其中一部分创业者、投资者、或将AIGC快速包装成应用产品的大多数,其实只是并无能力决定科技大方向的跟风者。“期望跟风者在AIGC这个大舞台上,不要过于头脑发热,还是要多判断一下,自己构建的所谓‘产品’,到底是有益于人类进步的,还是向已经碎片化的内容世界继续灌水或倾倒垃圾的。”王咏刚表示。 【编辑:彭婧如】

 

0

 

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。
本文地址:http://www.shanxidayuan.com/zcjh/caijing/50947.html

留言与评论(共有 条评论)

   
验证码:

关于山西大院新闻网

山西大院是公共的资讯平台,公开,绿色,守法,其主要目的服务于广大本地网民的综合门户网站,还拥有强大的本地公共服务导航一站式进入本地各大政府服务平台方便业务开展。

 

山西大院新闻网

Copyright ©山西大院新闻网

copyright protection: All articles, text, video, pictures, music sources and network reproduced non-original works, only for learning and communication, the content of the article information does not mean

that the network agrees with its views or is responsible for its authenticity, if there are any problems, please contact the webmaster for processing at the first time!

版权声明: 本站所有文章,文字,视频,图片,音乐来源与网络转载非原创作品,仅限于学习交流,对文章信息内容并不代表本网赞同其观点或对其真实性负责,如果存在任何问题,请第一时间联系站长处理!