ChatGPT有多强大？ChatGPT模型AI为什么这么厉害？

生活网 > IT世界 > 正文

2023-01-29 16:43 互联网

　　ChatGPT有多厉害？GPT-3目前的能力已经接近人类，甚至超过人类了。

　　ChatGPT模型看起来比以往的人机对话模型更强大，例如，其敢于质疑不正确的前提和假设、主动承认错误以及一些无法回答的问题、主动给拒绝不合理的问题、提升了对用户意图的理解以及结果的准确性。与之前的GPT3不同，相比于此前海量学习数据进行训练，ChatGPT中，人对结果的反馈成为了AI学习过程中的一部分。

　　马斯克发推称：ChatGPT厉害的吓人，我们距离危险而强大的AI不远了。

　　ChatGPT 使用监督微调训练了一个初始模型：人类 AI 训练员提供对话，他们在对话中扮演双方——用户和 AI 助手，AI 训练员可以访问模型编写的对话回复，以帮助 AI 调整回复内容。

　　为了创建强化学习的奖励模型，该研究需要收集比较数据，其中包含两个或多个按质量排序的模型回复。该研究收集了 AI 训练员与聊天机器人的对话，并随机选择一条模型编写的消息，抽取几个备选回复，让 AI 训练员对这些回复进行排名。此外，该研究还使用近端策略优化算法（PPO）微调模型，并对整个过程进行了数次迭代。

　　目前已经有网友尝试让ChatGPT参加美国高考；诱骗ChatGPT规划如何毁灭世界；甚至让ChatGPT扮演OpenAI，在系统内构建ChatGPT套娃。

　　ChatGPT在网友的引导下创作的小说

　　更多新功能还在持续等待网友开发中……

　　这么好玩的东西不会只是拿来玩的吧？

　　在网友排队“调戏”AI的同时，ChatGPT商业落地问题亦成为产业界关心的话题。

　　ChatGPT或将衍生出一批强大的NLP商业应用。一位人工智能行业专家告诉虎嗅，通用大模型的普及预计会在3-5年内实现，人工智能将很快替代简单重复劳动，甚至是一些流程性的技术岗位，比如翻译、新闻简讯编辑等。通用大模型很可能会在短时间内改变现在生产和生活的很多方式，大量基础性的工作流程会被基于大模型的智能应用渗透甚至取代。

　　那么代表着最新AI训练趋势的ChatGPT，在商业化方面有可能面临哪些挑战呢？

　　多位业内人士向虎嗅证实，今天的ChatGPT距离实际落地还有一段距离。其中最为核心的问题，在于模型的准确性和部署成本。

　　首先，ChatGPT的回答并不能保证准确性，这对需要准确回答具体问题的商业应用来说是致命伤。这也是ChatGPT要在C端大规模推广，所需要面临的挑战。一些业内人士担心，如果AI输出虚假信息的速度太快，可能会在互联网中淹没真实信息，甚至对整个社会产生误导。

　　这样的担心不无道理，也并非没有先例。Meta早些时候推出的一款大型科学预言模型Galactica，就因为回答问题过于“放飞自我”，在网上输出了大量凭空捏造的虚假内容，仅上线三天就匆匆下架了。

　　ChatGPT也并不能避免这个问题，OpenAI的科学家John Schulman在此前接受采访时曾表示，他们在解决AI编造事实的问题上取得了一些进展，但还远远不够。

　　商业化考虑的另一个问题就是经济性。ChatGPT目前尚处在免费的测试阶段，眼前最接近实际的应用场景是搜索引擎优化、营销媒体内容创作辅助和开发者编程。

　　由于，ChatGPT现在还处在一个优化迭代的阶段，目前开放的公测应该也是希望搜集大众使用的反馈对模型持续改进。OpenAI首席执行官Sam Altman曾提到过，OpenAI未来的重点更新功能之一，是对ChatGPT生成的内容提供Citation。

　　GPT-3参数量达到1750亿，在2020年6月发布之后， OpenAI开始尝试对GPT-3进行商业化。目前OpenAI以API的形式向开发者客户有偿提供GPT-3模型，并根据token使用量来收费。其客户包括传媒、营销等多个领域，基于GPT-3产生的App达300多个。

　　从OpenAI官网公布的API价格来看，收集莎士比亚作品集的价格在48-24000美元不等

　　训练阶段的沉没成本过高，也导致人工智能应用早期很难从商业角度量化价值，也就是算不好“经济账”。随着算力的不断提高、场景的增多、翻倍的成本和能耗，将成为横梗在所有公司面前的问题。尽管OpenAI的估值目前为200亿美元，但此前亦有观点认为OpenAI应该是一家万亿估值的公司，而这家公司目前阶段主要产品和技术仍停留在实验阶段。

　　尽管很多小规模的预训练模型在今天的人机对话领域已经有很多成功的商业应用，但像ChatGPT这样大规模的模型，在To B领域中部署的难度很高，部署速度慢、成本高，商业价值也不明确，因此仅能停留在搜索、文化、娱乐等应用领域。

　　容联云AI科学院院长刘杰对虎嗅表示，To B行业对人工智能要求更严肃、严谨，目前的人机对话内容主要集中在客服、外呼、营销等领域，需要有针对的模型库，利用BERT（预训练的语言表征模型）基础上的UniLM框架等规模小一些的模型进行快速训练。

　　刘杰认为，包括ChatGPT在内的NLP，在商业化上还处在一个螺旋上升的阶段，未来应用场景很广，但当下技术和商业模式还需要尽快找到一个“共振”的频率。

　　不过，也有很多人认为ChatGPT未来的应用领域未必局限在人机对话，可能会扩展到更多应用领域，例如程序问题的识别和搜索引擎等。只是不论是哪一点，其都无法避免那些商业化的难题。