百度文心一言怎么样？百度AI聊天机器人什么水平？

生活网 > IT世界 > 正文

2023-03-17 09:32 互联网

　　以下为百度文心一言发布会详细纪要部分摘录——

　　李彦宏（创始人）：其实百度在过去的十几年当中，一直在AI的研发上坚持投入。文心大模型第一个版本2019年就发布了，此后每年都要发布一个新版本。所以从这个意义上说，文心一言的发布只是我们过去多年努力的自然延续。

　　但毕竟今天的文心一言，是要对标ChatGPT，甚至要对标GPT-4，这个门槛还是很高的。全球的大厂当中，百度是第一个发布的。微软是直接调用OpenAI，Google、Facebook、Meta、Amazon他们现在都没有真正发布同类型、同级别的产品，所以百度是第一个。

　　在内测的过程当中体验到文心一言的能力，确实也不能叫做完美。但是为什么今天要发布？因为有市场需求，百度的各个产品线，从搜索到智能云到自动驾驶到小度，都在等着要用这样的技术。更重要的是我们的客户，我们的合作伙伴等着用这样的技术，大家都在催我们需要尽早把它发布出来，大语言模型产品一旦发布出来，它就会获得真实的用户反馈，而有了用户反馈，它的迭代速度就会非常快，它的能力提升就会非常快。

　　下面用5个案例来分别展示文心一言的能力。第一个是文学创作，第二个是商业文案的创作，第三个数理逻辑的推算，第四个是中文的理解，第五个是多模态的生成。

　　第一个例子，是文学创作。我们看一个有关《三体》的例子，先问《三体》的作者是哪里人，它先要知道《三体》作者是谁，然后要懂得“哪里人”是什么意思。“可以总结一下三体的核心内容吗？”，“如果要续写的话，可以从哪些角度出发？”，它总结了《三体》的第一部在讲什么，第二部在讲什么，第三部在讲什么，续写又是角色的塑造、情节设计、文化背景、哲学思考。我们追问“如何从哲学角度来进行续写？生命的意义，人与宇宙的关系，道德和伦理，价值和信仰，科技和人文的关系”。再问“电视剧《三体》的演员都有哪些？”，它比较准确地列出了一系列参与的演员。这总共有6轮对话，这些对话体现出文心一言各方面的能力，比如总结分析的能力、推理的能力。事实性的东西对于一个搜索引擎来说不是那么难，但是对于一个生成式预训练大模型来说，出错的概率还是挺高的，这些问题都答对相当不容易，因为百度的文心一言采用了知识增强和检索增强。我们有5500亿的事实知识在训练数据里，所以可以保证事实性的问题回答比较准确。

　　第二个例子，是商业文案的创作。问“如果要成立一个用大模型服务中小企业数字化升级的科技服务公司，应该给它起个什么名字？”，信智科技、数智云图、云集科技、意向科技、魔方科技。“给我起一个公司的服务slogan，来表达共赢的概念？”，答案就是“数智共赢智慧未来”。“帮我生成一篇公司成立的新闻稿，数智云图，以共赢的服务理念，用大模型来服务中小企业的数字化升级，要求是600字左右”，也生成了相应的新闻稿。这里涉及到相应的理解能力、表达能力、创意创作能力。这些能力都是没有办法教文心一言的。那么怎么做到的？其实还是要有好的技术，要有大的数据。人们说读书破万卷，文心一言可能读了千亿万亿的页面，用了几十亿的搜索请求，用了很多的图片，用了我们全部知识图谱的5500亿的事实，在不断的训练过程当中，逐步具备了一些比较通用的能力。大模型当参数达到千亿量级，又有足够多的训练语料数据来进行训练时，就会发生智能涌现，就是没有教过它的能力它也会。

　　第三个例子，演示数理逻辑的推算。来玩一个鸡兔同笼的游戏，问有多少只鸡，多少只兔子，文心一言说这题好像出的不太对，算不出来。我们再改一下，重新问一遍。解题思路是这样的，答案是“3只鸡和6只兔子。在这两轮提问当中展现出来的是文心一言的逻辑推理能力”。这方面它不仅知道题出的对不对，也不仅能够给出答案，也给出了解题的步骤。这很像是小学生在解应用题，它是有逻辑的，一步一步的推理出来的。我们在过去一个月左右的内测当中，不断看到文心一言在进步，虽然现在还不敢说百分之百这类型的题都能做对，但是它的能力已经是挺强的了。

　　第四个例子，对中文的理解。因为百度是植根于中国市场的，理应在中文的理解和对中国文化的了解上，超出世界上任何一个预训练大模型。“洛阳纸贵是什么意思？”，必须得知道这个成语，才能答对。“当时洛阳的纸到底有多贵？”，这就有点冷知识了，不是那么容易能够答对的。“这个成语在经济学原理里对应的理论是什么？”，回答“这是一个需求定律，就是物以稀为贵”。最后“用洛阳纸贵来写一首藏头诗”，回答“洛阳城里春光好，阳燕无双不负赏。纸贵漫天诗词赋，贵比黄金乐未央”。所以看到文心一言中文的理解能力，对中国文化的熟悉程度是相当高的。文心一言也可以处理英文，只不过对英文的理解和处理能力现在还没有中文这么好，部分原因是我们在训练数据里，给它注入的英文数据还没有那么多。未来我们会逐步的训练它英文以及其他语种的能力，以及跨语种的翻译推理能力。

　　第5个例子，是多模态的生成。“请为2023世界智能交通大会来创作一张海报”，看到它的反应是很快的，而且这个海报很有未来感，也很贴切。“你认为智能交通最适合哪个城市发展？”，回答“上海、北京、广州、成都”。“请用四川话将以上内容讲出来”，“请将以上内容生成视频”，大家看到生成的视频也非常相关，而且还挺美。这四次交互分别看到它可以用文字生成图片，可以回答有一定创造性的问题，可以用语音方言（四川话、广东话、东北话、闽南话），最后用这些内容来生成视频。前三个现在所有文心一言的用户都可以用了。第四个因为计算成本比较高，我们还没有对所有用户开放。今天大概每天有几万篇的百家号文章，通过这个技术自动转成视频进行分发，这些技术我们都已经都把它连起来了。

　　从文心一言的表现来看，它已经具备了很多像人类对自然语言的理解能力、表达能力、逻辑推理能力，这些的能力还在不断完善的过程当中。我们有时候用会感受到惊喜，有时候也会发现明显的错误，但是有一点是肯定的，就是它进步的速度非常快，在未来的一段时间当中，一定是日新月异的状态。而且我们通过对文心语言大模型进行微调，让它适配百度各种各样的产品，就可以在用户界面，或者在用户体验上展示出惊人的亲和力，让每一个产品都离自己的客户更近。所以文心一言会成为每一人必不可少的生产力工具。

文章导读

荣耀V20即将发布：麒麟980+4000mAh电池