百度文心一言怎么样?百度AI聊天机器人什么水平?
2023-03-17 09:32 互联网

  以下为百度文心一言发布会详细纪要部分摘录——

  李彦宏(创始人):其实百度在过去的十几年当中,一直在AI的研发上坚持投入。文心大模型第一个版本2019年就发布了,此后每年都要发布一个新版本。所以从这个意义上说,文心一言的发布只是我们过去多年努力的自然延续。

  但毕竟今天的文心一言,是要对标ChatGPT,甚至要对标GPT-4,这个门槛还是很高的。全球的大厂当中,百度是第一个发布的。微软是直接调用OpenAI,Google、Facebook、Meta、Amazon他们现在都没有真正发布同类型、同级别的产品,所以百度是第一个。

  在内测的过程当中体验到文心一言的能力,确实也不能叫做完美。但是为什么今天要发布?因为有市场需求,百度的各个产品线,从搜索到智能云到自动驾驶到小度,都在等着要用这样的技术。更重要的是我们的客户,我们的合作伙伴等着用这样的技术,大家都在催我们需要尽早把它发布出来,大语言模型产品一旦发布出来,它就会获得真实的用户反馈,而有了用户反馈,它的迭代速度就会非常快,它的能力提升就会非常快。

  下面用5个案例来分别展示文心一言的能力。第一个是文学创作,第二个是商业文案的创作,第三个数理逻辑的推算,第四个是中文的理解,第五个是多模态的生成。

  第一个例子,是文学创作。我们看一个有关《三体》的例子,先问《三体》的作者是哪里人,它先要知道《三体》作者是谁,然后要懂得“哪里人”是什么意思。“可以总结一下三体的核心内容吗?”,“如果要续写的话,可以从哪些角度出发?”,它总结了《三体》的第一部在讲什么,第二部在讲什么,第三部在讲什么,续写又是角色的塑造、情节设计、文化背景、哲学思考。我们追问“如何从哲学角度来进行续写?生命的意义,人与宇宙的关系,道德和伦理,价值和信仰,科技和人文的关系”。再问“电视剧《三体》的演员都有哪些?”,它比较准确地列出了一系列参与的演员。这总共有6轮对话,这些对话体现出文心一言各方面的能力,比如总结分析的能力、推理的能力。事实性的东西对于一个搜索引擎来说不是那么难,但是对于一个生成式预训练大模型来说,出错的概率还是挺高的,这些问题都答对相当不容易,因为百度的文心一言采用了知识增强和检索增强。我们有5500亿的事实知识在训练数据里,所以可以保证事实性的问题回答比较准确。

  第二个例子,是商业文案的创作。问“如果要成立一个用大模型服务中小企业数字化升级的科技服务公司,应该给它起个什么名字?”,信智科技、数智云图、云集科技、意向科技、魔方科技。“给我起一个公司的服务slogan,来表达共赢的概念?”,答案就是“数智共赢智慧未来”。“帮我生成一篇公司成立的新闻稿,数智云图,以共赢的服务理念,用大模型来服务中小企业的数字化升级,要求是600字左右”,也生成了相应的新闻稿。这里涉及到相应的理解能力、表达能力、创意创作能力。这些能力都是没有办法教文心一言的。那么怎么做到的?其实还是要有好的技术,要有大的数据。人们说读书破万卷,文心一言可能读了千亿万亿的页面,用了几十亿的搜索请求,用了很多的图片,用了我们全部知识图谱的5500亿的事实,在不断的训练过程当中,逐步具备了一些比较通用的能力。大模型当参数达到千亿量级,又有足够多的训练语料数据来进行训练时,就会发生智能涌现,就是没有教过它的能力它也会。

  第三个例子,演示数理逻辑的推算。来玩一个鸡兔同笼的游戏,问有多少只鸡,多少只兔子,文心一言说这题好像出的不太对,算不出来。我们再改一下,重新问一遍。解题思路是这样的,答案是“3只鸡和6只兔子。在这两轮提问当中展现出来的是文心一言的逻辑推理能力”。这方面它不仅知道题出的对不对,也不仅能够给出答案,也给出了解题的步骤。这很像是小学生在解应用题,它是有逻辑的,一步一步的推理出来的。我们在过去一个月左右的内测当中,不断看到文心一言在进步,虽然现在还不敢说百分之百这类型的题都能做对,但是它的能力已经是挺强的了。

  第四个例子,对中文的理解。因为百度是植根于中国市场的,理应在中文的理解和对中国文化的了解上,超出世界上任何一个预训练大模型。“洛阳纸贵是什么意思?”,必须得知道这个成语,才能答对。“当时洛阳的纸到底有多贵?”,这就有点冷知识了,不是那么容易能够答对的。“这个成语在经济学原理里对应的理论是什么?”,回答“这是一个需求定律,就是物以稀为贵”。最后“用洛阳纸贵来写一首藏头诗”,回答“洛阳城里春光好,阳燕无双不负赏。纸贵漫天诗词赋,贵比黄金乐未央”。所以看到文心一言中文的理解能力,对中国文化的熟悉程度是相当高的。文心一言也可以处理英文,只不过对英文的理解和处理能力现在还没有中文这么好,部分原因是我们在训练数据里,给它注入的英文数据还没有那么多。未来我们会逐步的训练它英文以及其他语种的能力,以及跨语种的翻译推理能力。

  第5个例子,是多模态的生成。“请为2023世界智能交通大会来创作一张海报”,看到它的反应是很快的,而且这个海报很有未来感,也很贴切。“你认为智能交通最适合哪个城市发展?”,回答“上海、北京、广州、成都”。“请用四川话将以上内容讲出来”,“请将以上内容生成视频”,大家看到生成的视频也非常相关,而且还挺美。这四次交互分别看到它可以用文字生成图片,可以回答有一定创造性的问题,可以用语音方言(四川话、广东话、东北话、闽南话),最后用这些内容来生成视频。前三个现在所有文心一言的用户都可以用了。第四个因为计算成本比较高,我们还没有对所有用户开放。今天大概每天有几万篇的百家号文章,通过这个技术自动转成视频进行分发,这些技术我们都已经都把它连起来了。

  从文心一言的表现来看,它已经具备了很多像人类对自然语言的理解能力、表达能力、逻辑推理能力,这些的能力还在不断完善的过程当中。我们有时候用会感受到惊喜,有时候也会发现明显的错误,但是有一点是肯定的,就是它进步的速度非常快,在未来的一段时间当中,一定是日新月异的状态。而且我们通过对文心语言大模型进行微调,让它适配百度各种各样的产品,就可以在用户界面,或者在用户体验上展示出惊人的亲和力,让每一个产品都离自己的客户更近。所以文心一言会成为每一人必不可少的生产力工具。

为您推荐
  • 推荐
  • 娱乐
  • 情感
  • 健康
  • 旅游
  • 房产
  • 体坛
  • 汽车