chatGPT问世后,各大公司都在“大模型”上下了苦功,模型能力也成为大家最关注的话题。ChatGPT也直接定义了基于大模型的生成式对话机器人这个产品类型,其模型的强大导致大家都忽略了它在产品使用上的问题。其实不管是底层模型开发的大厂还是专注于应用层的小厂,又或者是开源的独立开发者,都在模型能力之外的产品体验上暗自较劲,试图能够参与到这场能够定义新的人机交互方式的对话革命中来。除了模型,他们还在卷什么?

大厂专注模型,产品体验略显“简陋”,主打一个less is more

ChatGPT: 定义极简

chatgpt作为行业标杆,直接定义了生成式对话机器人行业标准。免费版本的chatgpt早期只有对话、对话管理以及简单的主题设置功能,靠着模型的能力席卷全球。随着用户的增多和抱怨,chatgpt的产品经理也做不住了,开始逐步增加一些功能。最令人深刻的当属”Upgrade to Plus”,牢牢霸占左下角的设置页,一眼望过去只有2个字,“充钱”。除此之外,也逐步增加了主题设置、隐私管理等功能,但仍然突出一个克制,颇有小龙哥真传。

https://cdn.sspai.com/2023/05/25/272d68a9ba8fd7be60d58943f05642e5.png

ChatGPT的web app界面,由对话功能、对话管理、账户管理三个分区构成

付费版本的ChatGPT主要的区别在于增加了模型切换的按钮,以及在设置中增加了Beta Features的功能,可以使用联网搜索功能[Browsing]或者使用其他丰富的插件。

Bard & Bing:非差异化竞争

三巨头的剩下两家Google Bard 以及Bing Chat,也都各有各自的风格,但总体上还是维持着极简风。

Bard的功能设计逻辑与chatgpt几乎一致,对话功能为主,融合必要的对话管理、账户管理以及界面设置功能。作为搜索大拿,Bard在对话的基础上也引入了搜索的功能,能够自然地根据问题引入搜索,并呈现融合处理过的结果,体验上更加up to date。对于天气、实时信息的查询都表现良好。

大模型在生成答案时会有多个答案并且有相应的权重,Bard的“查看其他答案”功能给用户提供了更多选择,当我询问北京市天气的时候,它甚至给出了文字版本、表格版本和极简版本,非常惊艳。值得一提的是,Bard的回答生成在交互方面是一次性生成而非打字机模式(文字一个一个出现,有打字机效果,参考ChatGPT),上缺乏了生成过程,体验上感觉不够丝滑。

https://cdn.sspai.com/2023/05/25/f38b2fab3d2597bb29b7805acd051539.png

Bard的“查看其它答案”功能,可以查看多个答案

与ChatGPT和Google Bard不同的是,Bing Chat的定位是基于搜索的,它的工作原理是从输入中总结搜索关键词进行搜索,然后对搜索结果进行总结。每一条回复都会引用相应的来源,这同时导致它在创造力方面更缺乏,但是来源可考,保证了准确性。

Bing同样也是极简风,整体的产品界面设计与其他两家区别不大,但色彩上明显更活泼一些。功能上最开始甚至连对话管理的功能都没有,聊完了您就清空,不留下一丝痕迹。后来才增加“最近活动”的功能,用户能够看到自己最近的对话。Bing唯一的特点在于设定了三种对话样式“更有创造力、更平衡、更精确”。这与GPT模型中的高级参数[Temperature]是对应的,能够根据此参数确定模型是更精确还是更有创造性。然而在使用体验上,用户很难感受到差别,因为无法同时对比几个模式,同时即使是更有创造力的选项,受限于Bing更偏向搜索的定位,搜出的结果依旧缺乏创造力。

对比下来,三巨头比拼的主要还是模型能力,目前ChatGPT还是比较领先;Bard比较好地融合了搜索和生成两种模式,体验上是更优秀一些。Bing则缺乏使用上的亮点,但靠着一句GPT4模型就足以吸引大部分用户。

中小厂深耕体验,能力之上体验狂卷

不同于大厂卷模型能力,中小厂和个人开发者们更多将注意力放在了模型层上的应用层,依托各家大厂的底层模型能力,在功能和体验方面卷的飞起。

Perplexity: 让谷歌和Bing知道基于搜索的AI对话产品该怎么做

首先要说的就是Perplexity,一家对话式的搜索引擎,体验上可以说是完爆Google Bard和 Bing Chat。Perplexity。翻译为困惑度,是人工智能领域用来描述语言模型效果的一个常用指标,模型困惑度越小,说明模型越强大。Perplexity是一家只有14个员工的小型跨学科团队,但在产品力上可以说是完爆大厂,堪称more is more的典范。