曾经,很多人以为,ChatGPT的横空出世,就几乎等于敲响搜索的丧钟。
这样的说法在当时不在少数。按前谷歌第23位员工、Gmail的创建者之一Paul Buchheit的说法,ChatGPT将摧毁谷歌,就像当年搜索引擎彻底干掉黄页电话簿一样。
一年时间过去了,AI大模型替代搜索的进程,远没有大家想象的那般顺利。但一切并非毫无意义。随着Perplexity等AI搜索产品的涌现,也让我们对AI给搜索行业带来的变化有了更加清晰的认识:
首先,与传统搜索引擎相比,AI搜索让信息的颗粒度从网页细化到信息本身,进而提升了信息获取的效率。这是AI搜索最大的价值。
其次,作为一款AI套壳产品,像Perplexity等产品的成功在于,实现了单点的价值创造和体验优化,更是一次AI工程化层面的胜利。
第三,像Perplexity这样的AI搜索,目前更多集中在知识等小众领域,距离替代谷歌成为通用搜索引擎仍然有很长的距离要走。
尽管当下AI搜索替代谷歌几无可能,但长期并非毫无可能。从过去科技的演进看,新技术对老技术的替代,往往是以意想不到的颠覆形式完成的。正如谁能想到如今拥有上亿用户的快手,当初只是一个做GIF的工具。变化与未知,就是新技术的魅力。
01 比搜索更精准是如何做到的?
在AI搜索的赛道,Perplexity 是绝对的明星。公司创始人Aravind Srinivas来自OpenAI,2022 年 8 月创立了 Perplexity。2023年10月,公司完成了新一轮融资,估值达到 5 亿美元。
与其说,Perplexity是一个搜索引擎,倒不如说是答案引擎。当用户向Perplexity输入问题并点击搜索后,你能得到一个回答。比如,当你向Perplexity提问“蜡笔小新是谁”,会得到Perplexity的相应回答。
这个答案是通过网上已有的信息总结提炼而来。在回答栏目的上方,Perplexity还会给出参考内容的来源,并支持点击。在回答的下方,Perplexity预测了几个用户可能会追问的问题,点击后页面继续向下展开对于该问题的答案,用户也可以自行进行提问。
此外,在回答栏目的侧边,用户还可以搜索相关主题的图片和视频。
Perplexity不仅能够回答简单问题,还能理解用户一些比较复杂的问题,比如当用户就“生成式AI与过去的AI相比有哪些不同和特点”进行提问时,Perplexity也能进行回答。
但不足的地方是,在“生成式AI与过去的AI相比有哪些不同和特点”问题来说,Perplexity推荐的视频和主题关系并不大。也就是说,在复杂问题从文字向更多模态转化过程中,搜索内容的效率有比较大的下降。
看上去,AI搜索更像是传统搜索引擎的一次升级,即从过去的单边的信息查询和SEO策略优化,转变成双边的信息交互。
过去的传统搜索引擎的工作流程是,基于用户搜索的内容,对相关内容进行索引并创建搜索索引,所谓的索引,可以理解为内容过滤后,一个与搜索内容有关,且包含页面及其内容和排名信息的数据库。然后再对索引中的页面使用各种算法进行排名,进而给出搜索结果。
相比之下,Perplexity比搜索引擎额外多做了几件事。在搜索前,Perplexity会通过大模型,重新理解用户提出的问题,然后解析为一个更清晰的搜索指令。接下来,调用Google、Bing等搜索引擎的API创建相应的索引库,然后用自有的排序算法,对所有的搜索结果做重新排序,筛选出数量不等且高质量的网页。最后,让大模型阅读筛选出来的内容并输出和问题相关的答案,以及可能用到的问题。
也就是说,相比搜索引擎做的是信息相关度的匹配,而Perplexity是在此基础上做了更多理解指令上的工作,进而让搜索结果更接近用户想要的东西。
搜索效率升级的背后,是搜索颗粒度的细化。在互联网时代,搜索引擎将信息以网页为最小粒度为用户进行排序和推荐。而大模型能够学习所有 Google上能得到的信息,并将知识以词汇为最小粒度生成相应的内容。
02 Perplexity破局的启示
听起来,Perplexity所做的事情很简单,就是在原有搜索引擎基础上加入了大模型的自然语言理解和生成丰富回答能力。那么,是不是意味着所有大模型企业也可以做?
其实并非如此。曾经在很多人看来,生成式 AI 可能会取代传统搜索引擎,但用大模型直接进行搜索也会出现很多问题。
比方说,生成式AI无法做到实时更新,且受限于训练数据,可能无法覆盖相对小众、缺乏通用性的长尾知识。同时,生成式AI对生成内容的可控性较差,存在“幻觉”问题,用户也难以对答案进行直接验证。
Perplexity所做的事情就是,把这些大模型搜索过程中出现的“坑”一个个都填掉,其中最重要的事情就是信息的实时性和准确性。
实时性方面,与ChatGPT等大模型依赖训练时的数据和语料获取信息不同,Perplexity基于底层传统搜索引擎开发而得,能够及时抓取最新的信息。
准确性方面,Perplexity做了两件事情:减轻幻觉和内容溯源。为了减少幻觉现象,Perplexity引入了RAG技术(检索增强生成),RAG的作用好比是给模型提供一本教科书,让它根据特定的问题去查找信息,通过关联外部知识来提高答案的准确性,有效减少了语言模型中出现的虚假信息,使得生成的回答更准确可信。
与此同时,Perplexity还对生成的每一句话都附有引用链接,在保证可靠性的同时便于用户溯源或深入研究。
不仅如此,Perplexity还对召回和排序环节的算法做了创新,保证内容的有用性及引用的精确程度。其中,“召回”指根据搜索指令从数据库中获取尽可能多的正确结果,“排序”指根据用户搜索内容的相关性对召回结果进行排序,决定了搜索引擎的精确程度和性能上限。
来源:中金研究部
这也让Perplexity成为当下综合性能最好的AI搜索引擎。在2023年4月的论文中,斯坦福的研究人员对YouChat、Perplexity.AI、NeevaAI及BingChat四个生成式搜索引擎进行了人工评估。结果显示,Perplexity.ai生成内容有用性的评分为4.56分,排名第二;引文召回率和精确度为68.7,排名第一;在泛搜索引擎类的体验中,综合能力位于最前列。
除了在信息准确、可靠上,Perplexity在响应速度上也花了很多功夫。比如,Perplexity通过自研推理堆栈,让其内容生成速度快于GPT类通用模型。在模型侧,公司对GPT-3.5进行微调,在降低成本的同时进一步提升响应速度。
Perplexity的成功,也给了那些苦苦探索AI大模型落地的创业者一些启示:比起模型能力,产品本身单点的价值创造和体验的优化,是一个更为重要的事情。
03 替代谷歌言之过早
从数据上看,自产品发布以来,Perplexity的成绩着实不错。
根据Similar Web数据,截至2023年10月25日,Perplexity APP的日度下载量为14,163次;2023年2月1日至10月25日,Perplexity网页端的周度访问量由275万增加至1,113万,增长3倍,与同类别的AI搜索应用YouChat相比增长势头强劲。
尽管Perplexity的表现足够优秀,但距离真正替代谷歌等传统搜索引擎还有很长的距离。从定位上看,当下的Perplexity更像一个知识平台,用户对其需求大都集中在知识领域,定位类似于AI时代的Wikipedia 和 Quora。
从Perplexity后续的更新动作上,也不难看出这一点。比如,Perplexity正在尝试以知识分享为核心,创建相关的内容社群生态,Perplexity支持用户将搜索问题及答案分享至社区,供其他用户学习讨论。
之所以Perplexity选择以知识平台为切入点,主要基于两点考虑:
一是RAG技术更擅长在开放域知识问答及生成式问答中发挥作用。Meta的技术论文对RAG技术进行了详细测评,包括开放域问答、开放域问题生成、抽取式问答及分类推理任务。在开放域问答中,RAG-Token和RAG-Seq得分处于领先地位;在生成任务和分类任务中,RAG表现优于BART模型。
二是谷歌在消费、地图上积累了大量的数据,这让Perplexity在生活/购物等更高频的场景没有任何优势,很难实现场景的泛化。
以知识平台为目标,固然让Perplexity找到了差异化的方向。但同时也意味着,Perplexity短期内很难成为一款低门槛的大众化互联网产品,至于替代谷歌更是无从谈起。
不仅如此,与大多数AI创业公司一样,Perplexity并没有形成可持续的商业模式。目前,Perplexity的变现方式主要有两个:会员订阅和API调用,但尚未形成规模化收入。
虽然收入没起来,但支出却一点都不少。根据中金测算,目前Perplexity调用Bing搜索引擎及GPT-4的单个问题成本约为0.03美元,年成本约为6000万美元,这还不包括后续Perplexity自研模型所产生的成本。
从过去看,搜索向来是个马太效应极其明显的市场。尽管用户对百度诟病颇多,也不影响百度在中国搜索引擎的市占率超过7成。如果用当下的视角理解产品技术演进的结果,Perplexity似乎没有任何机会。
但这事好就好在,新技术对老技术的替代,往往是以颠覆的形式出现的,甚至老玩家固有的“习惯”还会成为其迭代的最大障碍。就拿搜索这事来说,AI搜索直接给出关键信息的交互方向,天然与谷歌现有竞价排名的商业模式相背离。
如何取舍对谷歌来说是一个难题,而对Perplexity来说则是一个机会。从这个角度来说,Perplexity替代谷歌固然言之过早,但也未必没有可能。
免责声明:本文(报告)基于已公开的资料信息或受访人提供的信息撰写,但读懂财经及文章作者不保证该等信息资料的完整性、准确性。在任何情况下,本文(报告)中的信息或所表述的意见均不构成对任何人的投资建议。