IT之家 10 月 28 日报道,自从谷歌去年推出饱受批评的“AI 概述”功能以来,公众已经意识到人工智能驱动的搜索结果与搜索引擎数十年来提供的传统链接列表有很大不同。现在,一项新研究量化了这种差异,并揭示人工智能搜索引擎倾向于引用流量较低、甚至难以出现在传统 Google 搜索结果前 100 名的网站。 IT House 指出,波鸿鲁尔大学和马克斯普朗克软件系统研究所的研究人员将传统的 Google 搜索结果与 AI Overview 和 Gemini 2.5-Flash 进行了比较,并将其纳入了题为“表征生成 AI 时代的网络搜索”的预印本论文中。 GPT-4o网络搜索模式和“带有搜索工具的GPT-4o性能”(即仅当大规模语言模型确定需要外部信息时才调用网络搜索)。研究人员进行了测试 queri来自多个来源的信息,包括用户在 WildChat 数据集中向 ChatGPT 提出的具体问题、AllSides 平台上列出的政治问题以及亚马逊上搜索次数最多的 100 个产品。研究发现,根据域名爬虫 Tranco 的测量,生成式 AI 搜索工具往往会搜索不如传统搜索中排名前 10 的网站那么受欢迎的网站。与传统 Google 搜索结果中的链接相比,AI 引擎引用的网站更有可能位于 Tranco 全球排名前 1,000 或 1,000,000 个域名之外。在双子座的追求中尤其如此。引用来源的平均排名在 Tranco 的前 1,000 名之外,表明严重依赖不太常见的网站来源。此外,人工智能搜索引擎引用的内容通常在相同关键词的传统谷歌搜索结果中排名较低。例如,Google AI 概述中引用的来源中有 53% 没有出现在传统 Google 搜索的前 10 个结果中。r 相应的查询。 40%的来源甚至没有排在前100名之内。当然,这些差异并不一定意味着人工智能产生的结果是“糟糕的”。研究表明,基于 GPT 的搜索更有可能引用公司官方网站和百科全书网站作为信息来源,而很少引用社交媒体内容。基于大规模语言模型scala的分析工具显示,人工智能搜索结果中涵盖的可辨别“概念”数量与传统搜索结果的前10名相当,表明两者在信息细节、多样性和新颖性方面具有可比性。然而,研究人员还指出,“生成引擎倾向于压缩信息,有时会忽略传统搜索结果中保留的次要或模糊的内容。”当我们面临不明确的搜索词(例如多个名人共用的名字)时尤其如此。在这种情况下,“传统搜索结果将提供更多信息”另一方面,AI搜索引擎也有优势。你可以将之前训练获得的“内幕知识”与参考网页的信息结合起来。尤其是GP Placement Search ToolT-4o。这种模式往往不提供外部参考链接,直接根据自己的训练数据提供答案。但是,这种对预先训练数据的依赖在查询紧急信息时也可能是一个缺点。研究人员测试了Google的实时趋势搜索 9 月 15 日关键词,发现带有搜索工具的 GPT-4o 经常回答诸如“你能告诉我更多吗?”之类的问题。而不是主动去寻找最新的网络信息。尽管研究人员并没有得出结论性地判断人工智能搜索引擎总体上优于或劣于传统搜索链接,但确实需要考虑信息来源的多样性、概念的广度以及整合能力等因素。他强调需要综合考虑以下问题,并强调未来需要加强对生成搜索系统评价方法的研究。
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由网易号用户上传发布,网易号是一个仅提供信息存储服务的社交媒体平台。