作者:长风云Drupal开发
本文将分析在Drupal中,如何利用上下文或 “情境” 来进一步改善搜索结果。
传统的网站设计思路是构建一个面向所有受众的单一站点。这类站点是静态的,无法根据用户上下文动态调整。这种方式类似于不考虑市场情境的交易策略,其结果往往难以达到最优。通过识别受众群体并创建优化的网站浏览路径,可提升用户体验。用户能够通过导航自主选择进入对应的上下文场景。这种方式无需基于用户画像进行复杂计算,就能缓解站点静态化带来的局限。更复杂的方案包括实现内容个性化和内容推荐功能,为用户推送适配其需求的动态内容。这些方法充分利用用户上下文,能够显著提升用户体验。多年来,我们在 Morpht 博客中已就这些主题发表了大量文章。本文将把这些理念延伸到搜索结果的交付领域。
一、金融领域的情境
在金融领域,“情境” 概念被用于优化初始模型的预测效果。了解市场背景(如波动性、市场趋势等)有助于模型根据当前市场状况优化信号。一种简单的做法是针对牛市 / 熊市、平稳 / 波动市场设计不同情境。更全面的情境设定可能包含多个基于情境的特征,帮助模型做出更精准的预测。这些情境特征会与资产特征相结合,为预测提供更完整的参考依据。在金融领域,情境的应用方式包括:
采用简单筛选器排除特定资产
将单个情境特征纳入主模型的特征变量
通过元标记将情境及结果应用于次级模型
涉及情境特征的条件组合优化
其他多种应用方式
简而言之,情境在交易策略中至关重要,它能帮助策略根据当前环境提升效果。市场环境会不断变化,策略的有效性也会随之改变。某一天盈利的策略,次日可能就失效了。而情境分析能有效应对这一问题。
二、“情境” 对搜索意味着什么?
哪些上下文信息可用于改善搜索结果?在之前的文章中,我曾详细分析过构成搜索相关性的各个要素。搜索不仅与关键词相关,还与用户所处的上下文环境密切相关。这包括搜索历史、浏览行为、时间以及内容含义等多个方面。这些相关性因素在很大程度上可视为一种 “情境”,需要用于调整搜索结果。每位用户都是独特的,拥有不同的兴趣爱好。这些兴趣构成了搜索所处的 “情境”。搜索结果的有效性取决于用户身份及其兴趣点。根据兴趣调整后的搜索结果,假阳性会更少,用户满意度也会更高。
三、如何确定用户兴趣?
显性情境:维度筛选与过滤
了解用户兴趣最直接的方式是主动询问。虽然不一定能得到明确答案,但这种方式传递信息快速,且大多与具体上下文相关。传统搜索仅基于关键词,无法获取用户上下文。在这种情况下,用户可通过选择筛选条件和维度分类重新定义搜索结果,从而确定上下文。维度化界面的应用曾展现出巨大潜力。设计精良的维度分类能从不同角度拆分大量数据,帮助用户通过筛选找到所需结果。常见的维度包括 “受众群体”(用户自主选择对应角色)和 “主题”(用户明确自身兴趣领域)。这两个维度是划分内容的有效方式。这种方式的优势在于用户可保持匿名性并掌控搜索过程,维度化搜索能提升结果准确性。但它也存在不足之处:
界面配置需要投入精力
内容仅按有限维度划分,可能忽略细微差异
内容检索仍主要依赖关键词搜索
现代搜索领域中,用户对结果的掌控权正不断提升。谷歌近期宣布将允许用户指定偏好的新闻来源,这一显性选择结果集的功能是搜索领域的重要进展。用户通过明确配置所需内容,获得了更多主动权。
隐性情境:用户行为
当前用户的行为会形成一种 “情境” 或上下文。要获取这种 “情境”,需要对用户行为进行追踪。用户每交互一个项目,系统都需为该用户记录一次事件。这种行为追踪通过分析软件、个性化引擎和客户数据平台(CDP)实现。这些系统都能根据用户行为构建用户画像。过往行为数据可用于描绘用户特征,个性化引擎正是利用这种隐性情境的典型案例。实际上,个性化引擎能通过用户行为构建一个概念性的用户 “画像”(向量形式),再将该画像与返回结果进行比对,剔除不相关内容。也就是说,用户画像作为一种情境,能提升搜索结果的准确性和用户体验。搜索引擎早已开始利用用户行为数据,例如追踪页面浏览量和链接点击情况。谷歌是这一领域的先驱。在 SaaS 搜索领域,更先进的搜索引擎也开始重视用户行为。例如,Sajari(已被 Algolia 收购)曾通过这种方式调整搜索结果,如今 Algolia 也提供了类似功能。Recombee 等个性化引擎也能利用用户行为,根据不同场景和查询需求定制结果。然而,Drupal 等内容管理系统(CMS)目前难以直接应用这种用户行为分析。网页服务器通常位于 CDN 之后,且大多没有跨会话持续存在的内置用户 ID 机制。用户大多处于匿名状态,应用程序无法识别。这种机制保护了用户隐私,但也导致难以提供更精准的搜索结果,这是实现个性化体验的主要障碍。目前的解决方案通常是采用 SaaS 服务提供商,由其在外部平台处理复杂的技术问题。CMS 提供商仍有机会解决这一问题,但这不仅涉及数据收集,还需要算法和数据处理能力的支撑。因此,SaaS 解决方案在这方面仍具有吸引力。
语义搜索:向量数据库与嵌入技术
如今,用户对搜索界面的要求更加复杂和自然。近年来,用户行为发生了多方面变化:
不再刻意设计特定关键词,更倾向于基于概念而非词汇搜索
查询内容更可能是完整问题,而非 “标题式” 短语
聊天式和对话式界面日益普及
搜索结果页面需直接提供答案,而非仅展示相关项目
因此,向量数据库的应用越来越广泛,它开启了新的交互方式和商业模式,使内容能够在语义层面被理解。内容会被转换为嵌入向量,搜索查询随后可与这些向量进行匹配。从概念上讲,用户画像可转换为向量,该向量能用于匹配用户与相关内容。先进的搜索引擎可利用用户画像进一步调整搜索结果。
四、提示词工程
还有一种更直接的结果定制方式 —— 通过提示词实现。无需在后端传递向量,可通过提示词收集用户请求,并加入调整条件来定制请求。近期,GPT-5 的提示词被泄露。从中我们可以发现,系统提示词会利用约束规则和基于角色的调整来优化响应。这一发现或许不算突破性,但它展示了如何通过提示词调整返回结果,实际上是将情境引入查询过程。我们可利用这一思路设计更优的提示词,例如纳入用户兴趣或上下文信息。以 Morpht 创建的演示网站 GovFlix 为例进行实验:在发送请求时传入用户 “受众身份”。尝试在聊天机器人中输入以下查询:
我是 UX 设计专业人士,政府在网站建设中面临哪些挑战?
我是安全专业人士,政府在网站建设中面临哪些挑战?
我是编辑,政府在网站建设中面临哪些挑战?
你会发现,返回的结果虽有相似之处,但会根据所提供的受众身份有所差异。由于匹配结果数量有限,差异可能不太明显,但返回内容确实存在不同。这一发现为搜索交互的便捷个性化提供了可能。如果客户端系统能为用户分配对应角色,并可能加入兴趣标签,就能调整搜索结果。这无需在外部系统中追踪用户行为,就能实现更优的用户体验。也就是说,可通过提示词传入上下文信息,无需修改核心语义搜索技术。举一个更具体的例子:可利用 Convivial Profiler 等工具确定当前用户的受众身份,再将其作为提示词的一部分传入,从而调整搜索查询。更广泛地说,聊天机器人解决方案将越来越多地通过追踪历史对话来构建用户画像,更精准地挖掘用户意图。通过分析用户的对话历史来获取用户上下文,可能比观察页面浏览行为更直接有效。这表明,对话式界面有望成为用户与网站交互的默认方式。
五、总结思考
本文基于 “减少假阳性结果有助于提升用户体验” 这一前提展开。在主模型和次级(元标记)模型中应用 “情境”,能根据该情境获得更优结果。传统的通过维度分类和过滤调整响应的方式虽有效,但需要用户主动操作。如今,这些方式正逐渐被用户画像、嵌入技术和提示词调整所取代,以实现更精准的个性化用户体验。Drupal 等内容管理系统通过 Search API 集成模块,成功利用了 MySQL 和 Solr 等后端技术。在过去十多年里,这为 Drupal 提供了稳定的搜索解决方案。如今,Drupal 继续创新,推出了 Drupal AI 计划,将语义搜索后端纳入其中。这一举措有望突破关键词搜索模型的局限,显著提升搜索结果质量。但在此过程中,可能会失去一些原有功能,如维度筛选和时效性加权。因此,需要根据实际需求选择合适的技术。Drupal 的下一个合理发展方向是将用户行为纳入结果调整过程。但这是一个复杂的领域,因为挑战不仅涉及内容本身。如前文所述,相关性的定义还涉及许多其他因素。未来需要针对返回内容的不同场景进行考量,每个结果集都需结合用户期望的上下文环境。对相关性的深入理解,需要此类更细致的方法支持。这种复杂性要求我们更深入地理解搜索问题,而在这方面,SaaS 解决方案可能仍将保持优势。通用工具能否提供所需功能?语义搜索功能的加入是迈向未来的重要一步,纳入用户行为则是下一步关键。这需要算法的改进,以及根据上下文提供最优结果的更细致方法。最有可能的结果是,聊天机器人和对话式界面将继续崛起并占据主导地位。语义搜索系统能整合大量内容,以更便捷的方式呈现给用户。利用聊天历史作为上下文的强大优势,将使其取代传统搜索的主导地位。作为情境的用户上下文,将极大地提升搜索体验,使传统搜索在大多数使用场景中显得相形见绌。提供更优质的搜索界面,对网站所有者来说是巨大的机遇,有助于充分利用宝贵的内容资源。为了与同样索引了这些内容的外部系统竞争,网站必须提升用户体验。
                    
