关闭

如何让搜索结果更符合用户需求

发表于:2014-9-29 10:56

字体: | 上一篇 | 下一篇 | 我要投稿

 作者:传奇草原    来源:51Testing软件测试网采编

  2.2 需求的满足
  识别出query有哪些需求,下一步的工作就是提供相应的资源。
  2.2.1 资源的挖掘
  如何获得满足需求的资源,是需求满足的另一个核心问题。在资源上,通过某一个或者几个特征组合,能够把满足要求的资源和不满足要求的资源区分开,找到用户需求需要的资源,去掉不满足要求的资源,是主要的工作。
  内容属性特征
  对内容属性维度来说,可以分为底层的物理特征,中层的物体识别和高层的语义特征。
  对于底层的物理特征,相对比较简单,包括尺寸,颜色,格式,清晰度饱和度等,中层特征,有人与非人的,色情图片的,整车的识别,手机图片的识别等;对于高层的语义特征,包括场景的识别,图片风格的识别,情感的识别,比如是室内还是室外,是否非主流风格等,都可以作为资源筛选的特征。
  话题属性维度
  话题属性维度,是指动物,植物,帅哥,美女,军事,体育等等各种不同的话题,我们希望把图片能按照这样一个分类进行一个划分。
  比如,通过这个分类,我们可以知道哪些图片是头像类的,哪些是壁纸的,哪些是足球体育相关的。用户在搜索“章鱼 保罗”时,可以推荐足球相关的资源。
  时效性资源的收录
  时效性资源,可以很容易的通过收录时间来判断,和非时效性资源区分开。时效性资源的来源一般包括新闻站点,各大论坛,bbs等社区类网站。
  2.2.2 需求调权
  明确了query的需求,挖掘了满足需求的资源,那么如何把满足需求的资源rank到前端呢?
  对于各种不同的需求维度,都有自己的调权的策略。比如“章鱼 保罗 壁纸”,我们识别出有尺寸方面的需求,那么可以把尺寸比较大的图片,进行加权;又比如时效性的需求,可以直接在前三页插入的时效性库的结果,这是因为时效性需求是一个强需求维度,简单的加权,不能保证结果调整到前三页。
  目前这种策略直接叠加的调权方式,优点是简单,直接,缺点也比较多,最大的是不可控,一个维度上的调权,会对最后结果造成多大的影响,他说的话分量有多大,不知道。
  三、结语
  对于需求满足未来,要向智能化,自动化,多样化的方向持续发展。我们最终的目标是把需求满足这个方向做没了,需求挖掘,资源满足全部自动化,做到“手中无剑 心中有剑”。
22/2<12
《2023软件测试行业现状调查报告》独家发布~

关注51Testing

联系我们

快捷面板 站点地图 联系我们 广告服务 关于我们 站长统计 发展历程

法律顾问:上海兰迪律师事务所 项棋律师
版权所有 上海博为峰软件技术股份有限公司 Copyright©51testing.com 2003-2024
投诉及意见反馈:webmaster@51testing.com; 业务联系:service@51testing.com 021-64471599-8017

沪ICP备05003035号

沪公网安备 31010102002173号