hcir什么意思
Human–computer information retrieval意思是人机信息检索(hcir)
人机信息检索(HCIR)是将人类智能引入搜索过程的信息检索技术的研究和工程。它结合了人机交互(HCI)和信息检索(IR)领域,并创建了通过考虑人类上下文或通过提供人类反馈机会的多步骤搜索过程来改进搜索的系统。
人机信息检索这个术语是由Gary Marchionini在2004年至2006年的一系列讲座中创造的Marchionini的主要论点是“HCIR旨在使人们能够探索大规模的信息库,但也要求人们通过消耗认知和体力来对这种控制负责。”
1996年和1998年,格拉斯哥大学举办了两场关于信息检索和人机交互的研讨会,试图解决这两个领域之间的重叠问题。Marchionini注意到万维网的影响和信息素养的突然提高——这些变化在20世纪90年代末才刚刚萌芽。
gary事件是什么一些研讨会关注IR和HCI的交集。探索性搜索研讨会,由马里兰大学人机交互实验室于2005年发起,在计算机协会信息检索特别兴趣小组(SIGIR)和人机交互特别兴趣小组(CHI)会议之
间轮流举行。同样在2005年,欧洲科学基金会举办了一个关于上下文信息检索的探索性研讨会。2007年,第一次人机信息检索研讨会在麻省理工学院举行。
HCIR包括IR和HCI的各个方面。其中包括探索性搜索,用户通常将查询和浏览策略结合起来,以促进学习和调查;上下文中的信息检索(即,考虑用户或环境的方面,通常不反映在查询中);交互式信息检索,Peter Ingwersen将其定义为“在信息检索过程中,通过涉及信息检索(IR)的所有主要参与者(即用户、中介和IR系统)而发生的交互式通信过程。”[2]
HCIR关注的一个关键问题是,面向人类用户的IR系统应以反映这些用户需求的方式实现和评估
大多数现代IR系统采用排序检索模型,其中根据文档与查询的相关性概率对文档进行评分在这个模型中,系统只向用户显示排名靠前的文档。这些系统通常是基于文本检索会议(TREC)等组织提供的一组基准查询的平均精度进行评估的。
由于HCIR强调在信息检索过程中使用人类智能,因此需要不同的评估模型-一个将系统的IR和HCI组件的评估相结合的模型。HCIR研究的一个关键领域涉及这些系统的评估。交互
式信息检索的早期工作,如Juergen Koenemann和Nicholas J. Belkin在1996年对自动查询重新制定的不同交互级别的研究,利用了精度和召回率的标准IR测量,但将它们应用于多次用户交互迭代的结果,而不是单一的查询响应其他HCIR研究,如Pia Borlund的IIR评估模型,应用了一种更容易让人联想到HCI的方法,关注用户的特征,实验设计的细节等。
HCIR研究人员提出了以下目标,以建立一个用户在确定相关结果方面有更多控制权的系统
●不再只是交付相关的文档,还必须提供语义信息以及这些文档
●增加用户责任和控制;也就是说,信息系统需要人类的智力努力
●拥有灵活的架构,以便它们能够不断发展并适应要求越来越高、知识越来越丰富的用户
●目标是成为个人和共享记忆和工具的信息生态的一部分,而不是离散的独立服务
●支持整个信息生命周期(从创建到保存),而不仅仅是传播或使用阶段
●支持终端用户,特别是为信息资源增加价值的信息专业人员进行调优
●要吸引人,使用起来要有趣
简而言之,信息检索系统应该像好的图书馆那样运作。系统应该帮助用户弥合数据或信息(在这些术语的非常狭窄的、粒度的意义上)和知识(为信息查过程的下一次迭代提供必要上下文的经过处理的数据或信息)之间的差距。也就是说,好的图书馆既提供读者需要的信息,也提供学习过程中的合作伙伴——信息专业人员——来浏览这些信息,理解它们,保存它们,并将其转化为知识(这反过来又创造了新的、更明智的信息需求)。
与HCIR相关的技术强调使用人类智能将用户引向相关结果的信息表示。这些技术还努力让用户能够探索和消化数据集,而不受惩罚,也就是说,不需要花费不必要的时间、鼠标点击或上下文转移成本。
许多搜索引擎都有包含HCIR技术的特性。拼写建议和自动查询重新表述提供了建议潜在搜索路径的机制,可以引导用户到相关结果。这些建议被呈现给用户,将选择和解释的控制权交到用户手中。
分面搜索使用户能够按层次结构导航信息,从一个类别到它的子类别,但可以选择类别显示的顺序。这与传统的分类法形成了鲜明的对比,在传统的分类法中,类别的层次结构是固定不变的。分面导航,像分类法导航一样,通过向用户显示可用的类别(或方面)来指导用
户,但不要求他们浏览可能不完全适合他们的需求或思维方式的层次结构
前瞻提供了一种无惩罚探索的一般方法。例如,各种web应用程序使用AJAX来自动完成查询项并建议流行搜索。前瞻的另一个常见示例是搜索引擎用关于这些结果的摘要信息注释结果的方式,包括静态信息(例如,关于对象的元数据)和与搜索查询中的单词最相关的文档文本“片段”。
相关性反馈允许用户通过指示特定结果是否更相关或更不相关来指导IR系统
摘要和分析帮助用户消化从查询中返回的结果。这里的摘要旨在包括将查询结果聚合或压缩为更适合人类使用的形式的任何方法。上面描述的分面搜索就是这样一种形式的摘要。另一种是聚类,它通过对相似或共同出现的文档或术语进行分组来分析一组文档。聚类允许将结果划分为相关文档的组。例如,搜索“java”可能返回java(编程语言)、java(岛)或java(咖啡)的集。
数据的可视化表示也被认为是HCIR的一个关键方面。摘要或分析的表示可以显示为汇总数据的表格、图表或摘要。允许用户访问搜索结果的摘要视图的其他类型的信息可视化包括标签云和树映射。
发布评论