【论文笔记】设计一款针对情境障碍的视力减弱型文件浏览应用程序(上)

论文关键点

ps:这篇文章可以学习的内容比较多,笔记内容也比较丰富因此本次论文笔记会分为上下期

提出的问题: 不方便视觉障碍的情况下(通勤、走路、眼睛疲劳也算)会用text-speech 系统,但是这种听觉是线性的,不适合skim

推导出了融合听觉和视觉阅读模式的“减少眼睛”略读的概念,灵感来自参与者如何混合视觉和非视觉交互,生成了一套减少眼睛的略读设计指南

对于视障情景存在的问题有比较完善的呈现


related work

SpeechSkimmer [6] 支持对录制的语音进行听觉略读,方法是根据停顿时间和非语音声音压缩停顿并构建音频结构。文字记录可作为音频内容的代理,用于视觉略读,并通过突出显示语音识别器输出中置信度高的单词来帮助发现关键词 [57, 59]。

近期的研究主要关注屏幕阅读器用户的非视觉略读。Ahmed 等人[2, 3]进行了一系列研究,通过自动总结多层次抽象文本来支持在线内容的略读。作者将他们的研究扩展到了触摸屏设备[4],并在 VoiceOver 默认手势的基础上设计了一套新颖的手势,如捏入和捏出,以控制摘要的层次。

Machulla 等人提出了针对 VI 人士的非视觉文档略读的设计含义[35]。他们建议支持文本宏观结构(如章节标题、段落、图表)之间的导航,改变音调或添加听觉刺激以强调微观结构(如突出显示的文本、粗体或斜体字),并支持动态语速。在我们的工作中,我们证明了这些用于 VI 环境的设计理念中的一些理念可以移植到 SI 环境中。

Needs Finding for auditory skimming

设计的场景

  • 必要的阅读任务,在时间限制中完成任务,而且尽可能不用眼睛阅读(乘车场景)

    我们让被试想象自己正在参加研究生水平的课程,并在当天晚些时候有一个班级的阅读任务,他们必须参加一个同伴讨论会议。为了促进讨论,他们在乘坐公共汽车上学的同时,应该在时间限制下浏览给定的阅读材料。为了加强模拟的SI(Situational Impairment),我们要求被试尽量减少对屏幕的视觉注意,假装否则他们可能会感到恶心。看屏幕被允许发布命令,但他们被指示在倾听时尽可能地向外看。

发现的问题与对应解决的设计原则

1.Non-linear navigation is hard:

  • Participants were in need of non-linear navigation features that leverage the semantic structure of a document (e.g., sentences, paragraphs)
  • +15s -15s 的时间跳跃是不可行的
  • 由于没有结构,一切听起来都很相似(难以区分重要程度?)

DG-1 列表跳转
目录-点击-跳转

DG-2 做一些语义和空间的navigation

  • 使用户能够利用有意义的单词和结构标记(例如,章节、段落)作为导航线索
  • 持话语标记语跳跃来促进略读,因为它们在视觉略读时也是重要的线索
    • Interactive markers: 管理信息流,作为读者的向导,e.g ‘finally’ ‘to conclude’
    • interactional markers: 传达作者对信息的观点,e.g:‘it is clear that’

DG - 7 提供听觉或触觉反馈作为非视觉导航线索
例如,可以在段落末尾和新段落开头之间进行听觉反馈,促使用户关注内容中的结构边界。

2.Listening and navigating at the same time is difficult.

听力和短时记忆正在争夺共享的认知资源(假设需要导航去找一些章节的内容的时候,如果声音还在继续播放,就会很痛苦)

DG-3 navigation的时候就停止播放

3.Some types of content are difficult to understand by listening.

(也许对于BLV来说这个问题不会那么明显)

4.Original layout better supports structural understanding

DG-6 减少书面化的语音输出,比如:

	1.把e.g转“即”
	
	2.长句分隔符
	
	3.去除叙述脚注和引文
	
	4.加入context:即将开始下一节

5.Dynamic speech rate control is needed but inaccessible.

DG-4 语速可调

6.There are individual differences in preferred reading order.

DG-10 Support individual differences in skimming strategies.

用户应该被允许预设一个自定义的阅读顺序,其中应用程序将自动访问文档元素。

7.Document formatting and article type impact comprehension.

DG-5 提供一个视觉指导符

explain:现在读到哪了(微信读书有)

DG-8. Support opt-in visual engagement.

我们的需求发现研究表明,当从主文切换到图/表字幕时,应该有选入过程的支持。此外,当系统讲述一个复杂的数字时,很难通过听力理解,系统应该在屏幕上提供放大的数字文本,以便于视觉访问。

DG-9. Support unimanual interactions.

单手操作支持

DG-11. Support annotation creation and consumption.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/569590.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Java技术学习|消息队列|初级RabbitMQ

学习材料声明 黑马RabbitMQ快速入门教程,快速掌握rabbitmq、springAMQP消息中间件 是非常初级的学习,听说后续的高级课程会涉及到微服务之类的,所以等学完微服务再回来学。还有redis的高级部分也涉及了微服务,所以也都暂时停止学…

OpenAI内部最受欢迎的10个GPTs推荐!建议收藏!

前面文章介绍了如何创建自己的GPTs,但是在应用商店里还有很多各种GPTs可以供我们使用,满足我们的各种应用场景。这就像手机的应用商店一样,我们除了可以自己编写应用程序之外,还可以使用使用应用商店里海量应用。有关创建自己的自…

YOLOv8 训练自己的数据集(20240423)

环境搭建请参考:Win10 搭建 YOLOv8 运行环境(20240423)-CSDN博客 环境测试请参考:本地运行测试 YOLOv8(20240423)-CSDN博客 一、使用 YOLOv8 的 coco128 数据集熟悉一下如何训练和预测 1.1、在项目根目录…

工厂提高OEE面临哪些挑战?

在工业生产中,提高设备的综合效率(OEE)是企业追求的目标之一。然而,实现高水平的OEE并非易事,工厂在这一过程中可能面临诸多挑战。本文将探讨工厂提高OEE所面临的挑战,并介绍PreMaint提供的解决方案。 提高…

【软件基础】反编译工具dnSpy反编译程序步骤

文章目录 一、dnSpy介绍二、使用版本三、使用步骤 一、dnSpy介绍 dnSpy是一款开源的.NET程序集反编译工具,它允许用户查看和编辑.NET程序集的源代码。dnSpy支持反编译.NET程序集、查看IL代码、编辑IL代码、调试.NET程序集等功能。用户可以使用dnSpy来分析和理解.NE…

【C语言__指针01__复习篇11】

目录 前言 一、什么是指针 二、计算机中常见的单位 三、CPU是怎样找到一块内存空间的 四、如何得到变量的地址 五、指针变量 六、解引用指针变量的作用 七、指针变量的大小 八、指针变量类型的意义 8.1 指针的解引用 8.2 指针-整数 九、void*指针 十、const修饰变…

国外问卷调查如何提高做题成功率?方法来了!

“为什么我做的题总是提交失败?” “做题太慢,收益太少,有什么做题技巧吗?” 以上这些问题,想必是新老玩家在问卷调查这条路上必定会遇到的,特别是新手遇到这类问题不知如何去处理,所以今天IPd…

el-popover放在el-table中点击无反应问题

我们想在table中给btn加弹框但是 el-popover点击按钮没有任何反应思考:通过插槽去添加这个组件el-popover的id是否绑定了一个值解决思路&#xff1a;给每个el-popover都加上单独的id 效果 &#xff1a; 代码 给每个组件都绑定ref <template slot-scope"scope"&g…

七星创客新零售系统:颠覆性商业模式的崛起

大家好&#xff0c;我是微三云周丽&#xff0c;今天给大家分析当下市场比较火爆的商业模式&#xff01; 小编今天跟大伙们分享什么是七星创客新零售系统&#xff1f; 随着经济的快速发展和科技的不断进步&#xff0c;商业模式的革新成为了企业发展的关键。在这个新旧动能转换、…

使用表格法插入公式和编号

如何将公式和编号优雅地插入到论文当中呢&#xff1f; 首先插入一个1行2列的表格 调整一下 输入公式方法一&#xff1a;感觉墨迹公式挺好用的&#xff0c;word自带的 输入公式方法二&#xff1a;图片转LATEX代码 这个方法更快 分享一个公式识别网站 图片识别得到LATEX代码&…

2024 初级信息处理技术员历史真题整理分享

2024 初级信息处理技术员历史真题整理分享 最近软考报名结束了&#xff0c;马上五月份就要考试&#xff0c;想必很多人都在迎战软考吧。 在此我分享一下我整理的一些软考&#xff08;初级信息处理技术员&#xff09;历史真题&#xff0c;供大家学习 历年真题 说明&#xff1a…

Windows本地部署Ollama+qwen本地大语言模型Web交互界面并实现公网访问

文章目录 前言1. 运行Ollama2. 安装Open WebUI2.1 在Windows系统安装Docker2.2 使用Docker部署Open WebUI 3. 安装内网穿透工具4. 创建固定公网地址 前言 本文主要介绍如何在Windows系统快速部署Ollama开源大语言模型运行工具&#xff0c;并安装Open WebUI结合cpolar内网穿透软…

汽车纵染压制专用液压机比例阀放大器

汽车纵染压制专用液压机比例阀放大器是一种专门用于汽车纵梁拉伸工艺的设备&#xff0c;它也可以用于其他金属薄板的压制成型及校正工艺。该类型的液压机通常具备独立的动力机构和电气系统&#xff0c;采用PLC技术进行控制&#xff0c;以确保操作的准确性和稳定性。除了纵梁拉伸…

什么是云专线

云专线是一种企业连接公共云服务提供商&#xff08;如亚马逊AWS、微软Azure、谷歌云等&#xff09;的专用网络连接服务。它是一种私有网络连接&#xff0c;主要目的是提供更可靠、更安全、更高性能的连接&#xff0c;以满足企业对云服务的需求&#xff0c;特别是需要大量数据传…

981: 统计利用二叉树存储的森林中树的棵数

解法&#xff1a; 在数据结构中&#xff0c;森林&#xff08;Forest&#xff09;是一组互不相交的树的集合&#xff0c;而二叉树&#xff08;Binary Tree&#xff09;是每个节点最多只有两个子节点的树。下面介绍如何在森林和二叉树之间进行转换。 森林转换为二叉树&#xff1…

页面分页打印,echarts图解决办法;生成PDF

1&#xff1a;echarts图片前端打印不是很完美&#xff0c;对于VUE2.0版本不是很有好 2&#xff1a;360浏览器不支持vue的最新版本的插件vue3-print-nb 3&#xff1a;vue-print-nb 可以打印带有echarts 一页内容&#xff0c;并且还存在bug&#xff0c;第一次点击打印没有&…

用于车载T-BOX汽车级的RA8900CE

用于车载T-BOX等高精度计时的汽车级时钟模块RTC:RA8900CE.车载实时时钟芯片RA8900CE内置32.768Khz的晶体&#xff0c;实现年、月、日、星期、小时、分钟和秒精准计时。RA8900CE满足AEC-Q200认证&#xff0c;内置温补功能&#xff0c;保证实时时钟的稳定可靠&#xff0c;功耗低至…

X86与FPGA相结合,基于PIB的AI开发——人体姿态识别

人体姿态估计是计算机视觉领域中用于理解和分析人类行为的一个关键技术。它主要涉及到检测和识别图像或视频中人体的各个关键点&#xff0c;并预测这些关键点之间的空间关系&#xff0c;从而构建出人体的骨架模型。 本文将介绍基于PIB板的人体姿态估计案例。这是一个交互式的实…

CentOS-7部署mysql、clickhouse并通过普罗米修斯、grafna监控告警

一、准备工作 1、系统环境 所用镜像&#xff1a;CentOS-7-x86_64-DVD-2009.iso 2、涉及安装包 3、克隆4台虚拟机 用途IP主机名Prometneus服务器192.168.15.129master被监控服务器1192.168.15.133node1mysql、clickhouse、grafana服务器192.168.15.134node2被监控服务器219…

19 Debian如何配置DNS服务(1)缓存服务器

作者&#xff1a;网络傅老师 特别提示&#xff1a;未经作者允许&#xff0c;不得转载任何内容。违者必究&#xff01; Debian如何配置DNS服务&#xff08;1&#xff09;缓存服务器 《傅老师Debian小知识库系列之19》——原创 前言 傅老师Debian小知识库特点&#xff1a; 1、…
最新文章