分类
未分类

读书笔记——《数据可视化》01

第1章 数据可视化简介

1.1 可视化释义

人眼:“人眼是一个高带宽的巨量视觉信号输入并行处理器,最高带宽为100MB/s,具有很强的模式识别能力,对可视符号的感知速度比数字或文本快多个数量级,大量视觉信息的处理发生在潜意识阶段。”(P2)

可视化:Visualize和Visualization。Visualize “生成符合人类感知”的图像。Visualization,“使某事、某物可见的动作或事实”;对某个原本不可见的事物在人脑中形成一幅可感知的心理图片的过程或能力。利用人眼的感知能力对数据进行交互的可视表达及增强认知的技术,称为可视化。它将不可见或难以直接显示的数据转化为可感知的图形、符号、颜色、纹理等,增强数据识别效率,传递有效信息。(P2)

可视化是认知的过程,即形成某个物体的感知图像,强化认知理解。可视化的终极目的是对事物规律的洞悉,而非所绘制的可视化结果本身。(P3)

可视化的三个功能:信息记录、支持对信息的推理和分析、信息传播和协同(P4-P6)

可视化能显著提高分析信息的效率,其重要原因是扩充了人脑的记忆,帮助人脑形象地理解和分析所面临的任务。(P5)

1.2 可视化简史(P8-P22)

  • 17世纪前:图表萌芽 地图、城市交通图
  • 1600-1699:物理测量 太阳黑子(邮票图表法)风场分布(向量可视化)
  • 1700-1799:图形符号 地球等磁线可视化、三维金字塔颜色系统可视化、时间线图→柱状图、折线图、序列图、饼图
  • 1800-1900:数据图形 流图、天气可视化、堆叠饼图(玫瑰图)
  • 1900-1949:现代启蒙 太阳黑子、地铁图
  • 1950-1974:多维信息可视化编码 Jacques Bertin《图形符号学》、计算机
  • 1975-1987:多维统计图形
  • 1987-2004:交互可视化
  • 2004-至今:可视分析学

1.3 数据可视化详解

1.3.1 数据科学的发展

信息管理、信息系统和知识管理学科基本层次模型“数据、信息、知识、智慧”(DIKW模型),它以数据为基础架构,按照信息流顺序依次完成从数据到智慧的转换,四者之间的结构和功能方面的关系构成了信息科学的基础理论,在数据科学中,这种模型也作为一种数据处理流程,完成从原始数据的转化(P23)

数据:数据是对目标观察和记录的结果,是关于时间、地点、事件、其他对象或概念的描述。在表达为有用的形式之前,数据本身没有用途。(P24)

信息:信息是被赋予了意义和目标的数据。(P24)

信息的两类特性:结构性与功能性、象征性或主体性。信息是组织好的结构化数据。信息是通用的以符号和信号形式存在的数据。(P25)

知识:知识是被处理、组织过、应用或付诸行动的信息,又是框架化的经验、价值、情景信息、专家观察和基本直觉的流动的混合。(P25)

智慧:知道为什么,知道如何去做。(P25)

1.3.2 数据可视化的意义

数据可视化借助于人眼快速的视觉感知和人脑的智能认知能力,可以起到清晰有效地传达、沟通并辅助数据分析的作用。(P25)

数据可视化的真善美。真:是否正确的反映了数据的本质。善:可视化所表达的意象对社会和生活具有什么意义和影响(帮助公众理解人类社会发展和自然环境现状,实现政府与职能部门的透明??)。美:可视化的艺术完美型,形式与内容是否和谐统一,是否有艺术个性,是否有创新发展。(P26-P28)

1.3.3 数据可视化的分类

科学可视化信息可视化可视分析学 (P29)

科学可视化数据类别:标量(密度、温度等)、向量(风向、力场等)、张量(压力、弥散等)三类。(P29)

科学可视化分类:标量场可视化、向量场可视化、张量场可视化

标量场可视化

标量是指在每个记录的数据点上有一个单一的值。(P30)

标量场可视化标准做法:1、数值直接映射为颜色或透明度;2、根据需要抽取等值线或面;3、将数据场视为能产生、传输、吸收光的媒介,直接体绘制。(P30)

向量场可视化

向量场在每一个采样点处是一个向量(一维数组),向量代表某种方向或趋势。(P30)

向量场可视化标准做法:1、粒子对流法(模拟流动);2、纹理图像法;3、图标法(P30)

张量场可视化

张量是矢量的推广。张量场可视化方法:基于纹理、几何和拓扑。(P30)将张量场转为向量场(P30)

科学可视化相关研究主题(IEEE Conference on Scientific Visualization 2012)(P31-P33)

信息可视化

信息可视化处理的对象是抽象的、非结构化数据集合(文本、图标、层次结构、地图、软件、复杂系统等)(P34)

时空数据可视化、层次与网络结构数据可视化、文本和跨媒体数据可视化、多变量数据可视化 (P34)

信息可视化相关研究主题(IEEE conference on Information Visualization 2012)(P34-P36)

可视分析学

以可视交互界面为基础的分析推理科学,它综合了图形学、数据挖掘和人机交互等技术,以可视交互界面为通道,将人的感知和认知能力以可视的方式融入数据处理过程,形成人脑智能和机器智能优势互补和相互提升,减少螺旋式信息交流与知识提炼路径,完成有效的分析推理和决策。(P36)

可视分析学相关研究主题(IEEE Conference on Visual Analytics Science and Technology)(P37)

1.3.4 数据可视化与其他学科的关系

数据可视化与信息图、信息可视化、科学可视化及统计图形密切相关,也是数据科学中必不可少的环节。(P38)

图形学、人机交互(P38)

数据库与数据仓库(P39)

数据分析和数据挖掘(P40)

面向领域的可视化方法和技术(P41)

信息视觉设计(P42)

1.4 数据可视化研究挑战

计算能力的可扩展性、感知和认知能力的局限性、显示能力的局限性(P43)

“读书笔记——《数据可视化》01”上的一条回复

评论已关闭。