分类
未分类

读书笔记——《数据可视化》01

第1章 数据可视化简介

1.1 可视化释义

人眼:“人眼是一个高带宽的巨量视觉信号输入并行处理器,最高带宽为100MB/s,具有很强的模式识别能力,对可视符号的感知速度比数字或文本快多个数量级,大量视觉信息的处理发生在潜意识阶段。”(P2)

可视化:Visualize和Visualization。Visualize “生成符合人类感知”的图像。Visualization,“使某事、某物可见的动作或事实”;对某个原本不可见的事物在人脑中形成一幅可感知的心理图片的过程或能力。利用人眼的感知能力对数据进行交互的可视表达及增强认知的技术,称为可视化。它将不可见或难以直接显示的数据转化为可感知的图形、符号、颜色、纹理等,增强数据识别效率,传递有效信息。(P2)

可视化是认知的过程,即形成某个物体的感知图像,强化认知理解。可视化的终极目的是对事物规律的洞悉,而非所绘制的可视化结果本身。(P3)

可视化的三个功能:信息记录、支持对信息的推理和分析、信息传播和协同(P4-P6)

可视化能显著提高分析信息的效率,其重要原因是扩充了人脑的记忆,帮助人脑形象地理解和分析所面临的任务。(P5)

1.2 可视化简史(P8-P22)

  • 17世纪前:图表萌芽 地图、城市交通图
  • 1600-1699:物理测量 太阳黑子(邮票图表法)风场分布(向量可视化)
  • 1700-1799:图形符号 地球等磁线可视化、三维金字塔颜色系统可视化、时间线图→柱状图、折线图、序列图、饼图
  • 1800-1900:数据图形 流图、天气可视化、堆叠饼图(玫瑰图)
  • 1900-1949:现代启蒙 太阳黑子、地铁图
  • 1950-1974:多维信息可视化编码 Jacques Bertin《图形符号学》、计算机
  • 1975-1987:多维统计图形
  • 1987-2004:交互可视化
  • 2004-至今:可视分析学

1.3 数据可视化详解

1.3.1 数据科学的发展

信息管理、信息系统和知识管理学科基本层次模型“数据、信息、知识、智慧”(DIKW模型),它以数据为基础架构,按照信息流顺序依次完成从数据到智慧的转换,四者之间的结构和功能方面的关系构成了信息科学的基础理论,在数据科学中,这种模型也作为一种数据处理流程,完成从原始数据的转化(P23)

数据:数据是对目标观察和记录的结果,是关于时间、地点、事件、其他对象或概念的描述。在表达为有用的形式之前,数据本身没有用途。(P24)

信息:信息是被赋予了意义和目标的数据。(P24)

信息的两类特性:结构性与功能性、象征性或主体性。信息是组织好的结构化数据。信息是通用的以符号和信号形式存在的数据。(P25)

知识:知识是被处理、组织过、应用或付诸行动的信息,又是框架化的经验、价值、情景信息、专家观察和基本直觉的流动的混合。(P25)

智慧:知道为什么,知道如何去做。(P25)

1.3.2 数据可视化的意义

数据可视化借助于人眼快速的视觉感知和人脑的智能认知能力,可以起到清晰有效地传达、沟通并辅助数据分析的作用。(P25)

数据可视化的真善美。真:是否正确的反映了数据的本质。善:可视化所表达的意象对社会和生活具有什么意义和影响(帮助公众理解人类社会发展和自然环境现状,实现政府与职能部门的透明??)。美:可视化的艺术完美型,形式与内容是否和谐统一,是否有艺术个性,是否有创新发展。(P26-P28)

1.3.3 数据可视化的分类

科学可视化信息可视化可视分析学 (P29)

科学可视化数据类别:标量(密度、温度等)、向量(风向、力场等)、张量(压力、弥散等)三类。(P29)

科学可视化分类:标量场可视化、向量场可视化、张量场可视化

标量场可视化

标量是指在每个记录的数据点上有一个单一的值。(P30)

标量场可视化标准做法:1、数值直接映射为颜色或透明度;2、根据需要抽取等值线或面;3、将数据场视为能产生、传输、吸收光的媒介,直接体绘制。(P30)

向量场可视化

向量场在每一个采样点处是一个向量(一维数组),向量代表某种方向或趋势。(P30)

向量场可视化标准做法:1、粒子对流法(模拟流动);2、纹理图像法;3、图标法(P30)

张量场可视化

张量是矢量的推广。张量场可视化方法:基于纹理、几何和拓扑。(P30)将张量场转为向量场(P30)

科学可视化相关研究主题(IEEE Conference on Scientific Visualization 2012)(P31-P33)

信息可视化

信息可视化处理的对象是抽象的、非结构化数据集合(文本、图标、层次结构、地图、软件、复杂系统等)(P34)

时空数据可视化、层次与网络结构数据可视化、文本和跨媒体数据可视化、多变量数据可视化 (P34)

信息可视化相关研究主题(IEEE conference on Information Visualization 2012)(P34-P36)

可视分析学

以可视交互界面为基础的分析推理科学,它综合了图形学、数据挖掘和人机交互等技术,以可视交互界面为通道,将人的感知和认知能力以可视的方式融入数据处理过程,形成人脑智能和机器智能优势互补和相互提升,减少螺旋式信息交流与知识提炼路径,完成有效的分析推理和决策。(P36)

可视分析学相关研究主题(IEEE Conference on Visual Analytics Science and Technology)(P37)

1.3.4 数据可视化与其他学科的关系

数据可视化与信息图、信息可视化、科学可视化及统计图形密切相关,也是数据科学中必不可少的环节。(P38)

图形学、人机交互(P38)

数据库与数据仓库(P39)

数据分析和数据挖掘(P40)

面向领域的可视化方法和技术(P41)

信息视觉设计(P42)

1.4 数据可视化研究挑战

计算能力的可扩展性、感知和认知能力的局限性、显示能力的局限性(P43)

分类
未分类

【推介】——excel技术交流群

群号:1039265912
点击链接加入群聊【Excel技术交流群】:https://jq.qq.com/?_wv=1027&k=54heh7g

2020年初,无情的2019-nCoV冠状病毒裹挟着恐慌、焦虑,趁着春运,在中华大地肆虐。家在河南的阁主,也因为疫情防控的原因,蛰居在家。每日在节节攀升的确诊人数、余音绕梁的防疫广播、唇枪舌剑的微博喧嚣中度过。

鉴于疫情防控的严峻形势,阁主供职的公司从公司实际、地方政府要求和员工实际情况出发,要求阁主居家办公,暂不返岗。

暂时不能够回到工作岗位,那么总要做点什么,正巧赶上阁主长期活跃的两个Excel技术交流群管理方因为某些原因,禁止了群友的自由交流,于是,阁主就建立了上面这个excel技术交流群。

这个群,为的是技术交流。这个群,不卖书,不卖课程。希望的,只是群友之间,互帮互助,共同提高。

我们要对知识报以尊重

小到我们个人,大到我们国家,乃至世界,只有对知识体现出足够的尊重,养成为知识付费的习惯,才能更好的往前发展。

我们要对自己报以尊重

这个群,鼓励技术交流,自主学习,崇尚开放的技术交流,崇尚分享自己的心得体会。

这个群,不鼓励那些遇到问题,不去搜索,不去探索,不去尝试,只伸手索取的行为。

对自己尊重,就是要相信自己,能学会,能学好,对自己有信心。遇到问题,我们首先要分析问题,知道问题的核心是什么,如何分解问题,如何查找解决方案,如何评价解决方案,如何对解决方案进行验证。

我们要对他人报以尊重

人生在世,每个人都是一个独立的个体。我们要尊重他人的劳动,尊重他人的习惯。如果,你遇到一个问题,不去思考,不去探索,不去尝试,而是无脑的向他人寻求帮助,这就是不尊重他人的劳动,也不珍惜他人的时间。

建群的目的,是为了交流,当然,群里并不仅限于Excel,Office系列其他软件,计算机基础知识,机械基础知识以及职场文化交流等等也都可以放开讨论。

最后,如果您有兴趣,可以点击顶部链接,加入阁主的Excel技术交流群,让我们共同进步,共同提升。欢迎您的加入。

分类
未分类

Excel应用——2019年河北省理科一本志愿填报参考

1、本文件数据全部来自于官方公开渠道

2、本文件汇集了从2012年开始,到2018年间河北省理科计分人数统计数据,并计算出排位占比。

3、本文件汇集了从2012年开始,到2018年间河北省理科一本投档线统计数据(分院校),并计算出该投档线排位占比。

4、本文件制作了2012-2018年全部一本院校排位占比图,并按照加权平均排位占比,对院校按顺序排列,方便选取心仪的学校。

5、本文件《2012-2018年全部一本院校排位占比图》中,波动程度指各院校最低投档线排位占比波动程度,数据越小,波动程度越低。闯一闯的可能性也越低。

6、本文件《2012-2018年全部一本院校排位占比图》中,相对波动程度指各院校排位占比波动程度相对最大波动程度院校的比值。

7、数据是冰冷的,无情,但是揭示了一般规律。

8、本文件所有内容均为基于过往数据进行计算,不对任何趋势做任何预测。

9、希望每个河北考生都能够进入自己心仪的学校。但本人无法对结果做任何预测和保证。

使用方法:

1、根据提示,启用webservice函数(重要,启用以使用自动查询排位占比功能)

2、输入您的高考分数

3、获取得分排位占比(若webservice函数不能使用,请复制黄色区域中网址到浏览器访问,并将返回数据填入黄色区域;填入数据后,自动获取排位占比功能将失效)

4、根据得分排位占比,在《2018全部一本院校占比图》中选择合适的学校(右上侧灰色区域有超链接,可以快速直达相应的占比位置)

5、根据阅卷情况,占比查找功能约在6月24日前后开放,在此之前,为2018年占比数据,仅供参考。

技术支持:淬剑阁

2019年河北省理工一本志愿填报参考

分类
未分类

三年

今天是腊月二十五。奶奶离开整整三年。