古风名字,diy小屋,依巴斯汀片-婆媳关系处理网,我国最复杂的关系,分析及案例分享

admin 2019-10-27 阅读:121

作者 | 向倩文

来历 | 数据产品手记

大多数人对数据可视化的第一印象,或许便是各种图形,比方Excel图表模块中的柱状图、条形图、折线图、饼图、散点图等等,就不一一列举了。以上所述,仅仅数据可视化的详细表现,可是数据可视化却不止于此。

数据可视化不是简略的视觉映射,而是一个以数据流向为主线的一个完好流程,首要包含数据搜集、数据处理和改换、可视化映射、用户交互和用户感知。一个完好的可视化进程,能够当作数据流经过一系列处理模块并得到转化的进程,用户经过可视化交互从可视化映射后的成果中获取常识和创意。

图1 可视化的根本流程图

可视化主流程的各模块之间,并不只仅是单纯的线性衔接,而是恣意两个模块之间都存在联络。例如,数据搜集、数据处理和改换、可视化编码和人机交互办法的不同,都会发生新的可视化成果,用户经过对新的可视化成果的感知,然后又会有新的常识和创意的发生。

下面,对数据可视化主流程中的几个关键步骤进行阐明。

01

数据搜集

数据搜集是数据剖析和可视化的第一步,俗话说“巧妇难为无米之炊”,数据搜集的办法和质量,很大程度上就决议了数据可视化的终究作用。

数据搜集的分类办法有许多,从数据的来历来看,能够分为内部数据搜集和外部数据搜集。

1.内部数据搜集:

指的是搜集企业内部经营活动的数据,一般数据来历于事务数据库,如订单的买卖状况。假如要剖析用户的行为数据、APP的使用状况,还需求一部分行为日志数据,这个时分就需求用「埋点」这种办法来进行APP或Web的数据搜集。

2.外部数据搜集:

指的数经过一些办法获取企业外部的一些数据,详细意图包含,获取竞品的数据、获取官方安排官网发布的一些职业数据等。获取外部数据,一般选用的数据搜集办法为「网络爬虫」。

以上的两类数据搜集办法得来的数据,都是二手数据。经过调查和试验搜集数据,归于一手数据,在市场调研和科学研究试验中比较常用,不在此次讨论规模之内。

02

数据处理和改换

数据处理和数据改换,是进行数据可视化的前提条件,包含数据预处理和数据发掘两个进程。

一方面,经过前期的数据搜集得到的数据,不行避免的含有噪声和差错,数据质量较低;另一方面,数据的特征、形式往往躲藏在海量的数据中,需求进一步的数据发掘才干提取出来。

常见的数据质量问题包含:

1.数据搜集过错,遗失了数据方针,或许包含了本不该包含的其他数据方针。

2.数据中的离群点,即不同于数据会集其他大部分数据方针特征的数据方针。

3.存在遗失值,数据方针的一个或多个特点值缺失,导致数据搜集不全。

4.数据不一致,搜集到的数据显着不合常理,或许多个特点值之间互相矛盾。例如,体重是负数,或许所填的邮政编码和城市之间并没有对应联系。

5.重复值的存在,数据会集包含彻底重复或简直重复的数据。

正是由于有以上问题的存在,直接拿搜集的数据进行剖析or可视化,得出的定论往往会误导用户做出过错的决议计划。因而,对搜集到的原始数据进行数据清洗和规范化,是数据可视化流程中不行短少的一环。

数据可视化的显现空间一般是二维的,比方电脑屏幕、大屏显现器等,3D图形制作技能处理了在二维平面显现三维物体的问题。

可是在大数据年代,咱们所搜集到的数据一般具有4V特性:Volume(很多)、Variety(多样)、Velocity(高速)、Value(价值)。怎么从高维、海量、多样化的数据中,发掘有价值的信息来支撑决议计划,除了需求对数据进行清洗、去除噪声之外,还需求依据事务意图对数据进行二次处理。

常用的数据处理办法包含:降维、数据聚类和切分、抽样等统计学和机器学习中的办法。

03

可视化映射

对数据进行清洗、去噪,并依照事务意图进行数据处理之后,接下来就到了可视化映射环节。可视化映射是整个数据可视化流程的中心,是指将处理后的数据信息映射成可视化元素的进程。

可视化元素由3部分组成:可视化空间+符号+视觉通道

1.可视化空间

数据可视化的显现空间,一般是二维。三维物体的可视化,经过图形制作技能,处理了在二维平面显现的问题,如3D环形图、3D地图等。

图2 可视化空间示例

2.符号

符号,是数据特点到可视化几何图形元素的映射,用来代表数据特点的归类。

依据空间自由度的不同,符号能够分为点、线、面、体,别离具有零自由度、一维、二维、三维自由度。如咱们常见的散点图、折线图、矩形树图、三维柱状图,别离选用了点、线、面、体这四种不同类型的符号。

图3 符号类型示例

3.视觉通道

数据特点的值到符号的视觉呈现参数的映射,叫做视觉通道,一般用于展现数据特点的定量信息。

常用的视觉通道包含:符号的方位、巨细(长度、面积、体积...)、形状(三角形、圆、立方体...)、方向、色彩(色彩、饱和度、亮度、透明度...)等。

图3中的四个图形示例,就很好的利用了方位、巨细、色彩等视觉通道来进行数据信息的可视化呈现。

「符号」、「视觉通道」是可视化编码元素的两个方面,两者的结合,能够完好的将数据信息进行可视化表达,然后完结可视化映射这一进程。

关于可视化编码元素的优先级,以及怎么依据数据的特征挑选适宜的可视化表达,下次会专题来共享下。

04

人机交互

可视化的意图,是为了反映数据的数值、特征和形式,以愈加直观、易于了解的办法,将数据背面的信息呈现给方针用户,辅佐其作出正确的决议计划。

可是一般,咱们面临的数据是杂乱的,数据所包含的信息是丰厚的。

假如在可视化图形中,将一切的信息不经过安排和挑选,悉数机械的摆放出来,不只会让整个页面显得特别臃肿和紊乱,缺少美感;并且含糊了要点,涣散用户的注意力,下降用户单位时刻获取信息的才能。

常见的交互办法包含:

1.翻滚和缩放:当数据在当时分辨率的设备上无法完好展现时,翻滚和缩放是一种十分有用的交互办法,比方地图、折线图的信息细节等。可是,翻滚与缩放的详细作用,除了与页面布局有联系外,还与详细的显现设备有关。

2.色彩映射的操控:一些可视化的开源东西,会供给调色板,如D3。用户能够依据自己的喜爱,去进行可视化图形色彩的装备。这个在自助剖析等渠道型东西中,会相对多一点,可是对一些自研的可视化产品中,一般有专业的设计师来担任这项作业,然后使可视化的视觉传达具有美感。

3.数据映射办法的操控:这个是指用户对数据可视化映射元素的挑选,一般一个数据集,是具有多组特征的,供给灵敏的数据映射办法给用户,能够便利用户依照自己感兴趣的维度去探究数据背面的信息。这个在常用的可视化剖析东西中都有供给,如tableau、PowerBI等。

4.数据细节层次操控:比方躲藏数据细节,hover或点击才呈现。

05

用户感知

可视化的成果,只要被用户感知之后,才干够转化为常识和创意。

用户在感知进程,除了被迫承受可视化的图形之外,还经过与可视化各模块之间的交互,自动获取信息。

怎么让用户更好的感知可视化的成果,将成果转化为有价值的信息用来辅导决议计划,这个里边涉及到的影响要素太多了,心理学、统计学、人机交互等多个学科的常识。

学习之路漫漫,一直在路上, 咱们会继续共享数据可视化范畴的常识,记住继续follow咱们哟!

查找微信小程序【CDA训练】,解锁更多精彩资讯和专业内容!