导读

可视化百人谈丨Peter Eades:人工智能并不能取代可视分析_数据_可视 AI快讯

近年,大数据人工智能的发展风起云涌,可视化作为连接人与数据的桥梁,迎来了又一波荣景。
关于可视化,它在国内外的起源有何不同?国内外在可视化研究上的思路与运用又有何不同?未来,可视化与可是剖析是否会因人工智能发展逐渐完备而逐渐消逝?就此,中国图象图形学学会可视化与可视剖析专委会与九州连线联合推出“可视化百人谈”,对可视化领域的内容及成果进行专访,以下为九州连线采访天下有名可视化专家、悉尼大学信息技能学院Peter Eades教授的采访实录(文末附最新不雅观点):

Peter Eades:悉尼大学信息技能学院荣休教授,于1978年澳大利亚国立大学得到博士学位,以研究图绘制而有名。

数据运用催生可视化

九州连线:您当初为什么进入可视化领域?

Peter Eades :我最开始打仗可视化是由于有家当需求。
当时澳大利亚的两个大公司,个中一个是矿业公司,他们想让我绘制从上到下的公司组织架构图。
另一个公司是澳大利亚的TELSTRA公司(澳大利亚电信)。
他们想在一张大纸上画一个图,显示通讯过程。
希望在这个图里显示出能帮助他们找出规律的信息,帮助下一步决策,启示商业思考。

不过,当时我们打仗的可视化更多地是二维的图。
现在的学生,他们在做可视化时有非常大的数据,乃至高维数据,在颜色哀求、大小比例上更繁芜一些。

九州连线:像您之前做可视化是先从运用动手,而现在的学生只能从数据入手。
这对现在的学生而言,做可视化彷佛变得更困难了。

Peter Eades :虽然现在的数据量看起来很多,但是那时候并没有能用的工具,可能都是用手画的,统统须要从头开始。
而现在的学生可以用很多的工具帮助他们一起完成,做可视化也并没用那么难。

九州连线:您在做可视化过程中有哪些特殊故意思的事?

Peter Eades :故意思的是我认为可以把可视化当做玩具来做,它可以显示在不同的形式上。
当时我做的可视化不是显示在手机屏幕上,而是鞋子或者沙发上,这时候会以为非常有趣。

九州连线:您目前更多地在做图可视化,这不免涉及到可视化事情的评价。
如何评价一个可视化事情的好坏?它的评价标准是若何的?

Peter Eades :首先从科学的推理角度对可视化进行评价,要考虑可视化对付数据是否真实对应。
其次,评价是一个相比拟较难的问题,比如在图的绘制里,可以用边交叉的办法进行,对付大的图而言,大家并没有一些公用的标准。
以是如何科学地评价标准,是须要我们持续做的事。

国外数据剖析以理论驱动为主

九州连线:国内外在做可视化上是否存在一些步骤、程序或者思维上的差异?

Peter Eades :国内外的差异在于数据驱动和理论驱动。
国际上理论驱动的多,而中国数据驱动的多一点,当然这也不是坏事。
数据驱动的可以吸引更多工业界的投入,引发人们在运用上的思考。
我看到中国的可视化事情不仅有很多高质量事情,也有很多亮点。

九州连线:您认为中国是否须要将可视化当做一个单独的学科?

Peter Eades :可视化里边包括很多其他的学科,比如数学、算法、打算机图形、艺术等,我个人认为视情形剖析。
在中国有不少研究组,这些成员来自不同领域,他们在一起事情,比如教授可以号召很多学生一起做研究;但是国外不是这样的,国外很难培植一个跨学科培植的小组。
因此,这时候有一个单独的学科更随意马虎进行下一步的研究。

九州连线:谈到可视剖析,它和常日的大数据剖析有哪些异同?

Peter Eades :人的成分在可视剖析里起到的浸染更大,但是在其他的大数据剖析里,人的成分很少,由于大数据剖析更多的用来统计数据。

人工智能并不能取代可视剖析

九州连线:国外企业界对付可视化的接管程度如何?

Peter Eades :可视化有两种:一种是展现,帮助人们理解东西,从而作为互换的工具;另一种是用可视化探索、创造未知的规律。
澳大利亚和西方的企业界很喜好可视化,尤其是在第二种上表现出极大的兴趣。
他们认为从可视化中可以得到很多的东西,但是研究中实际输出的可视化产品还没有完备达到他们的期望,还有很多事情要做。

九州连线:未来随着人工智能或者大数据的逐渐完备,可视化是否还有存在的必要?

Peter Eades :一方面,人工智能和数据剖析已经存在很多年了,但是他们实际上产生的代价总是达不到我们期望的效果。
想要让人工智能或者大数据完备替代可视剖析,还须要很永劫光。

另一方面,如果用人工智能只是想要得到一个结果,那很有可能替代可视剖析。
但是在大多数情形下,人们想要知道更多的结果,以及是什么缘故原由导致了这样的结果,或者他们背后的一些东西,可视剖析在这时候会有很大用途。

Peter Eades:关于《如何衡量可视化的好坏》的几点意见

在第五届中国可视化与可视剖析大会(ChinaVis 2018)上,Peter Eades在“面向新时期的可视剖析”专题报告中,作了题为《How do you know whether your visualization is correct?》的报告。

图为Peter Eades作大会报告

他提到,以点边图为例,当数据规模小的时候,从可视化布局结果可以得到原始数据的所有信息。
而当数据规模变大时,布局每每会有视觉稠浊,导致原始数据信息的丢失,因而可视化结果的可信度(faithfulness)低落。

如果一个可视化结果和原始数据是逐一映射的关系,或者说可以从可视化结果中完备恢复原有的布局信息,那么这个可视化是可信的。
在实际中,为了提高可视化结果的可读性,每每会采取采样、聚合等操作,导致结果的可信度降落。

接下来,Peter Eades教授还先容了针对大图布局的Shape-based评价指标。
该方法在得到图的布局结果后,从中提取节点的位置凑集,打算临近图(Proximity graph)。
临近图可以利用K隔壁、平面三角化等方法。
末了比较临近图与原始图拓扑的差异性来反应图布局的质量。

随后Eades教授还在Panel中提到,在当前的可视化研究中,技能的好坏常日通过案例来衡量,这是不充分的。
数据通过可视化函数(visualization function)转换为图片,图片又经由感知函数(perception function)被人类所理解。
在这一过程中,可视化函数是否对数据进行了准确无误的转换,人类是否准确理解了图片中的信息?

生理学理论和试验可以用来验证人类对图片的理解质量,而对付数据到图片的转换质量,如之前所述,是通过不充分的案例研究来完成的。
可视化函数的质量须要通过数学理论和推理来担保。
对付某项任务,我们从数据中获取的结论该当和从图片中获取的同等。

紧接着,Eades教授又对可视化要办理的问题做了归纳。
他认为,如果一项任务不是NP问题或者反NP问题,利用可视化来传达真实性(communicating truth)或者虚伪性(communicating falsity)是不可行的;如果一项任务是NP问题,那么利用可视化来传达真实性是可行的;如果一项任务是NP完备问题,那么可以利用可视化来传达真实性,但是从数据的可视化表达中确定原形(determining truth)是不可行的;如果一项任务是P问题,那么利用可视化来传达真实性,以及从可视化中确定原形均是可行的。

之后,Eades教授提出一个疑问,可视化中存在“完备”(completeness)的观点吗?如果存在,对付一个没有办理的任务,如果我们可以找到它的可视化解,那么一大类问题都会存在可视化解。
末了,Eades教授指出,数学推理或许不是可视化的良方,但它会对可视化的发展大有帮助。

声明:

黄河连线系太原九州连线文化传媒有限公司旗下品牌

本平台法律顾问为山西晋商状师事务所

九州连线原创文章,转载请注明出处