什么是⾼维数据_⾼维数据如何定义
什么是⾼维数据_⾼维数据如何定义
⾼维数据的概念其实不难,简单的说就是多维数据的意思。平时我们经常接触的是⼀维数据或者可以写成表形式的⼆维数据,⾼维数据也可以类推,不过维数较⾼的时候,直观表⽰很难。
⽬前⾼维数据挖掘是研究重点,
这是它的特点:⾼维数据挖掘是基于⾼维度的⼀种数据挖掘,它和传统的数据挖掘最主要的区别在于它的⾼维度。⽬前⾼维数据挖掘已成为数据挖掘的重点和难点。随着技术的进步使得数据收集变得越来越容易,导致数据库规模越来越⼤、复杂性越来越⾼,如各种类型的贸易交易数据、Web ⽂档、基因表达数据、⽂档词频数据、⽤户评分数据、WEB使⽤数据及多媒体数据等,它们的维度(属性)通常可以达到成百上千维,甚⾄更⾼。
由于⾼维数据存在的普遍性,使得对⾼维数据挖掘的研究有着⾮常重要的意义。但由于“维灾”的影响,也使得⾼维数据挖掘变得异常地困难,必须采⽤⼀些特殊的⼿段进⾏处理。随着数据维数的升⾼,⾼维索引结构的性能迅速下降,在低维空间中,我们经常采⽤欧式距离作为数据之间的相似性度量,但在⾼维空间中很多情况下这种相似性的概念不复存在,这就给⾼维数据挖掘带来了很严峻的考验,⼀⽅⾯引
起基于索引结构的数据挖掘算法的性能下降,另⼀⽅⾯很多基于全空间距离函数的挖掘⽅法也会失效。解决的⽅法可以有以下⼏种:可以通过降维将数据从⾼维降到低维,然后⽤低维数据的处理办法进⾏处理;对算法效率下降问题可以通过设计更为有效的索引结构、采⽤增量算法及并⾏算法等来提⾼算法的性能;对失效的问题通过重新定义使其获得新⽣。
⾼维数据挖掘是基于⾼维度的⼀种数据挖掘,它和传统的数据挖掘最主要的区别在于它的⾼维度。⽬前⾼维数据挖掘已成为数据挖掘的重点和难点。随着技术的进步使得数据收集变得越来越容易,导致数据库规模越来越⼤、复杂性越来越⾼,如各种类型的贸易交易数据、Web ⽂档、基因表达数据、⽂档词频数据、⽤户评分数据、WEB使⽤数据及多媒体数据等,它们的维度(属性)通常可以达到成百上千维,甚⾄更⾼。
由于⾼维数据存在的普遍性,使得对⾼维数据挖掘的研究有着⾮常重要的意义。但由于“维多媒体是什么意思