JiaHe's Blog

读万卷书,行万里路

简介

为什么要学习数据结构和算法,这里我举个简单的例子。

编程好比是一辆汽车,而数据结构和算法是汽车内部的变速箱。一个开车的人不懂变速箱的原理也是能开车的,同理一个不懂数据结构和算法的人也能编程。但是如果一个开车的人懂变速箱的原理,比如降低速度来获得更大的牵引力,或者通过降低牵引力来获得更快的行驶速度。那么爬坡时使用 1 档,便可以获得更大的牵引力;下坡时便使用低档限制车的行驶速度。

回到编程而言,比如将一个班级的学生名字要临时存储在内存中,你会选择什么数据结构来存储,数组还是 ArrayList,或者 HashSet,或者别的数据结构。如果不懂数据结构的,可能随便选择一个容器来存储,也能完成所有的功能,但是后期如果随着学生数据量的增多,随便选择的数据结构肯定会存在性能问题,而一个懂数据结构和算法的人,在实际编程中会选择适当的数据结构来解决相应的问题,会极大的提高程序的性能。

1、数据结构

数据结构是计算机存储、组织数据的方式,指相互之间存在一种或多种特定关系的数据元素的集合。

通常情况下,精心选择的数据结构可以带来更高的运行或者存储效率。数据结构往往同高效的检索算法和索引技术有关。

一、数据结构的基本功能

①、如何插入一条新的数据项

②、如何寻找某一特定的数据项

③、如何删除某一特定的数据项

④、如何迭代的访问各个数据项,以便进行显示或其他操作

二、常用的数据结构

  这几种结构优缺点如下:先有个大概印象,后面会详细讲解!!!

PS:我看下面的评论,对于下面所说的数组,插入块,查找、删除慢的特点有疑问。

这里可能是我没有描述清楚,对于数组,你们所说的查找快,我想只是随机查找快,因为知道数组下标,可以按索引获取任意值。但是你要查找某个特定值,对于无序数组,还是需要遍历整个数组,那么查找效率是 O(n),效率是很低的(有序数组按照二分查找算法还是很快的)。

插入快,是在数组尾部进行插入,获取到数组的最后一个索引下标,加 1 进行赋值就可以了。

删除慢,除开尾部删除,在任意中间或者前面删除,后面的元素都要整体进行平移的,所以也是比较慢的。

综上所述:对于数组,随机查找快,数组尾部增删快,其余的操作效率都是很低的。

2、算法

算法简单来说就是解决问题的步骤。

在 Java 中,算法通常都是由类的方法来实现的。前面的数据结构,比如链表为啥插入、删除快,而查找慢,平衡的二叉树插入、删除、查找都快,这都是实现这些数据结构的算法所造成的。后面我们讲的各种排序实现也是算法范畴的重要领域。

一、算法的五个特征

①、有穷性:对于任意一组合法输入值,在执行又穷步骤之后一定能结束,即:算法中的每个步骤都能在有限时间内完成。

②、确定性:在每种情况下所应执行的操作,在算法中都有确切的规定,使算法的执行者或阅读者都能明确其含义及如何执行。并且在任何条件下,算法都只有一条执行路径。

③、可行性:算法中的所有操作都必须足够基本,都可以通过已经实现的基本操作运算有限次实现之。

④、有输入:作为算法加工对象的量值,通常体现在算法当中的一组变量。有些输入量需要在算法执行的过程中输入,而有的算法表面上可以没有输入,实际上已被嵌入算法之中。

⑤、有输出:它是一组与“输入”有确定关系的量值,是算法进行信息加工后得到的结果,这种确定关系即为算法功能。

二、算法的设计原则

①、正确性:首先,算法应当满足以特定的 “规则说明” 方式给出的需求。其次,对算法是否 “正确” 的理解可以有以下四个层次:

  • 一、程序语法错误。

  • 二、程序对于几组输入数据能够得出满足需要的结果。

  • 三、程序对于精心选择的、典型、苛刻切带有刁难性的几组输入数据能够得出满足要求的结果。

  • 四、程序对于一切合法的输入数据都能得到满足要求的结果。

    PS:通常以第三层意义的正确性作为衡量一个算法是否合格的标准。

②、可读性:算法为了人的阅读与交流,其次才是计算机执行。因此算法应该易于人的理解;另一方面,晦涩难懂的程序易于隐藏较多的错误而难以调试。

③、健壮性:当输入的数据非法时,算法应当恰当的做出反应或进行相应处理,而不是产生莫名其妙的输出结果。并且,处理出错的方法不应是中断程序执行,而是应当返回一个表示错误或错误性质的值,以便在更高的抽象层次上进行处理。

④、高效率与低存储量需求:通常算法效率值得是算法执行时间;存储量是指算法执行过程中所需要的最大存储空间,两者都与问题的规模有关。

前面三点 正确性,可读性和健壮性相信都好理解。对于第四点算法的执行效率和存储量,我们知道比较算法的时候,可能会说 “A 算法比 B 算法快两倍” 之类的话,但实际上这种说法没有任何意义。因为当数据项个数发生变化时,A 算法和 B 算法的效率比例也会发生变化,比如数据项增加了 50%,可能 A 算法比 B 算法快三倍,但是如果数据项减少了 50%,可能 A 算法和 B 算法速度一样。所以描述算法的速度必须要和数据项的个数联系起来。也就是 “大 O” 表示法,它是一种算法复杂度的相对表示方式,这里我简单介绍一下,后面会根据具体的算法来描述。

相对 (relative):你只能比较相同的事物。你不能把一个做算数乘法的算法和排序整数列表的算法进行比较。但是,比较 2 个算法所做的算术操作(一个做乘法,一个做加法)将会告诉你一些有意义的东西;

表示 (representation):大 O(用它最简单的形式) 把算法间的比较简化为了一个单一变量。这个变量的选择基于观察或假设。例如,排序算法之间的对比通常是基于比较操作(比较 2 个结点来决定这 2 个结点的相对顺序)。这里面就假设了比较操作的计算开销很大。但是,如果比较操作的计算开销不大,而交换操作的计算开销很大,又会怎么样呢?这就改变了先前的比较方式;

复杂度 (complexity):如果排序 10,000 个元素花费了我 1 秒,那么排序 1 百万个元素会花多少时间?在这个例子里,复杂度就是相对其他东西的度量结果。

然后我们在说说算法的存储量,包括:

  • 程序本身所占空间;
  • 输入数据所占空间;
  • 辅助变量所占空间;

一个算法的效率越高越好,而存储量是越低越好。

3、总结

本篇文章我们简单的介绍了数据结构和算法的概念,算法是解决问题的步骤,而数据结构的实现离不开算法,可能理解起来比较模糊,不用担心,后面我们会在具体的数据结构和算法实现过程中详细讲解。

参考书籍:《Java 数据结构和算法》链接:https://pan.baidu.com/s/1S0aQrad57_vU6nXsq3Jr-Q 密码: irh4